Kaufmann, Timo
ORCID: https://orcid.org/0000-0001-5193-8574; Weng, Paul; Bengs, Viktor
ORCID: https://orcid.org/0000-0001-6988-6186 und Hüllermeier, Eyke
ORCID: https://orcid.org/0000-0002-9944-4108
(30. April 2024):
A Survey of Reinforcement Learning from Human Feedback.
[PDF, 1MB]
Vorschau

Externer Volltext: https://arxiv.org/abs/2312.14925
Dokumententyp: | Andere |
---|---|
Fakultät: | Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen |
Themengebiete: | 000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik |
URN: | urn:nbn:de:bvb:19-epub-125328-1 |
Sprache: | Englisch |
Dokumenten ID: | 125328 |
Datum der Veröffentlichung auf Open Access LMU: | 09. Apr. 2025 15:53 |
Letzte Änderungen: | 09. Apr. 2025 15:53 |