A Survey of Reinforcement Learning from Human Feedback

Kaufmann, Timo ORCID: https://orcid.org/0000-0001-5193-8574; Weng, Paul; Bengs, Viktor ORCID: https://orcid.org/0000-0001-6988-6186 und Hüllermeier, Eyke ORCID: https://orcid.org/0000-0002-9944-4108 (30. April 2024): A Survey of Reinforcement Learning from Human Feedback. [PDF, 1MB]

Vorschau

Creative Commons: Namensnennung 4.0 (CC-BY)

Eingereichte Version

DOI: 10.5282/ubm/epub.125328

Externer Volltext: https://arxiv.org/abs/2312.14925

Dokumententyp:	Andere
Fakultät:	Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen
Themengebiete:	000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
URN:	urn:nbn:de:bvb:19-epub-125328-1
Sprache:	Englisch
Dokumenten ID:	125328
Datum der Veröffentlichung auf Open Access LMU:	09. Apr. 2025 15:53
Letzte Änderungen:	09. Apr. 2025 15:53

Dokument bearbeiten