Preference-Based Policy Iteration: Leveraging Preference Learning for Reinforcement Learning

www.lmu.de | UB | Blättern | Hilfe

Zur erweiterten Suche

English

Zur erweiterten Suche

Cheng, Weiwei; Fürnkranz, Johannes; Hüllermeier, Eyke ORCID: https://orcid.org/0000-0002-9944-4108 und Park, Sang-Hyeun (2011): Preference-Based Policy Iteration: Leveraging Preference Learning for Reinforcement Learning. In: Gunopulos, Dimitrios; Hofmann, Thomas; Malerba, Donato und Vazirgiannis, Michalis (Hrsg.): Machine Learning and Knowledge Discovery in Databases. European Conference, ECML PKDD 2011, Athens, Greece, September 5-9, 2011. Proceedings, Part I. Lecture Notes in Computer Science, Bd. 6911. Berlin, Heidelberg: Springer. S. 312-327

Volltext auf 'Open Access LMU' nicht verfügbar.

DOI: 10.1007/978-3-642-23780-5_30

Dokumententyp:	Buchbeitrag
Fakultät:	Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen
Themengebiete:	000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik
ISBN:	978-3-642-23779-9 ; 978-3-642-23780-5
Ort:	Berlin, Heidelberg
Sprache:	Englisch
Dokumenten ID:	91767
Datum der Veröffentlichung auf Open Access LMU:	05. Apr. 2022 08:57
Letzte Änderungen:	05. Apr. 2022 08:57

Dokument bearbeiten