ORCID: https://orcid.org/0000-0002-9944-4108 und Park, Sang-Hyeun
(2011):
Preference-Based Policy Iteration: Leveraging Preference Learning for Reinforcement Learning.
In: Gunopulos, Dimitrios; Hofmann, Thomas; Malerba, Donato und Vazirgiannis, Michalis (Hrsg.):
Machine Learning and Knowledge Discovery in Databases. European Conference, ECML PKDD 2011, Athens, Greece, September 5-9, 2011. Proceedings, Part I. Lecture Notes in Computer Science, Bd. 6911. Berlin, Heidelberg: Springer. S. 312-327
Dokumententyp: | Buchbeitrag |
---|---|
Fakultät: | Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen |
Themengebiete: | 000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik |
ISBN: | 978-3-642-23779-9 ; 978-3-642-23780-5 |
Ort: | Berlin, Heidelberg |
Sprache: | Englisch |
Dokumenten ID: | 91767 |
Datum der Veröffentlichung auf Open Access LMU: | 05. Apr. 2022, 08:57 |
Letzte Änderungen: | 05. Apr. 2022, 08:57 |