Fürnkranz, Johannes; Hüllermeier, Eyke ORCID: https://orcid.org/0000-0002-9944-4108; Cheng, Weiwei und Park, Sang-Hyeun
(2012):
Preference-based reinforcement learning: a formal framework and a policy iteration algorithm.
In: Machine Learning, Bd. 89, Nr. 1-2: S. 123-156
Dokumententyp: | Zeitschriftenartikel |
---|---|
Fakultät: | Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen |
Themengebiete: | 000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik |
ISSN: | 0885-6125 |
Sprache: | Englisch |
Dokumenten ID: | 91494 |
Datum der Veröffentlichung auf Open Access LMU: | 24. Mrz. 2022, 06:35 |
Letzte Änderungen: | 24. Mrz. 2022, 06:35 |