Weng, Paul; Busa-Fekete, Róbert und Hüllermeier, Eyke ORCID: https://orcid.org/0000-0002-9944-4108
(2013):
Interactive Q-Learning with Ordinal Rewards and Unreliable Tutor.
European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECMLPKDD 2013). Reinforcement Learning with Generalized Feedback, Prague, 23rd September 2013.
S. 1-13
Externer Volltext: http://www.ecmlpkdd2013.org/wp-content/uploads/2013/09/PBRL_09-Weng.pdf
Dokumententyp: | Konferenzbeitrag (Paper) |
---|---|
Publikationsform: | Publisher's Version |
Fakultät: | Mathematik, Informatik und Statistik > Informatik > Künstliche Intelligenz und Maschinelles Lernen |
Themengebiete: | 000 Informatik, Informationswissenschaft, allgemeine Werke > 004 Informatik |
Sprache: | Englisch |
Dokumenten ID: | 91815 |
Datum der Veröffentlichung auf Open Access LMU: | 06. Apr. 2022 09:34 |
Letzte Änderungen: | 15. Okt. 2024 07:18 |