Seguir
Stephane Hatgis-Kessell
Stephane Hatgis-Kessell
E-mail confirmado em utexas.edu
Título
Citado por
Citado por
Ano
Models of human preference for learning reward functions
WB Knox, S Hatgis-Kessell, S Booth, S Niekum, P Stone, A Allievi
arXiv preprint arXiv:2206.02231, 2022
202022
Learning optimal advantage from preferences and mistaking it for reward
WB Knox, S Hatgis-Kessell, SO Adalgeirsson, S Booth, A Dragan, P Stone, ...
Proceedings of the AAAI Conference on Artificial Intelligence 38 (9), 10066 …, 2024
22024
O sistema não pode executar a operação agora. Tente novamente mais tarde.
Artigos 1–2