Matteo Pirotta

Citado por

	Todos	Desde 2019
Citações	2270	2074
Índice h	28	27
Índice i10	46	45

540

270

135

405

201420152016201720182019202020212022202320246 18 28 51 82 142 267 454 509 538 162

Acesso público

Ver todos

17 artigos

0 artigo

disponível

não disponível

Com base nas autorizações de financiamento

Coautores

Marcello RestelliAssociate Professor, Politecnico di MilanoE-mail confirmado em polimi.it
Alessandro LazaricResearch Scientist, Facebook Artificial Intelligence ResearchE-mail confirmado em inria.fr
Andrea TirinzoniMetaE-mail confirmado em fb.com
Matteo PapiniPolitecnico di MilanoE-mail confirmado em polimi.it
Ronan FruitPhD candidate, Inria Lille, SequeL teamE-mail confirmado em inria.fr
Emma BrunskillAssociate Professor of Computer Science, Stanford UniversityE-mail confirmado em cs.stanford.edu
Daniele CalandrielloResearch Scientist, DeepMindE-mail confirmado em google.com
Jan PetersProfessor for Intelligent Autonomous Systems/TU Darmstadt, Dept. Head/German AI Research Center DFKIE-mail confirmado em ias.tu-darmstadt.de

Seguir

Matteo Pirotta

Research Scientist, Meta (FAIR)

E-mail confirmado em fb.com - Página inicial

Machine Learning Reinforcement Learning Artificial Intelligence


Título Ordenar por citações Ordenar por ano Ordenar por título	Citado por Citado por	Ano
Stochastic variance-reduced policy gradient M Papini, D Binaghi, G Canonaco, M Pirotta, M Restelli International conference on machine learning, 4026-4035, 2018	178	2018
Exploration-exploitation in constrained mdps Y Efroni, S Mannor, M Pirotta arXiv preprint arXiv:2003.02189, 2020	143	2020
Frequentist regret bounds for randomized least-squares value iteration A Zanette, D Brandfonbrener, E Brunskill, M Pirotta, A Lazaric International Conference on Artificial Intelligence and Statistics, 1954-1964, 2020	135	2020
Safe policy iteration M Pirotta, M Restelli, A Pecorino, D Calandriello International conference on machine learning, 307-315, 2013	121	2013
Efficient bias-span-constrained exploration-exploitation in reinforcement learning R Fruit, M Pirotta, A Lazaric, R Ortner International Conference on Machine Learning, 1578-1586, 2018	107	2018
Policy gradient in lipschitz markov decision processes M Pirotta, M Restelli, L Bascetta Machine Learning 100, 255-283, 2015	99	2015
Adaptive step-size for policy gradient methods M Pirotta, M Restelli, L Bascetta Advances in Neural Information Processing Systems 26, 2013	85	2013
Multi-objective reinforcement learning with continuous pareto frontier approximation M Pirotta, S Parisi, M Restelli Proceedings of the AAAI conference on artificial intelligence 29 (1), 2015	75	2015
Policy gradient approaches for multi-objective sequential decision making S Parisi, M Pirotta, N Smacchia, L Bascetta, M Restelli 2014 International Joint Conference on Neural Networks (IJCNN), 2323-2330, 2014	74	2014
Multi-objective reinforcement learning through continuous pareto manifold approximation S Parisi, M Pirotta, M Restelli Journal of Artificial Intelligence Research 57, 187-227, 2016	60	2016
Inverse reinforcement learning through policy gradient minimization M Pirotta, M Restelli Proceedings of the AAAI Conference on Artificial Intelligence 30 (1), 2016	57	2016
Adversarial attacks on linear contextual bandits E Garcelon, B Roziere, L Meunier, J Tarbouriech, O Teytaud, A Lazaric, ... Advances in Neural Information Processing Systems 33, 14362-14373, 2020	56	2020
Importance weighted transfer of samples in reinforcement learning A Tirinzoni, A Sessa, M Pirotta, M Restelli International Conference on Machine Learning, 4936-4945, 2018	56	2018
Boosted fitted q-iteration S Tosatto, M Pirotta, C d’Eramo, M Restelli International Conference on Machine Learning, 3434-3443, 2017	48	2017
Near optimal exploration-exploitation in non-communicating markov decision processes R Fruit, M Pirotta, A Lazaric Advances in Neural Information Processing Systems 31, 2018	47	2018
Manifold-based multi-objective policy search with sample reuse S Parisi, M Pirotta, J Peters Neurocomputing 263, 3-14, 2017	47	2017
Adaptive batch size for safe policy gradients M Papini, M Pirotta, M Restelli Advances in neural information processing systems 30, 2017	47	2017
Regret bounds for kernel-based reinforcement learning OD Domingues, P Ménard, M Pirotta, E Kaufmann, M Valko arXiv preprint arXiv:2004.05599, 2020	45*	2020
Compatible reward inverse reinforcement learning AM Metelli, M Pirotta, M Restelli Advances in neural information processing systems 30, 2017	42	2017
No-regret exploration in goal-oriented reinforcement learning J Tarbouriech, E Garcelon, M Valko, M Pirotta, A Lazaric International Conference on Machine Learning, 9428-9437, 2020	40	2020

O sistema não pode executar a operação agora. Tente novamente mais tarde.

Artigos 1–20

Citações por ano

Citações duplicadas

Citações mescladas

Adicionar coautoresCoautores

Seguir

Citado por

Coautores