Huang Jiawei

Citado por

	Todos	Desde 2019
Citações	444	444
Índice h	7	7
Índice i10	7	7

160

120

2019202020212022202320247 30 77 120 153 57

Acesso público

Ver todos

4 artigos

0 artigo

disponível

não disponível

Com base nas autorizações de financiamento

Coautores

Nan JiangAssistant Professor of Computer Science, UIUCE-mail confirmado em illinois.edu
Masatoshi UeharaGenentechE-mail confirmado em gene.com
Ningning MaNIOE-mail confirmado em ust.hk
Xiangyu ZhangPrincipal Researcher, MEGVII TechnologyE-mail confirmado em megvii.com
Jian SunChief Scientist of Megvii, Managing Director of Megvii ResearchE-mail confirmado em megvii.com
Chengchun ShiLondon School of Economics and Political ScienceE-mail confirmado em lse.ac.uk
Li ZhaoResearcherE-mail confirmado em microsoft.com
Tao QinSenior Principal Research Manager, Microsoft ResearchE-mail confirmado em microsoft.com
Tie-Yan LiuDistinguished Scientist, Microsoft Research AI4Science | IEEE Fellow | ACM Fellow | AAIA FellowE-mail confirmado em microsoft.com
Jinglin ChenUniversity of Illinois Urbana-ChampaignE-mail confirmado em illinois.edu
Niao HeETH ZürichE-mail confirmado em inf.ethz.ch
Batuhan YardimETH ZurichE-mail confirmado em ethz.ch
Wei Chen （陈卫）Microsoft ResearchE-mail confirmado em microsoft.com

Seguir

Huang Jiawei

ETH Zurich

E-mail confirmado em inf.ethz.ch - Página inicial

Machine Learning Reinforcement Learning


Título Ordenar por citações Ordenar por ano Ordenar por título	Citado por Citado por	Ano
Minimax weight and q-function learning for off-policy evaluation M Uehara, J Huang, N Jiang International Conference on Machine Learning, 9659-9668, 2019	177	2019
Weightnet: Revisiting the design space of weight networks N Ma, X Zhang, J Huang, J Sun European Conference on Computer Vision, 776-792, 2020	97	2020
Minimax value interval for off-policy evaluation and policy optimization N Jiang, J Huang Advances in Neural Information Processing Systems 33, 2747-2758, 2020	75	2020
A minimax learning approach to off-policy evaluation in confounded Partially Observable Markov Decision Processes C Shi, M Uehara, J Huang, N Jiang International Conference on Machine Learning, 2022	31*	2022
From Importance Sampling to Doubly Robust Policy Gradient J Huang, N Jiang International Conference on Machine Learning, 4434-4443, 2019	26	2019
Towards Deployment-Efficient Reinforcement Learning: Lower Bound and Optimality J Huang, J Chen, L Zhao, T Qin, N Jiang, TY Liu International Conference on Learning Representations 2022, 2022	24	2022
On the convergence rate of off-policy policy optimization methods with density-ratio correction J Huang, N Jiang International Conference on Artificial Intelligence and Statistics, 2658-2705, 2022	10*	2022
On the Statistical Efficiency of Mean Field Reinforcement Learning with General Function Approximation J Huang, B Yardim, N He arXiv preprint arXiv:2305.11283, 2023	2	2023
Tiered Reinforcement Learning: Pessimism in the Face of Uncertainty and Constant Regret J Huang, L Zhao, T Qin, W Chen, N Jiang, TY Liu Advances in Neural Information Processing Systems 35, 2022	2	2022
Robust Knowledge Transfer in Tiered Reinforcement Learning J Huang, N He Advances in Neural Information Processing Systems 36, 2024		2024
Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL J Huang, N He, A Krause arXiv preprint arXiv:2402.05724, 2024		2024

O sistema não pode executar a operação agora. Tente novamente mais tarde.

Artigos 1–11

Citações por ano

Citações duplicadas

Citações mescladas

Adicionar coautoresCoautores

Seguir

Citado por

Coautores