Robert Kirk

Citeret af

	Alle	Siden 2019
Henvisninger	434	434
h-index	6	6
i10-indeks	6	6

200

100

150

20212022202320248 124 190 109

Medforfattere

Edward GrefenstetteDirector of Research, Google DeepMind | Honorary Professor, UCLVerificeret mail på google.com
Tim RocktäschelProfessor of Artificial Intelligence at UCL, Open-Endedness Team Lead at Google DeepMindVerificeret mail på cs.ucl.ac.uk
Amy ZhangAssistant Professor of Electrical and Computer Engineering at University of Texas at AustinVerificeret mail på austin.utexas.edu
Eric HambroAnthropicVerificeret mail på anthropic.com
David Scott KruegerUniversity Assistant Professor, University of CambridgeVerificeret mail på cam.ac.uk
Minqi JiangResearch Scientist at Google DeepMindVerificeret mail på ucl.ac.uk
Roberta RaileanuResearch Scientist, MetaVerificeret mail på fb.com
Vitaly KurinResearch Scientist at Isomorphic LabsVerificeret mail på isomorphiclabs.com
Mikayel SamvelyanMeta AI & UCLVerificeret mail på meta.com
Fabio PetroniSamaya AIVerificeret mail på samaya.ai
Heinrich KüttlerVerificeret mail på math.lmu.de
Jack Parker-HolderGoogle DeepMind, UCLVerificeret mail på google.com
Ekdeep Singh LubanaUniversity of MichiganVerificeret mail på umich.edu
Usman AnwarUniversity of CambridgeVerificeret mail på cam.ac.uk
Hidenori TanakaGroup Leader, CBS-NTT Program in "Physics of Intelligence" at Harvard UniversityVerificeret mail på fas.harvard.edu
Robert DickUniversity of Michigan, StrydVerificeret mail på rpdmail.dyndns.org
Samyak JainUndergrad at Indian Institute of Technology(BHU),VaranasiVerificeret mail på itbhu.ac.in
Christoforos NalmpantisPostdoctoral Researcher, Fundamental AI Research at MetaVerificeret mail på fb.com
Jelena LuketinaOxford UniversityVerificeret mail på cs.ox.ac.uk
Ishita MedirattaMetaVerificeret mail på meta.com

Følg

Robert Kirk

PhD Student, University College London

Verificeret mail på ucl.ac.uk - Startside

AI Alignment AI Safety Language Models Fine-tuning Generalisation


Titel Sortér efter henvisninger Sortér efter årstal Sortér efter titel	Citeret af Citeret af	År
A survey of zero-shot generalisation in deep reinforcement learning R Kirk, A Zhang, E Grefenstette, T Rocktäschel Journal of Artificial Intelligence Research 76, 201-264, 2023	276*	2023
Minihack the planet: A sandbox for open-ended reinforcement learning research M Samvelyan, R Kirk, V Kurin, J Parker-Holder, M Jiang, E Hambro, ... arXiv preprint arXiv:2109.13202, 2021	70	2021
Understanding the effects of rlhf on llm generalisation and diversity R Kirk, I Mediratta, C Nalmpantis, J Luketina, E Hambro, E Grefenstette, ... arXiv preprint arXiv:2310.06452, 2023	22	2023
Reward model ensembles help mitigate overoptimization T Coste, U Anwar, R Kirk, D Krueger arXiv preprint arXiv:2310.02743, 2023	20	2023
Insights from the neurips 2021 nethack challenge E Hambro, S Mohanty, D Babaev, M Byeon, D Chakraborty, ... NeurIPS 2021 Competitions and Demonstrations Track, 41-52, 2022	17	2022
Mechanistically analyzing the effects of fine-tuning on procedurally defined tasks S Jain, R Kirk, ES Lubana, RP Dick, H Tanaka, E Grefenstette, ... arXiv preprint arXiv:2311.12786, 2023	15	2023
Generalization to new sequential decision making tasks with in-context learning SC Raparthy, E Hambro, R Kirk, M Henaff, R Raileanu arXiv preprint arXiv:2312.03801, 2023	4	2023
Graph backup: Data efficient backup exploiting markovian transitions Z Jiang, T Zhang, R Kirk, T Rocktäschel, E Grefenstette arXiv preprint arXiv:2205.15824, 2022	4*	2022
A study of off-policy learning in environments with procedural content generation A Ehrenberg, R Kirk, M Jiang, E Grefenstette, T Rocktäschel ICLR Workshop on Agent Learning in Open-Endedness, 2022	4	2022
Leading the Pack: N-player Opponent Shaping A Souly, T Willi, A Khan, R Kirk, C Lu, E Grefenstette, T Rocktäschel arXiv preprint arXiv:2312.12564, 2023	1	2023
Domain Generalization for Robust Model-Based Offline Reinforcement Learning A Clark, SA Siddiqui, R Kirk, U Anwar, S Chung, D Krueger arXiv preprint arXiv:2211.14827, 2022	1	2022
What Mechanisms Does Knowledge Distillation Distill? C Wu, ES Lubana, BK Mlodozeniec, R Kirk, D Krueger UniReps: the First Workshop on Unifying Representations in Neural Models, 2023		2023

Systemet kan ikke foretage handlingen nu. Prøv igen senere.

Artikler 1–12

Henvisninger pr. år

Dublerede henvisninger

Flettede henvisninger

Tilføj medforfattereMedforfattere

Følg

Citeret af

Medforfattere