Table of Contents
Stage M1R 2017
Pointeurs
Mémentos
Comptes-rendu de réunion
Stage M1R 2017
Pointeurs
RL
cours M1:
MDP et planif
,
RL
cours David Silver : http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html
livre de Sutton mis à jour: https://webdocs.cs.ualberta.ca/~sutton/book/bookdraft2016sep.pdf
Multi-Agent RL :
en premier, lire le chapitre 4 de https://tel.archives-ouvertes.fr/file/index/docid/362529/filename/these_matignon.pdf
puis lire http://liris.cnrs.fr/laetitia.matignon/index/matignon2012KER.pdf
Travaux de De Hauwere: Learning multi-agent state space representations
http://www.aamas-conference.org/Proceedings/aamas2010/pdf/01%20Full%20Papers/15_02_FP_0421.pdf
https://ai.vub.ac.be/ALA2012/downloads/paper5.pdf
App Constructiviste
Thèse S. Mazac: https://tel.archives-ouvertes.fr/tel-01310583/file/TH2015MazacSebastien.pdf
RL et Inspirations Constructivistes
Intrinsically Motivated RL [Singh2005] https://web.eecs.umich.edu/~baveja/Papers/FinalNIPSIMRL.pdf
Mémentos
App Constructiviste
Etat de l'art (Thèse S. Mazac)
RL et Inspirations Constructivistes
Intrinsically Motivated RL [Singh2005]
Value function approximation
Quelques infos
Temporal Difference - Growing Neural Gas
TD-GNG
Comptes-rendu de réunion
02/03/17