=====Learning multi-agent state space representations===== ==== Quelques informations ==== Markov game -> Système multi-agent avec plusieurs sets d'actions, la proba de transition dépend de s, a et s', récompense unique à chaque agent et une transition. Une variante consiste à donner une récompense commune aux agents. Comment apprendre le bon moment auquel doivent se coordonnés les agents ? Quelques ressources dispo : * Kok & Vlassis, Utile coordination : Learning indepedenies among cooperative agents. * Spaan & Melo IDMG Détails sur l'IDMG : * Interaction Driven Markov Game * Les agents peuvent connaitre la position des autres par la communication ou en les détectant avec les capteurs * Plus de détails sur l'article de Spaan & Melo... Learning Coordination States : * Identification des états dans lequel un agent devrait prendre en compte les autres agents quand il choisi une action et qu'il y a besoin de coordination sur celle-ci avec un autre agent. ==== CQ-Learning ====