DokuWiki

<h2>Réflexion CQLearning et GNG</h2>
<div class="level2">

<p>
Brouillon à développer / revoir / corriger / supprimer.
</p>

</div>

<h4>Présentation des algos</h4>
<div class="level4">

<p>
Pour plus de détails, se réferrer aux mémentos :
</p>
<ul>
<li class="level1"> CQ-Learning : http:<em>www.aamas-conference.org/Proceedings/aamas2010/pdf/01%20Full%20Papers/15_02_FP_0421.pdf
   * GNG : http:</em>liris.cnrs.fr/sasem/doku.php?id=memento-td-gng</li>
</ul>

<p>
CQ-Learning est un algo d'apprentissage multi-agent qui a pour but la coopération entre les agents et la limitation des collisions.
Pour cela l'algo donne un ensemble d'états propre à chaque agents. Ceux-ci les développe et les trie en deux catégories "safe" et "dangerous". Un état "dangerous" est un état partagé avec un autre agent.
</p>

<p>
GNG permet de limiter le nombre d'états dont s'occupe un agent, ce qui induit une convergence plus rapide des Qvaleurs et limite l'usage de la mémoire.
</p>

</div>

<h4>Piste</h4>
<div class="level4">

<p>
CQ-Learning part du principe que les agents ont déjà une politique personnelle optimale.
L'algo limite le nombre d'états des agents dans sa partie "anti-collision", mais comme dit la phrase précédente, nous sommes déjà censé avoir une politique optimale pour chaque agent. C'est à dire qu'individuellement ils remplissent tous très bien les tâches demandées.
</p>

<p>
A priori, l'algo GNG peut donc très bien utilisé en complémentarité de CQ-Learning. Il permettrait de réduire un peu plus l'ensemble d'états pour chaque agents.
</p>

<p>
Bon voila, maintenant que j'ai écrit ces lignes ça me parait assez évident, mais ce n'était pas le cas avant...
</p>

<p>
A continuer
</p>

</div>

Enable Complex Tables Editor Height px Turn supplementary image paste support on

Edit summary: Minor changes

Please fill all the letters into the box to prove you're human. P Y S L M Please keep this field empty:

DokuWiki

Site Tools

Page Tools