Differences

This shows you the differences between two versions of the page.

--- realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/01 03:21]
47.128.42.225 old revision restored (2024/05/24 04:43)
+++ realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/02 20:43] (current)
47.128.118.117 old revision restored (2025/02/23 17:41)
@@ Line 14: / Line 14: @@
 L'algorithme est testé sur trois environnements différents, un Tunnel to Goal (ttg) un cmu (quoi que cela puisse vouloir dire), et un Two Robots Game (tr).
 CMU
 {{:cmu_exemple.png?500|}}
-TR
-{{:tr_exemple.png?300|}}
-TTG
-{{:ttg_exemple.png?300|}}
 Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif).
+Seul les résultats pour le CMU seront montrés.
 ==== Resultats ====
-Les moyennes sont effectuées sur 125 itérations.
 === CMU ===
+A la 4 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement.
 Moyenne des sommes des récompenses :\\
-{{:cmu_rewards.png?500|}}
 Moyenne du nombre de collisions :\\
-{{:cmu_collisions.png?500|}}
-Nombre d'états joints (contrairement à la légende) :\\
+Moyenne du nombre d'états joints :\\
-{{:cmu_nbjs_opti.png?500|}}
+Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. Ils le sont aussi lorsqu'ils indiquent la même action que l'état individuelle.
+Voici les stats obtenues en lançant l'expérience 5 fois :
+En moyenne, les agents ont besoin de  13.6  etapes\\
+Avec un ecart-type de   6.23217458035
+En moyenne, les agents ont  0.0  collisions \\
+Avec un ecart-type de   0.0
+En moyenne, les agents ont  1.7  etats joints \\
+Avec un ecart-type de   1.41774468788
-Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisé depuis trop longtemps, ceux-ci sont supprimés.
-Environ 45 JS sont crées si on ne les supprime pas. Ceci peut s'expliquer par le caractère aléatoire des actions des agents (epsilon = 0.05) qui provoque des collisions.

DokuWiki

Site Tools

Differences

Page Tools