This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/01 03:18] 47.128.127.33 old revision restored (2024/05/20 04:45) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/02 20:43] (current) 47.128.118.117 old revision restored (2025/02/23 17:41) |
||
---|---|---|---|
Line 14: | Line 14: | ||
L' | L' | ||
+ | |||
CMU | CMU | ||
{{: | {{: | ||
- | |||
- | TR | ||
- | {{: | ||
- | |||
- | TTG | ||
- | {{: | ||
Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). | Les cases de couleurs sont les objectifs des agents de même couleur (sauf dans le ttg où il les deux agent sont le même objectif). | ||
+ | |||
+ | Seul les résultats pour le CMU seront montrés. | ||
==== Resultats ==== | ==== Resultats ==== | ||
+ | |||
+ | === CMU === | ||
+ | |||
+ | A la 4 000eme itération, la politique devient déterministe, | ||
+ | |||
+ | Moyenne des sommes des récompenses :\\ | ||
+ | |||
+ | Moyenne du nombre de collisions :\\ | ||
+ | |||
+ | Moyenne du nombre d' | ||
+ | |||
+ | Petite optimisation sur les états joints, lorsqu' | ||
+ | |||
+ | Voici les stats obtenues en lançant l' | ||
+ | |||
+ | En moyenne, les agents ont besoin de 13.6 etapes\\ | ||
+ | Avec un ecart-type de | ||
+ | |||
+ | En moyenne, les agents ont 0.0 collisions \\ | ||
+ | Avec un ecart-type de 0.0 | ||
+ | |||
+ | En moyenne, les agents ont 1.7 etats joints \\ | ||
+ | Avec un ecart-type de | ||
+ | |||
+ |