This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/01 03:23] 47.128.113.231 old revision restored (2024/05/26 10:15) |
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/02 20:43] (current) 47.128.118.117 old revision restored (2025/02/23 17:41) |
||
---|---|---|---|
Line 26: | Line 26: | ||
=== CMU === | === CMU === | ||
- | A la 3 000eme itération, la politique devient déterministe, | + | A la 4 000eme itération, la politique devient déterministe, |
Moyenne des sommes des récompenses :\\ | Moyenne des sommes des récompenses :\\ | ||
- | {{: | ||
Moyenne du nombre de collisions :\\ | Moyenne du nombre de collisions :\\ | ||
- | {{: | ||
Moyenne du nombre d' | Moyenne du nombre d' | ||
- | {{: | ||
Petite optimisation sur les états joints, lorsqu' | Petite optimisation sur les états joints, lorsqu' | ||
Line 41: | Line 38: | ||
Voici les stats obtenues en lançant l' | Voici les stats obtenues en lançant l' | ||
- | En moyenne, les agents ont besoin de | + | En moyenne, les agents ont besoin de |
- | Avec un ecart-type de 0.943398113206 | + | Avec un ecart-type de 6.23217458035 |
En moyenne, les agents ont 0.0 collisions \\ | En moyenne, les agents ont 0.0 collisions \\ | ||
Avec un ecart-type de 0.0 | Avec un ecart-type de 0.0 | ||
- | En moyenne, les agents ont 1.9 etats joints \\ | + | En moyenne, les agents ont 1.7 etats joints \\ |
- | Avec un ecart-type de 1.13578166916 | + | Avec un ecart-type de 1.41774468788 |