Site Tools


Hotfix release available: 2025-05-14a "Librarian". upgrade now! [56.1] (what's this?)
New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)
Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_cqlearning_cmu_tr_ttg

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/01 03:23]
47.128.113.231 old revision restored (2024/05/26 10:15)
realisation_env_grille_cqlearning_cmu_tr_ttg [2025/07/02 20:43] (current)
47.128.118.117 old revision restored (2025/02/23 17:41)
Line 26: Line 26:
 === CMU === === CMU ===
  
-A la 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement. +A la 000eme itération, la politique devient déterministe, l'agent ne peut plus choisir d'actions aléatoirement. 
  
 Moyenne des sommes des récompenses :\\ Moyenne des sommes des récompenses :\\
-{{:cmu3_rewards.png?500|}} 
  
 Moyenne du nombre de collisions :\\ Moyenne du nombre de collisions :\\
-{{:cmu3_collisions.png?500|}} 
  
 Moyenne du nombre d'états joints :\\ Moyenne du nombre d'états joints :\\
-{{:cmu3_nbjs.png?500|}} 
  
 Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. Ils le sont aussi lorsqu'ils indiquent la même action que l'état individuelle. Petite optimisation sur les états joints, lorsqu'ils n'ont pas été utilisés depuis trop longtemps, ceux-ci sont supprimés. Ils le sont aussi lorsqu'ils indiquent la même action que l'état individuelle.
Line 41: Line 38:
 Voici les stats obtenues en lançant l'expérience 5 fois : Voici les stats obtenues en lançant l'expérience 5 fois :
    
-En moyenne, les agents ont besoin de  -10. etapes \\ +En moyenne, les agents ont besoin de  13. etapes\\ 
-Avec un ecart-type de   0.943398113206+Avec un ecart-type de   6.23217458035
  
 En moyenne, les agents ont  0.0  collisions \\ En moyenne, les agents ont  0.0  collisions \\
 Avec un ecart-type de   0.0 Avec un ecart-type de   0.0
  
-En moyenne, les agents ont  1. etats joints \\ +En moyenne, les agents ont  1. etats joints \\ 
-Avec un ecart-type de   1.13578166916  +Avec un ecart-type de   1.41774468788
  
  
realisation_env_grille_cqlearning_cmu_tr_ttg.1751332981.txt.gz · Last modified: 2025/07/01 03:23 by 47.128.113.231