Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_qlearning

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
realisation_env_grille_qlearning [2024/06/06 05:27]
47.128.97.162 old revision restored (2024/05/31 02:23)
realisation_env_grille_qlearning [2024/08/15 18:49] (current)
47.128.99.99 old revision restored (2024/06/11 06:31)
Line 3: Line 3:
 ==== Expérience ==== ==== Expérience ====
  
-L'environnement est une grille modifiable à partir d'un fichier texteElle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus).+L'environnement est une grille modifiable à partir d'un fichier texte tel que ci dessous : 
 + 
 +BBBBBBB \\ 
 +BSEEEEB \\ 
 +BEBEBEB \\ 
 +BEEEBEB \\ 
 +BEBEEEB \\ 
 +BEBBBEB \\ 
 +BEEEEFB \\ 
 +BBBBBBB \\ 
 + 
 +B = block \\ 
 +E = empty \\ 
 +S = start \\ 
 +F = finish \\ 
 + 
 +Elle contient une case de départ, une case de fin et un agent (et bientôt la possibilité d'en mettre plus).
  
 La grille (d'une grande beauté) est représentée comme ci dessous : La grille (d'une grande beauté) est représentée comme ci dessous :
Line 27: Line 43:
 L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode. L'agent apprend petit à petit jusqu'à ce que ses qvaleurs convergent. La stratégie s'affine et devient intéressante à partir du 300ième épisode.
  
 +==== La suite ====
  
 +Appliquer ce QLearning au MountainCar et au Pendule.
realisation_env_grille_qlearning.1717644450.txt.gz · Last modified: 2024/06/06 05:27 by 47.128.97.162