Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
realisation_env_grille_qlearning_sma_jsl

Environnement grille - Qlearning - Joint state learners

Modifications apportées à la grille

  • Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
  • Si des agents entrent en collision, ils ne se déplacent pas
  • Possibilité de compter le nombre de collisions

Expérience

Même conditions que pour l'environnement grille classique avec des ILs.
Grille type Tunnel to Goal, 2 agents.

Rappel des résultats obtenus avec des ILs : http:liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma ==== Résultats avec Joint state learners ==== Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre): rewards_collisions_grille_jsl.png Politique optimale trouvée : rewards_grille_jsl.png

realisation_env_grille_qlearning_sma_jsl.txt · Last modified: 2024/10/19 22:26 by 47.128.118.148