realisation_env_grille_qlearning_sma

Hotfix release available: 2025-05-14b "Librarian". upgrade now! [56.2] (what's this?)

Hotfix release available: 2025-05-14a "Librarian". upgrade now! [56.1] (what's this?)

New release available: 2025-05-14 "Librarian". upgrade now! [56] (what's this?)

Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)

Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)

New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)

Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)

Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)

New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)

Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)

Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)

New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)

New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)

New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)

Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)

realisation_env_grille_qlearning_sma_jsl

Environnement grille - Qlearning - Joint state learners
- Modifications apportées à la grille
- Expérience

Environnement grille - Qlearning - Joint state learners

Modifications apportées à la grille

Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
Si des agents entrent en collision, ils ne se déplacent pas
Possibilité de compter le nombre de collisions

Expérience

Même conditions que pour l'environnement grille classique avec des ILs.
Grille type Tunnel to Goal, 2 agents.

Rappel des résultats obtenus avec des ILs : http:liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma ==== Résultats avec Joint state learners ==== Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre): rewards_collisions_grille_jsl.png Politique optimale trouvée : rewards_grille_jsl.png

realisation_env_grille_qlearning_sma_jsl.txt · Last modified: 2025/12/11 17:09 by 47.128.49.101

Page Tools

Edit this page
Old revisions
Backlinks
Back to top

DokuWiki

Table of Contents

Environnement grille - Qlearning - Joint state learners

Modifications apportées à la grille

Expérience

DokuWiki

Site Tools

Table of Contents

Environnement grille - Qlearning - Joint state learners

Modifications apportées à la grille

Expérience

Page Tools