This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma_jsl [2024/09/14 01:18] 47.128.21.233 old revision restored (2024/08/10 18:37) |
realisation_env_grille_qlearning_sma_jsl [2025/01/02 19:34] (current) 47.128.49.45 old revision restored (2024/08/18 03:31) |
||
---|---|---|---|
Line 1: | Line 1: | ||
===== Environnement grille - Qlearning - Joint state learners ===== | ===== Environnement grille - Qlearning - Joint state learners ===== | ||
- | |||
- | ==== Modifications apportées à la grille ==== | ||
- | |||
- | * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action. | ||
- | * Si des agents entrent en collision, ils ne se déplacent pas | ||
- | * Possibilité de compter le nombre de collisions | ||
- | |||
- | ==== Expérience ==== | ||
Même conditions que pour l' | Même conditions que pour l' | ||
Line 14: | Line 6: | ||
Rappel des résultats obtenus avec des ILs : http:// | Rappel des résultats obtenus avec des ILs : http:// | ||
+ | ==== Modifications apportées à la grille ==== | ||
+ | * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action. | ||
+ | * Si des agents entrent en collision, ils ne se déplacent pas | ||
+ | * Possibilité de compter le nombre de collisions | ||
==== Résultats avec Joint state learners ==== | ==== Résultats avec Joint state learners ==== | ||
- | Les collisions disparaissent rapidement | + | Les collisions disparaissent rapidement : |
{{: | {{: |