This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
realisation_env_grille_qlearning_sma_jsl [2025/12/07 14:13] 47.128.61.13 old revision restored (2025/06/07 03:22) |
realisation_env_grille_qlearning_sma_jsl [2025/12/11 17:09] (current) 47.128.49.101 old revision restored (2025/06/07 09:16) |
||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ===== Environnement grille - Qlearning - Joint state learners ===== | ===== Environnement grille - Qlearning - Joint state learners ===== | ||
| + | |||
| + | ==== Modifications apportées à la grille ==== | ||
| + | |||
| + | * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action. | ||
| + | * Si des agents entrent en collision, ils ne se déplacent pas | ||
| + | * Possibilité de compter le nombre de collisions | ||
| + | |||
| + | ==== Expérience ==== | ||
| Même conditions que pour l' | Même conditions que pour l' | ||
| Line 5: | Line 13: | ||
| Rappel des résultats obtenus avec des ILs : http:// | Rappel des résultats obtenus avec des ILs : http:// | ||
| + | |||
| ==== Résultats avec Joint state learners ==== | ==== Résultats avec Joint state learners ==== | ||
| - | Les collisions disparaissent rapidement : | + | Les collisions disparaissent rapidement |
| {{: | {{: | ||