Differences

This shows you the differences between two versions of the page.

--- realisation_env_grille_qlearning_sma_jsl [2025/12/07 14:13]
47.128.61.13 old revision restored (2025/06/07 03:22)
+++ realisation_env_grille_qlearning_sma_jsl [2025/12/11 17:09] (current)
47.128.49.101 old revision restored (2025/06/07 09:16)
@@ Line 1: / Line 1: @@
 ===== Environnement grille - Qlearning - Joint state learners =====
+==== Modifications apportées à la grille ====
+   * Les récompenses sont accordées aux agents après qu'ils aient tous effectués une action.
+   * Si des agents entrent en collision, ils ne se déplacent pas
+   * Possibilité de compter le nombre de collisions
+==== Expérience ====
 Même conditions que pour l'environnement grille classique avec des ILs. \\
@@ Line 5: / Line 13: @@
 Rappel des résultats obtenus avec des ILs : http://liris.cnrs.fr/sasem/doku.php?id=realisation_env_grille_qlearning_sma
 ==== Résultats avec Joint state learners ====
-Les collisions disparaissent rapidement :
+Les collisions disparaissent rapidement (les deux courbes se confondent car les collisions qui arrivent a un agent arrivent forcément à l'autre):
 {{:rewards_collisions_grille_jsl.png|}}

DokuWiki