This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
realisation_env_grille_qlearning_sma [2025/02/28 17:07] 47.128.125.245 old revision restored (2025/02/13 18:45) |
realisation_env_grille_qlearning_sma [2025/04/18 13:24] (current) 47.128.124.206 old revision restored (2025/02/23 18:12) |
||
---|---|---|---|
Line 34: | Line 34: | ||
Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessus). Les deux agents essaient d' | Deux IL évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessus). Les deux agents essaient d' | ||
- | {{: | + | {{: |
(Somme des récompenses des deux agents - l'un en violet, l' | (Somme des récompenses des deux agents - l'un en violet, l' | ||
La récompense de -10 sur la collision à l' | La récompense de -10 sur la collision à l' | ||