This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
realisation_env_grille_qlearning_sma [2025/11/30 03:00] 47.128.116.5 old revision restored (2025/06/29 21:25) |
realisation_env_grille_qlearning_sma [2025/12/10 02:26] (current) 47.128.47.5 old revision restored (2025/08/20 21:31) |
||
|---|---|---|---|
| Line 30: | Line 30: | ||
| {{: | {{: | ||
| - | ==== Experience | + | ==== Experience |
| - | Deux ILs tentent d' | + | Deux IL évoluent sur une grille |
| - | Dans ce contexte l' | + | |
| - | {{:sans_collisions_sma_grille.png|}} | + | {{:reward_grille_sma_ils.png|}}\\ |
| + | (Somme des récompenses des deux agents - l'un en violet, l' | ||
| - | On peut voir que la somme des récompenses tend vers un minimum et que les agents ne se perturbent pas. | + | La récompense de -10 sur la collision à l' |
| - | {{: | + | ==== Experience Sans collisions ==== |
| - | (Somme des récompenses des deux agents - l' | + | Même test en prenant une grille dans laquelle il n'y a pas de collisions. |
| - | ==== Experience Tunnel To Goal ==== | + | {{: |
| - | Deux ILs évoluent sur une grille de forme Tunnel To Goal avec un QLearning (grille ci-dessous). Les deux agents | + | On peut voir que la somme des récompenses tend vers un minimum et que les agents |
| - | {{:grille_sma.png|}} | + | {{:sans_collisions_sma_grille_ILs.png|}} |
| - | + | ||
| - | + | ||
| - | {{: | + | |
| (Somme des récompenses des deux agents - l'un en violet, l' | (Somme des récompenses des deux agents - l'un en violet, l' | ||
| - | |||
| - | La récompense de -10 sur la collision à l' | ||