This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-learning-multi-agent-state-space-representations [2025/03/01 17:44] 47.128.58.115 old revision restored (2025/01/24 17:43) |
memento-learning-multi-agent-state-space-representations [2025/04/11 02:32] (current) 3.137.200.242 old revision restored (2025/03/07 18:21) |
||
---|---|---|---|
Line 74: | Line 74: | ||
Chaque agent utilise un réseau de neurone pour généraliser ses états " | Chaque agent utilise un réseau de neurone pour généraliser ses états " | ||
- | Pour chaque échantillon, Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non. | + | Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non. |
En pratique le réseau peut servir à l' | En pratique le réseau peut servir à l' | ||
- | |||
- | ==== Conclusion ==== | ||
- | |||
- | * Ne permet pas de trouver une politique à un agent | ||
- | * CQLearning gère la coordination inter-agent basé sur les statistiques | ||
- | * Permet d' | ||