This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-learning-multi-agent-state-space-representations [2025/05/23 05:39] 216.73.216.90 old revision restored (2025/04/18 19:01) |
memento-learning-multi-agent-state-space-representations [2025/07/02 17:15] (current) 47.128.22.225 old revision restored (2025/02/24 18:52) |
||
---|---|---|---|
Line 72: | Line 72: | ||
L' | L' | ||
- | Chaque agent utilise un réseau de neurone pour généraliser ses états " | + | Chaque agent utile u réseau de neurone pour généraliser ses états " |
- | Pour chaque échantillon, Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non. | + | Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non. |
En pratique le réseau peut servir à l' | En pratique le réseau peut servir à l' | ||
- | |||
- | ==== Conclusion ==== | ||
- | |||
- | * Ne permet pas de trouver une politique à un agent | ||
- | * CQLearning gère la coordination inter-agent basé sur les statistiques | ||
- | * Permet d' | ||