Differences

This shows you the differences between two versions of the page.

--- memento-learning-multi-agent-state-space-representations [2025/03/01 17:44]
47.128.58.115 old revision restored (2025/01/24 17:43)
+++ memento-learning-multi-agent-state-space-representations [2025/04/11 02:32] (current)
3.137.200.242 old revision restored (2025/03/07 18:21)
@@ Line 74: / Line 74: @@
 Chaque agent utilise un réseau de neurone pour généraliser ses états "safe" et "dangerous".
-Pour chaque échantillon, Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non.
+Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non.
 En pratique le réseau peut servir à l'agent pour savoir s'il doit regarder un certain endroit en fonction de l'action choisie.
-==== Conclusion ====
-   * Ne permet pas de trouver une politique à un agent
-   * CQLearning gère la coordination inter-agent basé sur les statistiques
-   * Permet d'éviter les collisions

DokuWiki