Differences

This shows you the differences between two versions of the page.

--- memento-learning-multi-agent-state-space-representations [2025/05/23 05:39]
216.73.216.90 old revision restored (2025/04/18 19:01)
+++ memento-learning-multi-agent-state-space-representations [2025/07/02 17:15] (current)
47.128.22.225 old revision restored (2025/02/24 18:52)
@@ Line 72: / Line 72: @@
 L'entrainement du réseau est donc fait avec les actions préférées a1 et a2, et Δ(x) et Δ(y).
-Chaque agent utilise un réseau de neurone pour généraliser ses états "safe" et "dangerous".
+Chaque agent utile u réseau de neurone pour généraliser ses états "safe" et "dangerous".
-Pour chaque échantillon, Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non.
+Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non.
 En pratique le réseau peut servir à l'agent pour savoir s'il doit regarder un certain endroit en fonction de l'action choisie.
-==== Conclusion ====
-   * Ne permet pas de trouver une politique à un agent
-   * CQLearning gère la coordination inter-agent basé sur les statistiques
-   * Permet d'éviter les collisions

DokuWiki