Site Tools


Hotfix release available: 2024-02-06b "Kaos". upgrade now! [55.2] (what's this?)
Hotfix release available: 2024-02-06a "Kaos". upgrade now! [55.1] (what's this?)
New release available: 2024-02-06 "Kaos". upgrade now! [55] (what's this?)
Hotfix release available: 2023-04-04b "Jack Jackrum". upgrade now! [54.2] (what's this?)
Hotfix release available: 2023-04-04a "Jack Jackrum". upgrade now! [54.1] (what's this?)
New release available: 2023-04-04 "Jack Jackrum". upgrade now! [54] (what's this?)
Hotfix release available: 2022-07-31b "Igor". upgrade now! [53.1] (what's this?)
Hotfix release available: 2022-07-31a "Igor". upgrade now! [53] (what's this?)
New release available: 2022-07-31 "Igor". upgrade now! [52.2] (what's this?)
New release candidate 2 available: rc2022-06-26 "Igor". upgrade now! [52.1] (what's this?)
New release candidate available: 2022-06-26 "Igor". upgrade now! [52] (what's this?)
Hotfix release available: 2020-07-29a "Hogfather". upgrade now! [51.4] (what's this?)
memento-learning-multi-agent-state-space-representations

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
memento-learning-multi-agent-state-space-representations [2025/02/24 18:52]
47.128.16.245 old revision restored (2025/01/20 17:27)
memento-learning-multi-agent-state-space-representations [2025/04/11 02:32] (current)
3.137.200.242 old revision restored (2025/03/07 18:21)
Line 72: Line 72:
 L'entrainement du réseau est donc fait avec les actions préférées a1 et a2, et Δ(x) et Δ(y). L'entrainement du réseau est donc fait avec les actions préférées a1 et a2, et Δ(x) et Δ(y).
  
-Chaque agent utile u réseau de neurone pour généraliser ses états "safe" et "dangerous".+Chaque agent utilise un réseau de neurone pour généraliser ses états "safe" et "dangerous".
  
 Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non. Pour chaque échantillon Δ(x) et Δ(y) sont déterminés et stockés avec une variable booléenne qui indique s'il y a eu collision ou non.
memento-learning-multi-agent-state-space-representations.1740419545.txt.gz · Last modified: 2025/02/24 18:52 by 47.128.16.245