This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
memento-intrinsically-motivated-rl [2025/10/21 21:39] 94.139.57.127 old revision restored (2025/08/06 11:26) |
memento-intrinsically-motivated-rl [2025/10/22 18:13] (current) 216.73.216.169 old revision restored (2025/10/19 23:36) |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | =====Memento | + | =====Mémento |
* motivation intrinsèque : action provoquée par la recherche d'une récompense. | * motivation intrinsèque : action provoquée par la recherche d'une récompense. | ||
Line 17: | Line 17: | ||
* La méthode d' | * La méthode d' | ||
+ | <note important> | ||
+ | |||
+ | L' | ||
+ | |||
+ | L' | ||
+ | |||
+ | Lorsque l' | ||
+ | |||
+ | Lorsque l' | ||
+ | | ||
+ | -La récompense intrinsèque va diminuer, et l' | ||
+ | |||
+ | |||
+ | Comme le montre la figure 4 (cf document), les évènements simple sont appris en premier. Même si leur récompense diminue, ils continuent d' | ||
+ | |||
+ | Conclusion : | ||
+ | Un agent qui a une collection de compétences apprises à partir de récompenses intrinsèques peut apprendre un large éventail de tâches récompensées extrinsèquement plus facilement | ||
+ | Il serait difficile pour un agent d' | ||