Differences

This shows you the differences between two versions of the page.

--- memento-intrinsically-motivated-rl [2025/02/13 18:35]
47.128.58.193 old revision restored (2025/01/21 18:08)
+++ memento-intrinsically-motivated-rl [2025/04/11 13:58] (current)
52.14.9.19 old revision restored (2025/04/02 11:06)
@@ Line 1: / Line 1: @@
-=====Memento sur [Singh2005]=====
+=====Mémento sur [Singh2005]=====
    * motivation intrinsèque : action provoquée par la recherche d'une récompense.
@@ Line 24: / Line 24: @@
 Lorsque l'agent interagi pour la première fois avec un objet, une structure permettant d'apprendre et de stocker l'option de l'objet est ajoutée. Au fur et à mesure que l'agent interagi avec l'environnement, les options sont mises à jour.
+Lorsque l'agent rencontre un évènement important, il aura tendance à essayer de le comprendre rapidement. Ceci va conduire à deux effets secondaires :
+   -L'apprentissage va améliorer la politique et l'option-model qui prédit l'évènement
+   -La récompense intrinsèque va diminuer, et l'agent va s'ennuyer de cet évènement (et donc en chercher d'autres)
+Comme le montre la figure 4 (cf document), les évènements simple sont appris en premier. Même si leur récompense diminue, ils continuent d'arriver car ils sont nécessaire à l'apprentissage d'évènements plus complexes.
+Conclusion :
+Un agent qui a une collection de compétences apprises à partir de récompenses intrinsèques peut apprendre un large éventail de tâches récompensées extrinsèquement plus facilement  que si l'agent n'avait pas ces compétences.

DokuWiki

Site Tools

Differences

Page Tools