Differences

This shows you the differences between two versions of the page.

--- compte-rendu-etat-art-these [2025/12/08 13:18]
47.128.126.163 old revision restored (2025/11/18 19:34)
+++ compte-rendu-etat-art-these [2025/12/12 06:15] (current)
47.128.17.86 old revision restored (2025/11/20 16:42)
@@ Line 24: / Line 24: @@
 Recherche de points commun dans les données contextuellement à l'objectif fixé. Souvent basé sur le sstatistiques.
 Exemple : ?
+<note>
+  * Méthode simple d'app non supervisé: K-means [[https://home.deib.polimi.it/matteucc/Clustering/tutorial_html/kmeans.html]]
+  * Autre méthodes: cartes auto-organisées (SOM) cf. cours [[http://eric.univ-lyon2.fr/~rias2006/presentations/VincentLemaire.pdf]]
+  * Exemple de carte SOM utilisé en RL pour représenter les états:
+     * [[http://www.eecg.toronto.edu/~roman/professional/pubs/pdfs/ijcnn99_khepera_ieee.pdf]]
+     *
+</note>
 ===Apprentissage par récompense===
@@ Line 152: / Line 161: @@
 <note important>Incompris, pour plus de détail sur la fiablité, voir : Page 87, Paragraphe 3</note>
+Ce type d'apprentissage doit permettre une abstraction des connaissances.
+Deux solution proposées :
+   * Ajout d'item synthétique -> Lorqu'on ne peut pas rendre fiable un schéma, ajout de conditions nécessaires pour que celui-ci soit valide. L'item synthétique n'est pas lié aux perceptions et ne prend une valeur que rétroactivement.
+   * Actions composites -> actions formées de plusieurs schémas pour atteindre un but.
+====La robotique développementale====
+====Le problème d’amorçage====
+Le système va apprendre incrémentalement à partir d'un état initial. Quel est-il ?
+Pour faire apprendre les régularités au système, on peut se baser sur un certain point de vue comme la proximité temporelle entre deux évènements, la proximité spatiale, ou la séquentialité des évènements.
+Mais quel point de vue prendre si l'on veut apprendre sur la base d'un flot de données brute ? Faut-il essayer une multitude de point de vue pour trouver des régularités ? Existe-t-il certains points de vue permettant d'apprendre toutes les régularités ?
+Si l'on sait ce que l'on veut apprendre, on pourrait guider le processus de discrétisation des données pour qu'il fournisse des données plus adapté à la représentation.
+En poussant ce principe un peu plus loin, il serait possible d'avoir une boucle de rétroaction entre le processus de discrétisation et l'apprentissage plus haut niveau.

DokuWiki

Site Tools

Differences

Page Tools