Differences

This shows you the differences between two versions of the page.

--- compte-rendu-etat-art-these [2025/12/08 13:44]
47.128.122.177 old revision restored (2025/11/20 03:01)
+++ compte-rendu-etat-art-these [2025/12/12 06:15] (current)
47.128.17.86 old revision restored (2025/11/20 16:42)
@@ Line 25: / Line 25: @@
 Exemple : ?
+<note>
+  * Méthode simple d'app non supervisé: K-means [[https://home.deib.polimi.it/matteucc/Clustering/tutorial_html/kmeans.html]]
+  * Autre méthodes: cartes auto-organisées (SOM) cf. cours [[http://eric.univ-lyon2.fr/~rias2006/presentations/VincentLemaire.pdf]]
+  * Exemple de carte SOM utilisé en RL pour représenter les états:
+     * [[http://www.eecg.toronto.edu/~roman/professional/pubs/pdfs/ijcnn99_khepera_ieee.pdf]]
+     *
+</note>
 ===Apprentissage par récompense===
@@ Line 168: / Line 176: @@
 Si l'on sait ce que l'on veut apprendre, on pourrait guider le processus de discrétisation des données pour qu'il fournisse des données plus adapté à la représentation.
 En poussant ce principe un peu plus loin, il serait possible d'avoir une boucle de rétroaction entre le processus de discrétisation et l'apprentissage plus haut niveau.

DokuWiki