This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
|
compte-rendu-etat-art-these [2025/12/08 13:44] 47.128.122.177 old revision restored (2025/11/20 03:01) |
compte-rendu-etat-art-these [2025/12/12 06:15] (current) 47.128.17.86 old revision restored (2025/11/20 16:42) |
||
|---|---|---|---|
| Line 25: | Line 25: | ||
| Exemple : ? | Exemple : ? | ||
| + | |||
| + | < | ||
| + | * Méthode simple d'app non supervisé: K-means [[https:// | ||
| + | * Autre méthodes: cartes auto-organisées (SOM) cf. cours [[http:// | ||
| + | * Exemple de carte SOM utilisé en RL pour représenter les états: | ||
| + | * [[http:// | ||
| + | | ||
| + | </ | ||
| ===Apprentissage par récompense=== | ===Apprentissage par récompense=== | ||
| Line 168: | Line 176: | ||
| Si l'on sait ce que l'on veut apprendre, on pourrait guider le processus de discrétisation des données pour qu'il fournisse des données plus adapté à la représentation. | Si l'on sait ce que l'on veut apprendre, on pourrait guider le processus de discrétisation des données pour qu'il fournisse des données plus adapté à la représentation. | ||
| En poussant ce principe un peu plus loin, il serait possible d' | En poussant ce principe un peu plus loin, il serait possible d' | ||
| - | |||