Differences

This shows you the differences between two versions of the page.

--- compte-rendu-etat-art-these [2025/10/16 01:37]
162.222.196.117 old revision restored (2025/08/29 01:09)
+++ compte-rendu-etat-art-these [2025/10/18 11:34] (current)
216.73.216.169 old revision restored (2025/10/16 02:13)
@@ Line 46: / Line 46: @@
 ===L’apprentissage par renforcement===
 Difficilement utilisable pour l'AmI, car :
-   -discrétisation du temps est faite de manière arbitraire
+->discrétisation du temps est faite de manière arbitraire
-   -compliqué d'interpréter le feedback venant de l'utilisateur.
+->compliqué d'interpréter le feedback venant de l'utilisateur.
-Bilan : Besoin d'une approche plus globale ne se limitant pas à mettre en place des solutions pour des sous problèmes indépendants.
-===Exemple d’une approche globale===
-Triplet de capteurs (O, M, C) [Objet, Mouvement, Contextuel],
-Représentations définies sur un triplet (E, C, A) [Evenement, Condition, Action],
-Algo de classification -> chercher des motifs d'interactions à partir des données. Permet de construire de manière générale la régularité puis d'affiner petit à petit.
-====Les systèmes multi-agents====
-Système complexe : système qui a un effet sur son environnement et ses propres composantes.
-Application des SMA :
-   * alternative à la résolution de problèmes centralisés
-   * la simulation (biologie, sociologie...)
-   * paradigme de programmation
-Façons d'envisager l'apprentissage décentralisé des SMA :
-   * Un système peut être améliorer en dotant ses agents de capacités d'apprentissage qui leur sont propre.
-   * Les agents peuvent apprendre de manière distribué et interactive -> c'est le système qui apprend par l'évolution des agents.
-Catégories d'apprentissage des SMA :
-   * apprentissage centralisé : les agents apprennent seul.
-   * apprentissage décentralisé : les agents sont impliqués dans la même activé d'apprentissage
-L'apprentissage centralisé et décentralisé peuvent cohabiter.
-===Attribution des récompenses===
-Difficulté de donner des récompenses, comment savoir quels agents doivent avoir le feedback lors d'un changement au global ?
-(CAP : Credit Assignement Problem)
-Décomposition du problème en deux sous problèmes :
-   * CAP inter-agent : Rétribution des agents en fonction d'un changement de performance au niveau global.
-   * CAP intra-agent : Rétribution des inférences internes ou décisions d’un agent en fonction d’une action externe effectuée.
-Une solution plus simple consiste à diviser la récompense globale entre tous les agents du système, mais ceci ne marche pas correctement dans les cas plus complexe qui nécessitent un feedback plus précis.
-===Caractéristiques de l’apprentissage décentralisé===
-Apprendre un comportement collectif total ciblé est compliqué. Il est possible de simplifier le problème en isolant les comportements appris de certains agents, en réduisant l'hétérogénéité des comportements ou en réduisant la complexité des capacité des agents.
-Réduction de la complexité -> utiliser l'apprentissage par niveau (layered learning). Il faut alors décomposer automatiquement le problème et assurer une coordination des sous-comportements.
-====Approches neuro-inspirée====
-Approche connexionniste : modélise les phénomènes mentaux ou comportementaux comme des processus émergents de réseaux d’unités simples interconnectées.
-L'IA actuelle (systèmes experts, solveurs logiques, ...) exécute des algos, alors que l'intelligence "réelle" consiste à comprendre.
-L'ordinateur à un fonctionnement éloigné de celui du cerveau. La meilleure solution pour reproduire un système intelligent tel qu'un cerveau n'est donc pas forcément d'imiter la construction de ce dernier.
-Représentation invariante : régularité constante dans l'exécution d'un tâche.

DokuWiki

Site Tools

Differences

Page Tools