Differences

This shows you the differences between two versions of the page.

--- m1r2017 [2025/12/10 02:03]
47.128.59.72 old revision restored (2025/10/02 03:30)
+++ m1r2017 [2025/12/11 20:50] (current)
66.249.70.67 old revision restored (2025/08/26 01:50)
@@ Line 18: / Line 18: @@
       * [[https://ai.vub.ac.be/ALA2012/downloads/paper5.pdf]]
+=== Construction de représentations en RL ===
+  * Tile Coding et versions adaptatives {{http://www.cs.utexas.edu/~ai-lab/pubs/whitesontr07.ps|adaptative_tile_coding [Whiteson,2007] }} et {{http://www.aaai.org/ocs/index.php/WS/AAAIW10/paper/viewFile/2068/2422|evolutionary_tile_coding [Lin,2010] }}
+  * Combinaison de growing neural gaz GNG et Q-Learning pour discrétisation adaptative de l'espace d'états: http://liris.cnrs.fr/sasem/lib/exe/fetch.php?media=m1r2017:vieira2013tdgngoriginal.pdf
+  * {{http://nn.cs.utexas.edu/downloads/papers/provost.connsci06.pdf|Self-Organizing Distinctive-State Abstraction (SODA) [Kuipers,2006] }}
 === App Constructiviste ===
@@ Line 29: / Line 34: @@
 ===== Mémentos  =====
+A lire :
+   * https://ai.vub.ac.be/ALA2012/downloads/paper4.pdf
+   * http://ir.library.oregonstate.edu/xmlui/bitstream/handle/1957/39192/HolmesParkerChristopherG2013.pdf;sequence=1
 ==== App Constructiviste ====
    * [[compte-rendu-etat-art-these | Etat de l'art (Thèse S. Mazac)]]
@@ Line 36: / Line 44: @@
    * [[memento-Learning-multi-agent-state-space-representations | Learning multi-agent state space representations (CQLearning)]]
    * [[memento-Processus-décisionnels-de-Markov-et-systèmes-multiagents | Processus décisionnels de Markov et systèmes multiagents (Thèse L. Matignon)]]
-   * [[memento-Independent-reinforcement-learners-cooperative-Markov-games:-a-survey-regarding-coordination-problems | Independent reinforcement learners in cooperative Markov games: a survey regarding coordination problems (A terminer)]]
+   * [[memento-Independent-reinforcement-learners-cooperative-Markov-games:-a-survey-regarding-coordination-problems | Independent reinforcement learners in cooperative Markov games: a survey regarding coordination problems]]
    * [[memento-Context-Sensitive-Reward-Shaping-for-Sparse-Inter-action-Multi-Agent-Systems | Context-Sensitive Reward Shaping for Sparse Inter-action Multi-Agent Systems]]
@@ Line 47: / Line 55: @@
 ==== Temporal Difference - Growing Neural Gas ====
    * [[memento-td-gng | TD-GNG]]
+===== Réalisations  =====
+   * [[realisation_SOM | SOM]]
 ===== Réflexions  =====
@@ Line 53: / Line 65: @@
 ===== Comptes-rendu de réunion  =====
-Dossier contenant les tous les slides présentés lors des réunions :
+Dossier contenant les slides présentés lors des réunions :
-[[https://drive.google.com/drive/folders/0B7dh6En0bP-KakRNYllvOVN3N2c | slides]]
+[[https://drive.google.com/drive/folders/0B7dh6En0bP-KakRNYllvOVN3N2c?usp=sharing | slides]]
    * [[ reu02-03-17 |02/03/17]]
-   * 14/03/17
+   * [[ reu14-03-17 |14/03/17]]
+   * [[ reu24-03-17 |24/03/17]]

DokuWiki

Site Tools

Differences

Page Tools