TEL :: [tel-00551401, version 1]
http://tel.archives-ouvertes.fr/tel-00551401/fr/
Cette thèse traite de méthodes « model-based » pour résoudre des problèmes d'apprentissage par renforcement. On considère un agent confronté à une suite de décisions et un environnement dont l'état varie selon les décisions prises par l'agent. Ce dernier reçoit tout au long de l'interaction des récompenses qui dépendent à la fois de l'action prise et de l'état de l'environnement. L'agent ne connaît pas le modèle d'interaction et a pour but de maximiser la somme des récompenses reçues à long terme.
...
26 janv. 2011
Stratégies optimistes en apprentissage par renforcement
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire