Le mathoscope: Stratégies optimistes en apprentissage par renforcement

26 janv. 2011

Stratégies optimistes en apprentissage par renforcement

TEL :: [tel-00551401, version 1]
http://tel.archives-ouvertes.fr/tel-00551401/fr/
Cette thèse traite de méthodes « model-based » pour résoudre des problèmes d'apprentissage par renforcement. On considère un agent confronté à une suite de décisions et un environnement dont l'état varie selon les décisions prises par l'agent. Ce dernier reçoit tout au long de l'interaction des récompenses qui dépendent à la fois de l'action prise et de l'état de l'environnement. L'agent ne connaît pas le modèle d'interaction et a pour but de maximiser la somme des récompenses reçues à long terme.
...

Aucun commentaire:

Enregistrer un commentaire

Le mathoscope

26 janv. 2011

Stratégies optimistes en apprentissage par renforcement

Aucun commentaire:

Pourquoi Linux ?

Dans les blogs de Maths

Abonnements

Archives du Mathoscope

Recherche sur le mathoscope

Librairie

Liens