26 janv. 2011

Stratégies optimistes en apprentissage par renforcement

TEL :: [tel-00551401, version 1]
http://tel.archives-ouvertes.fr/tel-00551401/fr/
Cette thèse traite de méthodes « model-based » pour résoudre des problèmes d'apprentissage par renforcement. On considère un agent confronté à une suite de décisions et un environnement dont l'état varie selon les décisions prises par l'agent. Ce dernier reçoit tout au long de l'interaction des récompenses qui dépendent à la fois de l'action prise et de l'état de l'environnement. L'agent ne connaît pas le modèle d'interaction et a pour but de maximiser la somme des récompenses reçues à long terme.
...

Aucun commentaire:

Pourquoi Linux ?

Pauvreté-précarité : Agissons pour ceux qui en ont besoin