Autor der Publikation

Policy Search in a Space of Simple Closed-form Formulas: Towards Interpretability of Reinforcement Learning.

, , , und . Discovery Science, Volume 7569 von Lecture Notes in Computer Science, Seite 37-51. Springer, (2012)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Imitative Learning for Online Planning in Microgrids., , , , und . DARE, Volume 9518 von Lecture Notes in Computer Science, Seite 1-15. Springer, (2015)Lipschitz robust control from off-policy trajectories., , , und . CDC, Seite 4924-4931. IEEE, (2014)Inferring bounds on the performance of a control policy from a sample of trajectories., , , und . ADPRL, Seite 117-123. IEEE, (2009)Imitative learning for real-time strategy games., , , und . CIG, Seite 424-429. IEEE, (2012)Estimation Monte Carlo sans modèle de politiques de décision., , , und . Rev. d'Intelligence Artif., 25 (3): 321-343 (2011)Optimistic planning for belief-augmented Markov Decision Processes., , und . ADPRL, Seite 77-84. IEEE, (2013)Using approximate dynamic programming for estimating the revenues of a hydrogen-based high-capacity storage device., , und . ADPRL, Seite 1-8. IEEE, (2014)Aggregating Optimistic Planning Trees for Solving Markov Decision Processes., , und . NIPS, Seite 2382-2390. (2013)Critical Time Windows for Renewable Resource Complementarity Assessment., , , , , , , , , und . CoRR, (2018)Benchmarking for Bayesian Reinforcement Learning., , , und . CoRR, (2015)