-
Regret Analysis of Certainty Equivalence Policies in Continuous-Time Linear-Quadratic Systems
Freier ZugriffArXiv | 2022| -
Analysis of Thompson Sampling for Partially Observable Contextual Multi-Armed Bandits
Freier ZugriffArXiv | 2021| -
Efficient Algorithms for Learning to Control Bandits with Unobserved Contexts
Freier ZugriffArXiv | 2022| -
Worst-case Performance of Greedy Policies in Bandits with Imperfect Context Observations
Freier ZugriffArXiv | 2022| -
Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems
Freier ZugriffArXiv | 2021| -
Randomized Algorithms for Data-Driven Stabilization of Stochastic Linear Systems
Freier ZugriffArXiv | 2019| -
Efficient Randomized Algorithms for Continuous Space Reinforcement Learning
British Library Conference Proceedings | 2019| -
On Applications of Bootstrap in Continuous Space Reinforcement Learning
Freier ZugriffArXiv | 2019| -
Efficient Randomized Algorithms for Continuous Space Reinforcement Learning
British Library Conference Proceedings | 2019|
Meine Suche schicken an (beta)
Schicken Sie ihre Suchanfrage (Suchterm ohne Filter) an andere Datenbanken, Portale und Kataloge, um ggf. weitere interessante Treffer zu finden:
Dimensions ist eine Datenbank für Abstracts und Zitate, die Informationen zu Forschungsförderungen mit daraus resultierenden Veröffentlichungen, Studien und Patenten verknüpft.
Im TIB AV-Portal können audiovisuelle Medien aus Wissenschaft und Lehre recherchiert und eigene wissenschaftliche Videos publiziert werden.
Im FID move kann nach fachspezifischer Literatur, Forschungsdaten und weitere Informationen aus der Mobilitäts- und Verkehrsforschung gesucht werden.
Der Open Research Knowledge Graph liefert strukturiert beschriebene Forschungsinhalte und macht diese vergleichbar.
Frei zugänglicher Ausschnitt der Verbunddatenbank K10plus des GBV und des SWB mit für die Fernleihe und Direktlieferdienste relevanten Materialien.