Log in Start free

Research/Reinforcement Learning

StudyPreprintWikiReinforcement Learning Sequential DecisionsModerate

Minimax Optimal Variance-Aware Regret Bounds for Multinomial Logistic MDPs

Read full paper →

Authors: Pierre Boudart, Pierre Gaillard, Alessandro Rudi
Year: 2026

Read full paper →More Reinforcement Learning research

Minimax Optimal Variance-Aware Regret Bounds for Multinomial Logistic MDPs | Steady Practice | SteadyPractice