StudyPreprintWikiReinforcement LearningModerate

Hierarchical Variational Policies for Reward-Guided Diffusion

Authors: Kushagra Pandey, Farrin Marouf Sofian, Jan Niklas Groeneveld, Felix Draxler, Stephan Mandt
Year: 2026