論文深掘り Hugging Face 発表: 2026-05-18 HF ↑31

CogOmniControl: Reasoning-Driven Controllable Video Generation via Creative Intent Cognition

著者: Hongji Yang, Songlian Li, Yucheng Zhou, Xiaotong Zhao, Alan Zhao ほか2名

要約

Recent diffusion models achieve strong photorealism and fluency in video generation, yet remain fragile under abstract, sparse or complex conditions, leading to poor performance in professional production workflows such as storyboard sketches and clay render conditions. Existing video generation mod…

#multimodal#diffusion#rl#benchmark

CogOmniControl: Reasoning-Driven Controllable Video Generation via Creative Intent Cognition

要約

同じカテゴリの記事

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

World-R1: テキストから動画生成における3D制約の強化学習による整合

ACC: Compiling Agent Trajectories for Long-Context Training