Aug 12 – Aug 18, 2024 — Middle East AI

FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance

arXiv · Aug 15 · CV Research

FancyVideo, a new video generator, introduces a Cross-frame Textual Guidance Module (CTGM) to enhance text-to-video models. CTGM uses a Temporal Information Injector and Temporal Affinity Refiner to achieve frame-specific textual guidance, improving comprehension of temporal logic. Experiments on the EvalCrafter benchmark demonstrate FancyVideo's state-of-the-art performance in generating dynamic and consistent videos, also supporting image-to-video tasks.

Aug 12 – Aug 18, 2024

Top Stories

FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance