| Основные преимущества | Генерация видео из изображений + синхронизация нативного звука, стабильность, скорость | Мультимодальный ввод (референсы: фото/видео/аудио), точность передачи персонажей | Управление первым/последним кадром, редактирование видео, гибкость |
| Разрешение | 480p / 720p | 720p / 1080p | 720p / 1080p |
| Длительность | 1-15 секунд | 1-15 секунд | 2-15 секунд |
| Нативный звук | Да (Диалоги, синхронизация губ, звуковые эффекты и фоновая музыка за одну генерацию) | Да (Мультиязычность, на уровне фонем) | Да (Поддержка генерации на основе аудио) |
| Поддержка ввода | Преимущественно Image-to-Video (одно изображение + промпт) | Мультимодальный (до 9 изображений + 3 видео + 3 аудио) | Первый/последний кадр, референсные изображения, несколько режимов редактирования |
| Рейтинг на Arena (I2V 720p) | Частые вопросы #1 | 2-е место или близко к 1-му | От среднего до высокого |
| Оптимальные сценарии применения | Быстрая анимация изображений, короткие разговорные видео, проверка концепций | Сложные раскадровки, сохранение единого стиля при использовании нескольких референсов | Точный контроль над повествованием, редактирование и расширение видео |