| Principaux atouts | Image-to-Video + Synchronisation audio native, Cohérence, Vitesse | Entrée multimodale (Référence image/vidéo/audio), Fidélité des personnages | Contrôle première/dernière image, Édition vidéo, Flexibilité |
| Résolution | 480p/720p | 720p / 1080p | 720p / 1080p |
| Durée | 1 à 15 secondes | 1 à 15 secondes | 2 à 15 secondes |
| Audio natif | Oui (Dialogue, Synchronisation labiale, Effets sonores et Musique de fond en un seul rendu) | Oui (Multilingue, Niveau phonème) | Oui (Piloté par l'audio) |
| Entrées prises en charge | Principalement Image-to-Video (Image unique + Prompt) | Multimodal (Jusqu'à 9 images + 3 vidéos + 3 pistes audio) | Première/dernière image, Images de référence, Modes d'édition multiples |
| Classement Arena (I2V 720p) | FAQ #1 | #2 ou proche du #1 | Moyen à élevé |
| Meilleurs cas d'usage | Animation rapide d'images, Courtes vidéos avec avatars parlants, Validation de concepts | Storyboards complexes, Contenu cohérent multi-références | Contrôle narratif précis, Montage / Extension vidéo |