Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output image
Toggle for request processing mode. false enables speed mode (prioritizes low latency); true enables quality mode (prioritizes output quality).

Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 7 files
Provide one external image URL as a reference for video generation (only one image is supported). This is one of two image input options — you can either upload an external image or specify a task_id + index from a Grok-generated image below. Do not provide both image_urls and task_id at the same time.In your prompt, reference an uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
Enter the task_id of an image previously generated with the Grok model on Emix. Use it together with the index below to select a specific image from that generation. When using this method, do not provide image_urls. Unlike external images, this method supports Spicy mode.
When using a task_id, specify which image to use (Grok generates 6 images per task). This parameter only works with task_id and is ignored if image_urls is used(0-based).
The text prompt describing the desired video motion
Note: When generating videos using external image inputs, Spicy mode is not supported and will automatically switch to Normal.
The aspect ratio of the video. This parameter is invalid if it is a single image.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
A text description specifying the desired content or style of the generated image.
Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 5 files
An array containing up to 1 URL string pointing to reference images. In your prompt, reference the uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
A configurable parameter. Defaults to true in the Playground.

supports only Emix AI–generated taskid
The text prompt describing the desired video motion
Extension start time must be at least 2 seconds.
Extended duration
no output
The text prompt describing the desired video motion
Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output video.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
API Grok Imagine : Génération d'images et de vidéos par IA multimodale unifiée
Framework multimodal unifié propulsé par Grok-2. Offre une cohérence temporelle hyper-réaliste, une cinématique de caméra de précision et une synchronisation audio native par attention croisée.
Architecture du modèle de l'API xAI Grok Imagine et mécanismes multimodaux fondamentaux
L'architecture Transformer de l'API d'IA Grok Imagine traduit des jetons textuels complexes en images statiques haute résolution au pixel près, garantissant directement l'alignement des pixels et la fidélité structurelle.
Text-to-Image (T2I): High-Fidelity Latent Projection
Le modèle Grok T2V projette les embeddings textuels dans la dimension temporelle, exécutant un rendu multi-trames fluide piloté par Grok-2, tout en maintenant une continuité narrative constante et le respect des lois physiques du mouvement.
Text-to-Video (T2V): Semantic-Driven Sequence Generation
Opérant via le conditionnement par diffusion localisée, ce module modifie les styles, les textures et l'éclairage tout en préservant la composition fondamentale de l'image source, permettant un contrôle précis des variations structurelles.
Image-to-Image (I2I): Latent-Guided Asset Style Transfer
Le modèle Grok I2V utilise l'image source comme première image fixe de référence afin d'extrapoler des dynamiques temporelles et des vecteurs de mouvement réalistes, éliminant ainsi toute déformation structurelle.
Image-to-Video (I2V): Conditional Motion Extrapolation
Modes de génération et préréglages de Grok
Mode Normal : Conformité commerciale et sécurité
En Mode Normal, l'API IA Grok Imagine applique des garde-fous et des filtres de contenu standardisés pour garantir que tous les visuels sont totalement brand-safe. Cet environnement est optimisé pour les flux de travail en entreprise et le marketing institutionnel.
Mode Fun : Expression stylisée et artistique
Le Mode Fun augmente la diversité créative, permettant au modèle de privilégier des esthétiques stylisées, des interprétations artistiques et des formats structurels saisissants, afin de générer des contenus multimodaux très engageants, expressifs et imaginatifs.
Mode Spicy de Grok Imagine : Liberté créative illimitée
Le mode Spicy de Grok contourne les restrictions de modération traditionnelles pour offrir aux développeurs une liberté conceptuelle maximale. Ce mode permet une expression artistique sans filtre, des styles abstraits complexes et une créativité brute.
Physique dynamique et cinématique multimodale de l'API Grok Imagine
API Grok Imagine : Simulation physique avancée
Le moteur de l'API Grok Imagine offre un rendu hyperréaliste, simulant avec précision la dynamique des fluides, les éclairages complexes et les animations 3D sophistiquées. Le moteur maintient une physique structurelle rigoureuse et une cohérence des matériaux, garantissant des mouvements fidèles à la réalité sur chaque image générée.
API IA Grok Imagine : Mouvements de caméra cinématographiques
Le pipeline de l'API de génération vidéo Grok Imagine AI permet aux développeurs de contrôler programmatiquement le rythme narratif grâce à des contrôles cinématographiques précis, incluant des mouvements de caméra orbitaux fluides à 360°. Son architecture préserve la déformation de maillage (mesh deformation) en haute fidélité pour les expressions faciales et les dynamiques physiques subtiles lors de la génération de gros plans détaillés.
API vidéo Grok Imagine : Alignement natif de la vidéo et du lip-sync
La plateforme intègre l'audio en natif pour synchroniser parfaitement les paysages sonores et les dynamiques de lip-sync avec la timeline de la vidéo générée. Cela élimine le besoin d'alignement en post-production, fournissant des ressources multimédias cohérentes et prêtes pour la diffusion directement depuis la réponse de l'API.
Vitesse d'inférence : Génération vidéo à haut débit
Conçue pour des déploiements à l'échelle industrielle, l'API Grok Imagine AI optimise les pipelines de rendu pour offrir des vitesses de génération ultra-rapides. Cette capacité à haut débit facilite le prototypage rapide et la génération fluide de ressources visuelles en temps réel pour les workflows d'entreprise à fort volume.
Avantages de l'infrastructure EMix.ai pour les entreprises
Support de production 24/7 et garanties SLA
EMix.ai garantit la disponibilité continue de l'infrastructure grâce à un support technique des opérations 24/7. Conçue pour la production d'entreprise à fort volume, la plateforme intègre une surveillance proactive et des workflows de réponse rapide aux incidents pour atténuer les risques de temps d'arrêt des webhooks et environnements d'exécution critiques.
Documentation complète et unifiée de l'API Grok Imagine
EMix.ai propose une documentation de l'API Grok Imagine structurée et pensée pour les développeurs, afin de faciliter l'intégration et d'accélérer la mise en production. Tous les endpoints de l'API sont détaillés de manière exhaustive avec des payloads de requête/réponse standardisés, des schémas d'authentification explicites (Bearer Tokens), des SDK prêts pour la production et des directives claires pour gérer le cycle de vie des tâches asynchrones.
Modèles de tarification économiques et transparents de l'API Grok Imagine
EMix.ai optimise les dépenses d'infrastructure avec des tarifs abordables pour l'API Grok Imagine, ajustés à l'utilisation réelle. Grâce à une inférence par lots optimisée et à l'allocation dynamique des ressources, l'architecture réduit le coût d'inférence par token et par image, permettant des prévisions financières fiables et une économie unitaire pérenne à grande échelle.
Marketplace de modèles API mise à jour en continu
L'architecture EMix.ai dissocie la passerelle API des mises à jour des modèles. La marketplace unifiée intègre en continu les dernières versions prêtes pour la production de modèles de texte, d'image et de vidéo. Les développeurs peuvent ainsi implémenter un versionnage et des mises à niveau fluides des modèles sans avoir à refactoriser le code de l'intégration principale.
Commencez à développer avec l'API Grok Imagine sur EMix.ai
Étape 1 : Connectez-vous et obtenez votre clé API Grok Imagine
Connectez-vous à votre espace de travail EMix.ai et accédez au tableau de bord API pour créer ou gérer votre clé API. Cette clé permet d'authentifier les requêtes provenant de votre back-end, de vos applications, de vos outils internes ou de vos produits basés sur l'IA.
Étape 2 : Testez l'API Grok Imagine avec vos crédits disponibles
Utilisez la plateforme de test EMix.ai pour évaluer l'API avec vos crédits disponibles avant l'intégration complète. Testez des prompts qui reflètent les besoins de votre workflow, tels que le texte vers image/vidéo (T2I/T2V), l'image vers image/vidéo (I2I/I2V), les simulations physiques ou les contrôles de la caméra.
Étape 3 : Consultez la documentation et les paramètres de l'API Grok Imagine
Consultez la dernière documentation d'EMix.ai pour comprendre les formats de requêtes, l'authentification, les modes de génération (Normal, Fun, Spicy), les limites de requêtes (rate limits) et les configurations de sortie (résolution, fréquence d'images (framerate), format d'image) avant d'écrire votre logique de production.
Étape 4 : Intégrez l'API d'IA Grok Imagine à votre workflow produit
Connectez l'endpoint de l'API à votre backend, à vos outils ou à vos pipelines de production. Avant la mise en production, les développeurs doivent configurer la façon dont le système gère les prompts, le cycle de vie des tâches asynchrones, la résolution des erreurs, les nouvelles tentatives (retries), le suivi de l'utilisation et le formatage des réponses.
API Grok Imagine vs API Seedance 2.0 vs API Wan 2.7 Video
Cas d'usage de l'API Grok Imagine pour les développeurs
Production vidéo automatisée pour le e-commerce
Les développeurs intègrent l'API Grok Imagine aux pipelines e-commerce pour transformer automatiquement des images de produits statiques en clips vidéo promotionnels haute fidélité. Le moteur projette des trajectoires de mouvement fluides sur les vêtements et les biens de consommation tout en préservant les formes et textures caractéristiques de la marque.
Storyboarding cinématographique dynamique
Les développeurs de logiciels de préproduction exploitent la cinématique de caméra précise de l'API pour générer des vidéos cinématographiques cohérentes à partir de scripts textuels ou de storyboards. Le système préserve l'identité des personnages et l'agencement spatial à travers des séquences multi-images, permettant aux réalisateurs de prévisualiser des travellings circulaires complexes à 360°.
Génération procédurale d'assets de jeu
Les équipes de développement de jeux utilisent le framework de l'API IA Grok Imagine pour générer de manière programmatique des assets visuels modulables, des cartes de textures et de courtes boucles vidéo d'ambiance pour les environnements de fond. Ce pipeline accélère le prototypage rapide de mécaniques 3D interactives directement via les charges utiles des réponses de l'API.
Animation d'avatars IA interactifs
En combinant le framework piloté par le texte ou par l'image avec un alignement audio natif, les développeurs créent des assistants IA interactifs capables d'expressions faciales fluides. L'API garantit une synchronisation spatio-temporelle précise entre les pistes vocales et les micro-mouvements du visage pour des interfaces à fort engagement.