Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output image
Toggle for request processing mode. false enables speed mode (prioritizes low latency); true enables quality mode (prioritizes output quality).

Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 7 files
Provide one external image URL as a reference for video generation (only one image is supported). This is one of two image input options — you can either upload an external image or specify a task_id + index from a Grok-generated image below. Do not provide both image_urls and task_id at the same time.In your prompt, reference an uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
Enter the task_id of an image previously generated with the Grok model on Emix. Use it together with the index below to select a specific image from that generation. When using this method, do not provide image_urls. Unlike external images, this method supports Spicy mode.
When using a task_id, specify which image to use (Grok generates 6 images per task). This parameter only works with task_id and is ignored if image_urls is used(0-based).
The text prompt describing the desired video motion
Note: When generating videos using external image inputs, Spicy mode is not supported and will automatically switch to Normal.
The aspect ratio of the video. This parameter is invalid if it is a single image.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
A text description specifying the desired content or style of the generated image.
Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 5 files
An array containing up to 1 URL string pointing to reference images. In your prompt, reference the uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
A configurable parameter. Defaults to true in the Playground.

supports only Emix AI–generated taskid
The text prompt describing the desired video motion
Extension start time must be at least 2 seconds.
Extended duration
no output
The text prompt describing the desired video motion
Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output video.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
API Grok Imagine: Generación Unificada de Imágenes y Videos con IA Multimodal
Framework multimodal unificado impulsado por Grok-2. Ofrece consistencia temporal hiperrealista, cinemática de cámara de precisión y sincronización nativa de audio por atención cruzada.
Arquitectura del Modelo de la API Grok Imagine de xAI y Mecánicas Multimodales Principales
La arquitectura transformer de la API Grok Imagine AI traduce tokens textuales complejos en imágenes estáticas de alta resolución perfectas a nivel de píxel, garantizando directamente la alineación de píxeles y la fidelidad estructural.
Text-to-Image (T2I): High-Fidelity Latent Projection
El modelo Grok T2V proyecta embeddings de texto en la dimensión temporal, ejecutando un renderizado fluido de múltiples fotogramas impulsado por Grok-2, manteniendo la continuidad narrativa y las leyes físicas del movimiento.
Text-to-Video (T2V): Semantic-Driven Sequence Generation
Al operar mediante condicionamiento de difusión localizada, este módulo modifica estilos, texturas e iluminación preservando la composición base del gráfico original, lo que permite un control preciso de la variación estructural.
Image-to-Image (I2I): Latent-Guided Asset Style Transfer
El modelo Grok I2V ancla la imagen de origen como base rígida de primer fotograma para extrapolar dinámicas temporales y vectores de movimiento realistas, eliminando la deformación estructural.
Image-to-Video (I2V): Conditional Motion Extrapolation
Modos de generación y ajustes preestablecidos de Grok
Modo Normal: Cumplimiento comercial y seguridad
En el Modo Normal, la API Grok Imagine AI aplica medidas de seguridad y filtros de contenido estandarizados para garantizar que todos los recursos visuales sean totalmente seguros para la marca. Este entorno está optimizado para flujos de trabajo empresariales y marketing corporativo.
Modo Divertido: Expresión estilizada y artística
El Modo Divertido potencia la variedad creativa, permitiendo al modelo priorizar estéticas estilizadas, interpretaciones artísticas y formatos estructurales vívidos para generar contenido multimodal altamente atractivo, expresivo e imaginativo.
Modo Picante de Grok Imagine: Libertad creativa ilimitada
El Modo Picante de Grok omite las restricciones tradicionales de moderación para ofrecer a los desarrolladores la máxima libertad conceptual. Este modo permite una expresión artística sin filtros, estilos abstractos complejos y contenido en bruto.
Física dinámica y cinemática multimodal de la API de Grok Imagine
API Grok Imagine: Simulación física avanzada
El motor de la API Grok Imagine ofrece un renderizado hiperrealista que simula con precisión la dinámica de fluidos, la iluminación compleja y animaciones 3D detalladas. El motor mantiene una rigurosa física estructural y consistencia en los materiales, garantizando un movimiento natural y realista en cada fotograma generado.
API Grok Imagine AI: Movimientos de cámara de cine
El pipeline de la API de Grok Imagine para la generación de video con IA permite a los desarrolladores guiar programáticamente el ritmo narrativo mediante controles cinematográficos precisos, que incluyen fluidos barridos de cámara orbitales de 360°. La arquitectura mantiene una alta fidelidad en la deformación de mallas para las expresiones faciales y en las dinámicas físicas sutiles durante la generación de primeros planos detallados.
API de video de Grok Imagine: Video nativo y alineación de sincronización labial
La plataforma cuenta con integración nativa de audio que sincroniza perfectamente los paisajes sonoros y las dinámicas de sincronización labial con la línea de tiempo del video generado. Esto elimina la necesidad de alineación en posproducción, ofreciendo recursos multimedia cohesivos y listos para emisión directamente desde la respuesta de la API.
Velocidad de inferencia: Generación de video de alto rendimiento
Diseñada para implementaciones a escala industrial, la API de IA de Grok Imagine optimiza los pipelines de renderizado para ofrecer velocidades de generación ultrarrápidas. Esta capacidad de alto rendimiento permite la creación rápida de prototipos y la generación fluida de recursos visuales en tiempo real para flujos de trabajo empresariales de alto volumen.
Beneficios de la infraestructura de EMix.ai para empresas
Soporte de producción 24/7 y garantías de SLA
EMix.ai garantiza la disponibilidad continua de la infraestructura mediante soporte de operaciones técnicas 24/7. Diseñada para la producción empresarial de alto volumen, la plataforma cuenta con monitoreo proactivo y flujos de trabajo de respuesta rápida ante incidentes para mitigar el riesgo de tiempo de inactividad en webhooks de misión crítica y entornos de ejecución.
Documentación completa y unificada de la API de Grok Imagine
EMix.ai ofrece una documentación de la API Grok Imagine estructurada y pensada para desarrolladores, diseñada para minimizar la fricción en la integración y acelerar el tiempo de salida a producción. Todos los endpoints de la API están detallados exhaustivamente con payloads de solicitud/respuesta estandarizados, esquemas de autenticación explícitos (Bearer Tokens), SDKs listos para producción y directrices claras para gestionar el ciclo de vida de las tareas asíncronas.
Modelos de precios económicos y transparentes de la API Grok Imagine
EMix.ai optimiza los gastos de infraestructura mediante precios asequibles de la API Grok Imagine, ajustados al uso real. Al implementar inferencia por lotes optimizada y asignación dinámica de recursos, la arquitectura reduce el costo de inferencia por token y fotograma, lo que permite proyecciones financieras predecibles y una rentabilidad unitaria sostenible a gran escala.
Catálogo de modelos de API en constante actualización
La arquitectura de EMix.ai desacopla el API gateway de las actualizaciones de los modelos. El catálogo de modelos unificado se nutre continuamente con las últimas versiones listas para producción de modelos de texto, imagen y video, lo que permite a los desarrolladores implementar un versionado y actualizaciones de modelos sin interrupciones, sin necesidad de refactorizar el código fuente de la integración.
Comienza a desarrollar con la API Grok Imagine en EMix.ai
Paso 1: Inicia sesión y obtén tu API Key de Grok Imagine
Inicia sesión en tu espacio de trabajo de EMix.ai y abre el panel de la API para crear o gestionar tu API Key. Esta clave se utiliza para autenticar las solicitudes enviadas desde tu backend, aplicaciones, herramientas internas o entornos de productos de IA.
Paso 2: Prueba la API Grok Imagine usando tus créditos disponibles
Utiliza la plataforma de pruebas de EMix.ai para evaluar la API con tus créditos disponibles antes de la integración completa. Prueba prompts que reflejen las necesidades de tu flujo de trabajo, como texto a imagen/video (T2I/T2V), imagen a imagen/video (I2I/I2V), simulaciones de física o controles de cámara.
Paso 3: Revisa la documentación y los parámetros de la API Grok Imagine
Revisa la documentación más reciente de EMix.ai para comprender los formatos de solicitud, la autenticación, los modos de generación (Normal, Fun, Spicy), los límites de uso y las configuraciones de salida (resolución, tasa de fotogramas, relación de aspecto) antes de programar la lógica de producción.
Paso 4: Integra la API de Grok Imagine AI en el flujo de trabajo de tu producto
Conecta el endpoint de la API a tu backend, herramientas o pipelines de producción. Antes del lanzamiento, los desarrolladores deben configurar cómo el sistema maneja los prompts, el ciclo de vida de las tareas asíncronas, la resolución de errores, los reintentos, el monitoreo de uso y el formato de las respuestas.
Grok Imagine API vs Seedance 2.0 API vs Wan 2.7 Video API
Casos de uso para desarrolladores de la API Grok Imagine
Producción automatizada de videos para e-commerce
Los desarrolladores integran la API de Grok Imagine en los pipelines de e-commerce para transformar automáticamente imágenes estáticas de productos en clips de video promocionales de alta fidelidad. El motor proyecta trayectorias de movimiento fluidas sobre ropa y bienes de consumo, preservando las geometrías y texturas originales de la marca.
Creación dinámica de guiones gráficos cinematográficos
Los desarrolladores de software de preproducción aprovechan la cinemática de cámara precisa de la API para generar videos cinematográficos consistentes a partir de guiones o storyboards. El sistema mantiene la identidad de los personajes y la distribución espacial en secuencias de múltiples fotogramas, lo que permite a los directores previsualizar complejos barridos orbitales de 360°.
Generación procedimental de assets para videojuegos
Los equipos de desarrollo de videojuegos utilizan el framework de la API de IA Grok Imagine para generar de forma programática assets visuales escalables, mapas de texturas y bucles de video ambiental para fondos. Este flujo de trabajo acelera el prototipado rápido de mecánicas 3D interactivas directamente a través de los payloads de respuesta de la API.
Animación de avatares de IA interactivos
Al combinar el framework basado en texto o imágenes con la alineación de audio nativa, los desarrolladores crean asistentes de IA interactivos capaces de mostrar expresiones faciales fluidas. La API garantiza una sincronización espacio-temporal precisa entre las pistas de voz y los micromovimientos faciales para lograr interfaces muy atractivas.