Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output image
Toggle for request processing mode. false enables speed mode (prioritizes low latency); true enables quality mode (prioritizes output quality).

Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 7 files
Provide one external image URL as a reference for video generation (only one image is supported). This is one of two image input options — you can either upload an external image or specify a task_id + index from a Grok-generated image below. Do not provide both image_urls and task_id at the same time.In your prompt, reference an uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
Enter the task_id of an image previously generated with the Grok model on Emix. Use it together with the index below to select a specific image from that generation. When using this method, do not provide image_urls. Unlike external images, this method supports Spicy mode.
When using a task_id, specify which image to use (Grok generates 6 images per task). This parameter only works with task_id and is ignored if image_urls is used(0-based).
The text prompt describing the desired video motion
Note: When generating videos using external image inputs, Spicy mode is not supported and will automatically switch to Normal.
The aspect ratio of the video. This parameter is invalid if it is a single image.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
A text description specifying the desired content or style of the generated image.
Drag, paste, or click to upload
JPEG · PNG · WEBP · up to 10MB · max 5 files
An array containing up to 1 URL string pointing to reference images. In your prompt, reference the uploaded image by typing @image(n) followed by a space (for example: @image1 a sunset over the ocean).
A configurable parameter. Defaults to true in the Playground.

supports only Emix AI–generated taskid
The text prompt describing the desired video motion
Extension start time must be at least 2 seconds.
Extended duration
no output
The text prompt describing the desired video motion
Specifies the width-to-height ratio of the generated content. Controls the aspect ratio of the output video.
The duration of the generated video in seconds
Resolution of the generated video
A configurable parameter. Defaults to true in the Playground.
Grok Imagine API:统一的多模态 AI 图像与视频生成
由 Grok-2 驱动的统一多模态框架。提供超逼真的时序连贯性、精准的运镜,以及原生交叉注意力音频同步。
xAI Grok Imagine API 模型架构与核心多模态机制
Grok Imagine AI API 的 Transformer 架构将复杂的文本 Token 转化为高分辨率、像素完美的静态图像,直接确保像素对齐与结构保真。
Text-to-Image (T2I): High-Fidelity Latent Projection
Grok T2V 模型将文本嵌入映射至时间维度,执行由 Grok-2 驱动的流畅多帧渲染,保持连续的叙事连贯性与物理运动规律。
Text-to-Video (T2V): Semantic-Driven Sequence Generation
基于局部条件扩散技术,该模块在保留源图形基础构图的同时,修改风格、纹理和光影,从而实现对结构变化的精准控制。
Image-to-Image (I2I): Latent-Guided Asset Style Transfer
Grok I2V 模型将原图锚定为固定的首帧,以此推演逼真的时空动态与运动向量,彻底消除结构形变。
Image-to-Video (I2V): Conditional Motion Extrapolation
Grok 生成模式与预设
普通模式:商业合规与安全
在普通模式下,Grok 图像生成 API 采用标准的安全护栏与内容过滤机制,确保所有视觉资产完全符合品牌安全标准。该运行环境专为企业工作流与商业营销而优化。
趣味模式:风格化与艺术表达
趣味模式增强了创意的多样性,使模型更侧重于风格化美学、艺术演绎及生动的画面结构,从而生成极具吸引力、表现力和想象力的多模态内容。
Grok 图像生成狂野模式:无上限的创意自由度
Grok 狂野模式绕过传统的内容审核限制,赋予开发者极致的概念自由度。该模式支持无过滤的艺术表达、复杂的抽象风格及原生的创意展现。
Grok Imagine API 的动态物理效果与多模态运动学
Grok 图像生成 API:高级物理模拟
Grok 图像生成 API 引擎提供超写实渲染,精准模拟流体动力学、复杂光影及精细的 3D 动画。该引擎严格遵循物理结构与材质的一致性,确保生成的每一帧都呈现出栩栩如生的动态效果。
Grok 图像生成 API:电影级运镜
Grok Imagine AI 视频生成 API 管线支持开发者通过代码精准控制电影级运镜(如流畅的 360° 环绕视角),从而把控叙事节奏。在生成细节丰富的特写时,其底层架构能确保面部表情与细微物理动作的高保真网格形变与呈现。
Grok Imagine 视频 API:原生视频与唇形精准同步
平台内置原生音频集成功能,实现音效、唇形动态与生成的视频时间线完美同步。这消除了对后期对齐处理的需求,直接通过 API 响应交付连贯流畅、达到广播级标准的多媒体资产。
推理速度:高吞吐量视频生成
专为工业级部署打造,Grok Imagine AI API 全面优化了渲染管线,带来极速生成体验。其高吞吐量特性可满足大规模企业工作流的需求,支持快速原型开发与视觉资产的无缝实时生成。
面向企业的 EMix.ai 基础设施优势
7x24 小时生产环境支持与 SLA 服务保障
EMix.ai 通过 7x24 小时技术运维支持,确保基础设施的持续高可用。平台专为大规模企业级生产环境设计,具备主动监控与快速事件响应工作流,有效降低任务关键型 Webhook 与运行环境的宕机风险。
详尽统一的 Grok Imagine API 文档
EMix.ai 提供结构清晰、开发者优先的 Grok 图像生成 API 文档,最大限度降低接入成本并缩短产品上线周期。所有 API 接口均配备了标准化的请求与响应参数、明确的鉴权机制(Bearer Tokens)及生产级 SDK,并提供了处理异步任务生命周期的清晰指南。
高性价比且透明的 Grok 图像生成 API 计费模式
EMix.ai 提供按实际使用量计费的低价 Grok 图像生成 API,助您优化基础设施支出。通过引入优化的批量推理与动态资源分配技术,该架构有效降低了单 token 和单帧的推理成本,帮助企业在规模化扩展时实现可预测的财务规划及可持续的单位经济效益。
持续更新的 API 模型市场
EMix.ai 架构实现了 API 网关与模型更新的解耦。统一的模型市场会持续上线最新的生产级文本、图像和视频模型。开发者无需重构核心集成代码,即可无缝完成模型版本的管理与升级。
在 EMix.ai 开启您的 Grok Imagine API 开发之旅
第一步:登录并获取您的 Grok 图像生成 API Key
登录您的 EMix.ai 工作空间,进入 API 控制台来创建或管理您的 API Key。该密钥将用于对来自您的后端、应用程序、内部工具或 AI 产品环境的接口调用请求进行身份验证。
第 2 步:使用可用额度测试 Grok Imagine API
在全面接入之前,请利用 EMix.ai 测试平台和您的可用额度对 API 进行评估。您可以根据实际工作流需求测试提示词(Prompts),涵盖文生图/视频(T2I/T2V)、图生图/视频(I2I/I2V)、物理模拟或运镜控制等场景。
第 3 步:查阅 Grok Imagine API 文档与参数
在编写生产环境逻辑前,请仔细查阅最新的 EMix.ai 文档,深入了解请求格式、身份验证、生成模式(Normal、Fun、Spicy)、速率限制以及输出配置(如分辨率、帧率、宽高比等)。
第 4 步:将 Grok Imagine AI API 接入您的产品工作流
将 API 接口连接至您的后端、工具或生产流程。在正式上线前,开发者必须配置系统以处理提示词、异步任务生命周期、错误排查、重试机制、用量监控以及响应格式。
Grok Imagine API vs Seedance 2.0 API vs Wan 2.7 Video API
Grok 图像生成 API 开发者应用场景
自动化电商视频制作
开发者可将 Grok Imagine API 接入电商生产流程,自动将静态商品图片转化为高保真宣传视频。该引擎能为服装和消费品生成流畅的运动轨迹,同时保留商品原始的外观形态与纹理细节。
动态电影级分镜制作
影视前期软件开发者可利用该 API 精准的摄像机运动学控制,从文本或分镜脚本生成连贯的电影级视频。系统能在多帧序列中保持角色特征与空间布局的一致性,方便导演预览复杂的 360° 环绕运镜。
程序化游戏资产生成
游戏开发团队可利用 Grok 图像生成 API 框架,以编程方式批量生成可扩展的视觉资产、纹理贴图,以及用于环境背景的短视频循环。该工作流通过 API 响应数据,直接加速了交互式 3D 玩法机制的快速原型设计。
交互式 AI 数字人动画
通过将文本或图像驱动框架与原生音频对齐技术相结合,开发者可以构建出具有流畅面部表情的交互式 AI 助手。该 API 可确保语音轨道与面部微表情之间实现精准的时空同步,从而打造高沉浸感的交互界面。