Grok Imagine 图生视频教程 | grok-imagine API 用法与价格

UniAll AI SEO/GEO · Grok Imagine · 2026-05-30

Grok Imagine 图生视频是什么？

Grok Imagine 是一个 AI 视频生成模型，在 UniAll AI 中的公开模型 ID 为 `grok-imagine`。它支持两种主要模式：

**图生视频（image_to_video）**：上传 1 张参考图，并用提示词描述镜头运动、风格、动作和氛围。
**文生视频（text_to_video）**：仅通过文本提示词生成视频。

对于“Grok Imagine 图生视频”场景，模型会基于参考图延展动态画面，适合保留主体外观、产品形态、角色设定或视觉风格。

适合哪些用户？

Grok Imagine 图生视频适合：

**电商与品牌团队**：将产品图变成短视频展示、开箱感镜头或广告素材。
**内容创作者**：为小红书、抖音、YouTube Shorts 等平台制作竖版或横版动态内容。
**设计与游戏团队**：把概念图、角色图、场景图转成动态预览。
**开发者与自动化团队**：通过 API 批量生成视频素材，接入内容生产流水线。

核心能力与参数

`grok-imagine` 在 UniAll AI 支持异步视频生成，主要参数如下：

| 参数 | 说明 | | --- | --- | | `prompt` | 必填，描述视频内容、镜头、动作、风格与光线 | | `generation_mode` | `image_to_video` 或 `text_to_video` | | `image_url` | 图生视频时使用，支持 PNG、JPEG、WebP | | `duration` | 视频时长，1–15 秒 | | `aspect_ratio` | 支持 16:9、4:3、3:2、1:1、2:3、3:4、9:16 | | `resolution` | 支持 480p 或 720p | | `video_count` | 当前每次生成 1 个视频 |

建议先用 5–6 秒测试提示词效果，再根据用途扩展到更长时长。

图生视频提示词写法

好的提示词应同时说明主体、动作、镜头和风格。例如：

```text A cinematic product reveal, the camera slowly pushes in, soft studio lighting, subtle reflections, premium commercial style, smooth motion, 16:9 composition. ```

中文也可以直接使用：

```text 基于参考图生成一段高端产品展示视频，镜头缓慢推进，柔和棚拍灯光，主体保持清晰，背景轻微虚化，画面稳定，商业广告风格。 ```

实用建议：

想保持主体一致：强调“主体保持一致”“不要改变产品外观”。
想要镜头运动：写清楚“缓慢推进”“环绕拍摄”“轻微摇镜”。
想控制风格：加入“电影感”“写实”“棚拍”“社媒广告风格”等描述。
做短视频平台：优先选择 `9:16`；做官网或广告横幅：优先选择 `16:9`。

API 调用示例

UniAll AI 提供异步视频生成接口：

```http POST /v1/videos/generations ```

图生视频请求示例：

```json { "model": "grok-imagine", "generation_mode": "image_to_video", "prompt": "A cinematic product reveal, soft studio lighting, smooth camera movement.", "image_url": "https://example.com/reference.png", "duration": 6, "aspect_ratio": "16:9", "video_count": 1, "resolution": "720p" } ```

说明：该接口为异步生成，提交任务后需要根据平台返回的任务信息查询结果。开发者可以将它接入素材生成、广告批量生产、内容审核前置流程或内部创意工具。

价格与成本控制

Grok Imagine 按视频秒数计费，并区分分辨率：

**480p**：约 ¥0.24 / 秒
**720p**：约 ¥0.34 / 秒

成本估算方式很直接：

```text 总费用 ≈ 单秒价格 × 视频时长 ```

例如生成 6 秒 720p 视频，费用约为 6 × ¥0.34。若用于提示词测试，建议先选择较短时长或 480p；最终交付、广告预览或高清展示再使用 720p。

生成失败与稳定性建议

UniAll AI 对该模型支持失败退款；当前不自动重试。为了减少失败或效果偏差，建议：

上传清晰、主体明确的参考图。
避免在一条提示词中要求过多复杂动作。
控制人物、文字、手部、复杂机械结构等高难细节。
先生成短视频验证方向，再扩展时长。

什么时候选择 Grok Imagine 图生视频？

如果你已经有产品图、角色图、海报或概念图，并希望快速生成动态镜头，`grok-imagine` 的图生视频模式比纯文生视频更适合。它能让视觉起点更明确，减少“从零生成”带来的主体不确定性，适合商业素材、社媒内容和创意预演。

Grok Imagine 图生视频Grok Imagine 模型Grok Imagine 价格Grok Imagine 教程Grok Imagine 接口文档grok-imagine APIGrok Imagine AI 视频生成Grok Imagine 文生视频Grok Imagine 首尾帧视频Grok Imagine 视频续写AI 视频生成平台文生视频平台

常见问题

Grok Imagine 图生视频需要哪些参数？

至少需要 `model`、`generation_mode`、`prompt` 和 `image_url`。在 UniAll AI 中模型 ID 使用 `grok-imagine`，图生视频模式使用 `image_to_video`。还可以设置 `duration`、`aspect_ratio`、`resolution` 和 `video_count`。

Grok Imagine 支持多长的视频？

当前支持 1–15 秒视频生成。默认时长通常可设为 6 秒，适合先测试镜头运动和画面稳定性。

Grok Imagine 图生视频怎么计费？

按秒计费，并根据分辨率不同而变化。480p 约 ¥0.24 / 秒，720p 约 ¥0.34 / 秒。生成 6 秒视频时，可用单秒价格乘以 6 估算成本。