Grok Imagine 图生视频是什么?
Grok Imagine 是一个 AI 视频生成模型,在 UniAll AI 中的公开模型 ID 为 `grok-imagine`。它支持两种主要模式:
- **图生视频(image_to_video)**:上传 1 张参考图,并用提示词描述镜头运动、风格、动作和氛围。
- **文生视频(text_to_video)**:仅通过文本提示词生成视频。
对于“Grok Imagine 图生视频”场景,模型会基于参考图延展动态画面,适合保留主体外观、产品形态、角色设定或视觉风格。
适合哪些用户?
Grok Imagine 图生视频适合:
- **电商与品牌团队**:将产品图变成短视频展示、开箱感镜头或广告素材。
- **内容创作者**:为小红书、抖音、YouTube Shorts 等平台制作竖版或横版动态内容。
- **设计与游戏团队**:把概念图、角色图、场景图转成动态预览。
- **开发者与自动化团队**:通过 API 批量生成视频素材,接入内容生产流水线。
核心能力与参数
`grok-imagine` 在 UniAll AI 支持异步视频生成,主要参数如下:
| 参数 | 说明 | | --- | --- | | `prompt` | 必填,描述视频内容、镜头、动作、风格与光线 | | `generation_mode` | `image_to_video` 或 `text_to_video` | | `image_url` | 图生视频时使用,支持 PNG、JPEG、WebP | | `duration` | 视频时长,1–15 秒 | | `aspect_ratio` | 支持 16:9、4:3、3:2、1:1、2:3、3:4、9:16 | | `resolution` | 支持 480p 或 720p | | `video_count` | 当前每次生成 1 个视频 |
建议先用 5–6 秒测试提示词效果,再根据用途扩展到更长时长。
图生视频提示词写法
好的提示词应同时说明主体、动作、镜头和风格。例如:
```text A cinematic product reveal, the camera slowly pushes in, soft studio lighting, subtle reflections, premium commercial style, smooth motion, 16:9 composition. ```
中文也可以直接使用:
```text 基于参考图生成一段高端产品展示视频,镜头缓慢推进,柔和棚拍灯光,主体保持清晰,背景轻微虚化,画面稳定,商业广告风格。 ```
实用建议:
- 想保持主体一致:强调“主体保持一致”“不要改变产品外观”。
- 想要镜头运动:写清楚“缓慢推进”“环绕拍摄”“轻微摇镜”。
- 想控制风格:加入“电影感”“写实”“棚拍”“社媒广告风格”等描述。
- 做短视频平台:优先选择 `9:16`;做官网或广告横幅:优先选择 `16:9`。
API 调用示例
UniAll AI 提供异步视频生成接口:
```http POST /v1/videos/generations ```
图生视频请求示例:
```json { "model": "grok-imagine", "generation_mode": "image_to_video", "prompt": "A cinematic product reveal, soft studio lighting, smooth camera movement.", "image_url": "https://example.com/reference.png", "duration": 6, "aspect_ratio": "16:9", "video_count": 1, "resolution": "720p" } ```
说明:该接口为异步生成,提交任务后需要根据平台返回的任务信息查询结果。开发者可以将它接入素材生成、广告批量生产、内容审核前置流程或内部创意工具。
价格与成本控制
Grok Imagine 按视频秒数计费,并区分分辨率:
- **480p**:约 ¥0.24 / 秒
- **720p**:约 ¥0.34 / 秒
成本估算方式很直接:
```text 总费用 ≈ 单秒价格 × 视频时长 ```
例如生成 6 秒 720p 视频,费用约为 6 × ¥0.34。若用于提示词测试,建议先选择较短时长或 480p;最终交付、广告预览或高清展示再使用 720p。
生成失败与稳定性建议
UniAll AI 对该模型支持失败退款;当前不自动重试。为了减少失败或效果偏差,建议:
- 上传清晰、主体明确的参考图。
- 避免在一条提示词中要求过多复杂动作。
- 控制人物、文字、手部、复杂机械结构等高难细节。
- 先生成短视频验证方向,再扩展时长。
什么时候选择 Grok Imagine 图生视频?
如果你已经有产品图、角色图、海报或概念图,并希望快速生成动态镜头,`grok-imagine` 的图生视频模式比纯文生视频更适合。它能让视觉起点更明确,减少“从零生成”带来的主体不确定性,适合商业素材、社媒内容和创意预演。
常见问题
Grok Imagine 图生视频需要哪些参数?
至少需要 `model`、`generation_mode`、`prompt` 和 `image_url`。在 UniAll AI 中模型 ID 使用 `grok-imagine`,图生视频模式使用 `image_to_video`。还可以设置 `duration`、`aspect_ratio`、`resolution` 和 `video_count`。
Grok Imagine 支持多长的视频?
当前支持 1–15 秒视频生成。默认时长通常可设为 6 秒,适合先测试镜头运动和画面稳定性。
Grok Imagine 图生视频怎么计费?
按秒计费,并根据分辨率不同而变化。480p 约 ¥0.24 / 秒,720p 约 ¥0.34 / 秒。生成 6 秒视频时,可用单秒价格乘以 6 估算成本。