模型概览
**Kling V3 标准有声** 是一款可灵视频生成模型,公共模型 ID 为 `kling-v3-std-audio`。它面向需要快速生成带声音短视频的创作者、开发者和企业团队,支持通过文本或图片生成视频,并可在标准清晰度下输出有声结果。
该模型适合把产品图、分镜图或创意描述转成可用于投放、社媒、商品详情页和内容测试的视频素材。
核心能力
- **文生视频**:输入 prompt,生成短视频画面与音频输出。
- **图生视频**:上传参考图,让静态图片产生镜头运动和动态表现。
- **首尾帧视频**:指定第一帧和最后一帧,控制视频起止画面,适合分镜衔接。
- **异步生成**:适合接入后端任务队列、批量素材生产和自动化工作流。
- **多比例输出**:支持 `16:9`、`9:16`、`1:1`,覆盖横屏、竖屏和方形内容。
- **时长范围**:支持 3 到 15 秒视频生成。
适合哪些用户
1. 短视频运营团队 用于生成 9:16 竖屏视频、剧情分镜、商品种草素材和内容 A/B 测试版本。
2. 电商与品牌营销团队 可将产品图生成动态展示视频,用于广告投放、落地页、商品主图视频和新品预热。
3. 开发者与 SaaS 平台 通过 UniAll AI API 接入 `kling-v3-std-audio`,为自己的应用增加 AI 视频生成能力,例如模板化广告生成、批量素材生产、创意工具或代理分站。
4. 内容自动化工作流 适合与脚本生成、图片生成、素材管理、审核发布系统组合,形成端到端的 AI 视频生产链路。
API 调用方式
Kling V3 标准有声通过 UniAll AI 的视频生成接口调用:
```http POST /v1/videos/generations ```
常用请求字段包括:
| 参数 | 说明 | |---|---| | `model` | 固定为 `kling-v3-std-audio` | | `generation_mode` | 生成模式:`text_to_video`、`image_to_video`、`first_last_frame` | | `prompt` | 视频描述文本 | | `image_url` | 图生视频参考图 URL | | `first_image_url` | 首尾帧模式的第一帧图片 URL | | `last_image_url` | 首尾帧模式的最后一帧图片 URL | | `duration` | 视频时长,3–15 秒 | | `aspect_ratio` | `16:9`、`9:16` 或 `1:1` | | `resolution` | `standard`、`pro`、`4k` 可选,当前模型页对应标准有声变体 |
图生视频示例
```json { "model": "kling-v3-std-audio", "generation_mode": "image_to_video", "prompt": "一支电商产品展示视频,柔和棚拍灯光,镜头缓慢推进,突出产品质感。", "image_url": "https://example.com/product.png", "duration": 5, "aspect_ratio": "9:16", "resolution": "standard" } ```
首尾帧视频示例
```json { "model": "kling-v3-std-audio", "generation_mode": "first_last_frame", "prompt": "从清晨室内场景过渡到窗边产品特写,镜头平滑自然,带有轻微电影感。", "first_image_url": "https://example.com/start.png", "last_image_url": "https://example.com/end.png", "duration": 6, "aspect_ratio": "16:9", "resolution": "standard" } ```
价格与计费角度
Kling V3 标准有声按视频秒数计费,平台展示价格为 **¥0.62 / 秒**。实际费用通常与生成时长和所选清晰度有关,例如 5 秒标准有声视频可按 5 秒计算。
如果任务生成失败,UniAll AI 支持失败退款机制;生产环境中建议结合任务状态查询、错误处理和素材审核流程,避免重复提交造成不必要成本。
使用建议
- 做广告视频时,prompt 中明确产品、场景、镜头运动和情绪氛围。
- 做图生视频时,上传主体清晰、构图稳定的参考图。
- 做首尾帧视频时,确保两张图的主体、风格和透视差异不要过大。
- 竖屏短视频优先选择 `9:16`,官网或横版广告可选择 `16:9`。
- 批量生成前先用 3–5 秒短片测试风格,再扩大生产。
为什么在 UniAll AI 使用
UniAll AI 将 `kling-v3-std-audio` 封装为可直接调用的视频生成 API,支持异步任务、统一参数、价格展示和多模型工作流接入。对于开发者和企业团队,这比单独维护多家模型接口更适合做产品化集成、内部工具和代理系统。
常见问题
Kling V3 标准有声可以生成什么内容?
它可以生成带音频的视频,支持文生视频、图生视频和首尾帧图生视频,适合短视频素材、广告视频、电商产品展示、剧情分镜和社媒内容测试。
Kling V3 标准有声 API 怎么调用?
通过 UniAll AI 的 `POST /v1/videos/generations` 接口调用,模型 ID 填写 `kling-v3-std-audio`,并根据模式传入 `prompt`、`image_url` 或 `first_image_url`、`last_image_url` 等参数。
Kling V3 标准有声怎么收费?
该模型按秒计费,当前平台展示价格为 ¥0.62 / 秒。费用会受生成时长和清晰度选择影响,生成失败时平台支持失败退款。