Kling V3 标准有声是什么
Kling V3 标准有声,公共模型 ID 为 `kling-v3-std-audio`,是 UniAll AI 平台可调用的视频生成模型。它支持文生视频、图生视频和首尾帧图生视频,并可输出带音频的视频结果,适合需要快速生成短视频素材的团队使用。
该模型为异步视频生成接口,适合接入到内容生产系统、营销素材平台、电商商品视频工具或企业内部自动化工作流中。
主要能力
- **文生视频**:仅输入提示词即可生成视频。
- **图生视频**:上传一张参考图,结合提示词生成动态视频。
- **首尾帧视频**:上传首帧和尾帧,控制视频起点与终点画面。
- **音频输出**:标准有声版本会生成带音频的视频结果。
- **多画幅支持**:支持 `16:9`、`9:16`、`1:1`。
- **时长范围**:支持 3 到 15 秒。
- **分辨率选项**:支持 `standard`、`pro`、`4k` 档位。
适合哪些用户
Kling V3 标准有声适合以下场景:
1. **短视频团队**:批量生成 9:16 竖屏素材、剧情分镜或创意片段。 2. **电商与品牌营销**:制作产品展示、广告视频、活动预热视频。 3. **开发者与 SaaS 平台**:通过 API 将视频生成能力嵌入自有产品。 4. **企业自动化工作流**:将提示词、商品图、分镜图自动转成视频素材。
API 调用方式
接口为异步视频生成:
```http POST /v1/videos/generations ```
常用请求字段:
| 参数 | 说明 | |---|---| | `model` | 固定为 `kling-v3-std-audio` | | `generation_mode` | 生成模式:`text_to_video`、`image_to_video`、`first_last_frame` | | `prompt` | 视频描述提示词 | | `duration` | 视频时长,3 到 15 秒 | | `aspect_ratio` | 画幅:`16:9`、`9:16`、`1:1` | | `resolution` | 分辨率:`standard`、`pro`、`4k` | | `image_url` | 图生视频参考图 URL | | `first_image_url` | 首尾帧模式的首帧图 URL | | `last_image_url` | 首尾帧模式的尾帧图 URL |
图生视频示例
```json { "model": "kling-v3-std-audio", "generation_mode": "image_to_video", "prompt": "A cinematic product reveal, soft studio lighting, smooth camera movement.", "image_url": "https://example.com/reference.png", "duration": 5, "aspect_ratio": "16:9", "resolution": "standard", "video_count": 1 } ```
文生视频示例
```json { "model": "kling-v3-std-audio", "generation_mode": "text_to_video", "prompt": "A futuristic city street at night, neon reflections, cinematic camera movement.", "duration": 5, "aspect_ratio": "9:16", "resolution": "standard" } ```
首尾帧视频示例
```json { "model": "kling-v3-std-audio", "generation_mode": "first_last_frame", "prompt": "Smooth transition from the first frame to the final frame, realistic motion.", "first_image_url": "https://example.com/first.png", "last_image_url": "https://example.com/last.png", "duration": 5, "aspect_ratio": "16:9", "resolution": "standard" } ```
价格与计费方式
Kling V3 标准有声按视频秒数计费,当前用户侧标准有声价格为 **¥0.62 / 秒**,对应 **$0.08568 / 秒**。实际费用通常按所选分辨率、有声或静音版本以及生成时长计算。
示例:
- 生成 5 秒标准有声视频:约 **¥3.10**。
- 生成 10 秒标准有声视频:约 **¥6.20**。
- 生成 15 秒标准有声视频:约 **¥9.30**。
可选版本参考:
| 版本 | 用户价 | |---|---:| | Standard Silent | ¥0.41 / 秒 | | Standard Audio | ¥0.62 / 秒 | | Pro Silent | ¥0.55 / 秒 | | Pro Audio | ¥0.82 / 秒 | | 4K Silent | ¥2.06 / 秒 | | 4K Audio | ¥2.06 / 秒 |
如果生成失败,平台支持失败退款;当前模型不默认进行失败重试,因此生产环境建议在业务层设计任务状态查询、失败提示和必要的重新提交逻辑。
使用建议
- 做社媒短视频时,优先选择 `9:16`。
- 做官网、广告片或横版展示时,选择 `16:9`。
- 对画面连续性要求高的场景,使用首尾帧模式。
- 对成本敏感的批量素材,可先用标准档测试提示词,再决定是否升级到 Pro 或 4K。
- 提示词建议包含主体、动作、镜头、光线、风格和节奏,避免只写抽象描述。
小结
`kling-v3-std-audio` 适合需要带音频短视频生成能力的用户。它覆盖文生视频、图生视频和首尾帧视频三种常见工作流,参数结构清晰,按秒计费,便于开发者和企业将其接入内容生产系统。
常见问题
Kling V3 标准有声怎么收费?
Kling V3 标准有声按秒计费。当前用户侧 Standard Audio 价格为 ¥0.62 / 秒,即 $0.08568 / 秒。最终费用取决于视频时长和所选分辨率版本。
Kling V3 标准有声支持哪些生成方式?
它支持文生视频、图生视频和首尾帧图生视频。对应的 generation_mode 分别为 text_to_video、image_to_video 和 first_last_frame。
Kling V3 标准有声最长可以生成多少秒?
当前支持 3 到 15 秒的视频生成,duration 参数可在 3、4、5 一直到 15 秒之间选择。