主要功能
- 人声增强: 为现有乐器曲目添加人声
- 风格匹配: 生成与上传音频风格和情绪匹配的人声
- 内容控制: 指定人声风格、流派和特征
- 质量筛选: 使用负面标签避免不需要的人声风格
参数使用指南
所有请求的必需参数:uploadUrl
: 有效的乐器音频文件URLprompt
: 所需人声内容和风格的描述title
: 生成的人声曲目标题style
: 音乐和人声风格(例如:“爵士”、“流行”、“古典”)negativeTags
: 要排除的人声风格或特征callBackUrl
: 接收完成通知的URL
可选参数
通过以下参数微调人声生成:vocalGender
: 首选人声性别(‘m’表示男性,‘f’表示女性)styleWeight
: 风格指引权重(0.00-1.00)weirdnessConstraint
: 创意/新颖性约束(0.00-1.00)audioWeight
: 音频一致性权重(0.00-1.00)
音频要求
- 输入类型: 乐器或背景音轨音频文件
- 文件格式: MP3、WAV或其他支持的音频格式
- 质量: 清晰的乐器曲目最适合人声添加
- 可访问性: 确保上传的音频URL是公开可访问的
人声生成过程
- 音频分析: 系统分析上传的乐器曲目
- 风格匹配: 生成与音乐风格互补的人声
- 内容创建: 基于您的提示和风格参数创建人声内容
- 最终混音: 将人声与原始乐器混合
响应信息
- 处理时间: 通常需要2-4分钟,取决于曲目复杂性
- 回调阶段: 可能发生多个回调阶段(text、first、complete)
- 输出: 在原始乐器上添加人声的增强音频
开发者注意事项
- 内容权利: 确保您有使用上传音频的适当权利
- 文件保留: 生成的人声曲目保留15天
- 输入质量: 更高质量的乐器输入产生更好的人声效果
- 风格一致性: AI尝试使人声风格与乐器风格匹配
- 处理时间: 复杂的编排可能需要额外的处理时间
最佳实践
人声增强提示
- 使用清晰、混音良好的乐器曲目以获得最佳效果
- 在提示中具体说明人声风格(例如:“流畅爵士人声”、“充满活力的流行人声”)
- 当您有偏好时指定人声性别
- 使用负面标签避免冲突的人声风格
重要考虑事项
- 系统在具有清晰旋律结构的乐器曲目上效果最佳
- 非常繁忙或密集的乐器编排可能影响人声清晰度
- 确保您的提示描述了所需的人声内容和情绪
- 在描述人声风格时考虑您乐器的调性和节拍
示例用例
- 音乐制作: 为乐器作品添加人声
- 演示创建: 从乐器草图创建人声演示
- 风格探索: 在同一乐器上尝试不同的人声风格
- 内容创建: 为多媒体项目生成人声内容
Authorizations
🔑 API 认证说明
所有接口都需要通过 Bearer Token 方式进行认证。
获取 API Key
- 访问 API Key 管理页面 获取您的 API Key
使用方式
在请求头中添加:
Authorization: Bearer YOUR_API_KEY
⚠️ 注意:
- 请妥善保管您的 API Key,不要泄露给他人
- 如果怀疑 API Key 泄露,请立即在管理页面重置
Body
application/json
Response
请求成功
The response is of type object
.