通过混合两个音频文件来创建混音,生成新的音乐。
uploadUrlList: 必需参数,包含恰好 2 个音频文件 URL 的数组,用于混合生成混音。两个 URL 必须有效且可访问。customMode: 必需参数,启用自定义模式以进行高级音频生成设置prompt: 必需。字符限制按模型:
style: 在自定义模式下必需。字符限制按模型:
title: 在自定义模式下必需。字符限制按模型:
instrumental: 确定音频是否应为纯音乐(无歌词)model: 必需参数,用于音频生成的模型版本vocalGender: 可选参数,生成人声的性别偏好(m 或 f)styleWeight: 可选参数,提供的风格指导权重(0.00–1.00)weirdnessConstraint: 可选参数,创意偏差/新颖性约束(0.00–1.00)audioWeight: 可选参数,输入音频影响的权重(0.00–1.00)callBackUrl: 必需参数,接收任务完成通知的 URL所有接口都需要通过 Bearer Token 方式进行认证。
在请求头中添加:
Authorization: Bearer YOUR_API_KEY⚠️ 注意:
- 请妥善保管您的 API Key,不要泄露给他人
- 如果怀疑 API Key 泄露,请立即在管理页面重置
要混音的音频文件URL数组。必须包含恰好2个URL。每个URL必须是可公开访问的。
2 elements[
"https://example.com/audio1.mp3",
"https://example.com/audio2.mp3"
]确定是否启用高级参数自定义。
true:允许详细控制,对 style 和 title 字段有特定要求。false:简化模式,只需要 prompt,其他参数将被忽略。true
用于生成的AI模型版本。
V5: 更卓越的音乐表现力,生成速度更快。V4_5PLUS:V4.5+ 的音色更丰富,新的创作方式,最长8分钟。V4_5:V4.5 更智能的提示词,更快的生成速度,最长8分钟。V4_5ALL:V4.5ALL 更智能的提示词,更快的生成速度,最长8分钟。V4:V4 改进的人声质量,最长4分钟。V4, V4_5, V4_5PLUS, V4_5ALL, V5 "V4"
用于接收音乐生成任务完成更新的URL地址。所有音乐生成请求都需要此参数。
text(文本生成)、first(第一个音轨完成)、complete(所有音轨完成)text 和 first 阶段,直接返回 complete"https://example.com/callback"
描述所需音频内容的提示词。
customMode: true):必填。提示词将严格作为歌词使用并在生成的音轨中演唱。不同模型的字符限制:
customMode: false):始终必填。提示词作为核心创意,歌词将根据它自动生成(不严格匹配输入),最多500字符。"A calm and relaxing piano track with soft melodies"
生成音频的音乐风格规范。
customMode: true)下可用且必填。定义流派、情绪或艺术方向。"Jazz"
生成音乐曲目的标题。
customMode: true)下可用且必填。"Relaxing Piano"
确定音频是否为纯音乐(无歌词)。
customMode: false)下可用。true
人声性别偏好。
customMode: true)下可用。可选。使用 'm' 表示男声,'f' 表示女声。根据实践,此参数只能增加概率,但不能保证遵循男女声指令。m, f "m"
对指定风格的遵循强度。
customMode: true)下可用。可选。范围 0–1,保留2位小数。0 <= x <= 1必须是以下数值的倍数 0.010.61
控制实验性/创意偏差。
customMode: true)下可用。可选。范围 0–1,保留2位小数。0 <= x <= 1必须是以下数值的倍数 0.010.72
音频特征与其他因素的平衡权重。
customMode: true)下可用。可选。范围 0–1,保留2位小数。0 <= x <= 1必须是以下数值的倍数 0.010.65
请求成功
响应状态码
200, 401, 402, 404, 409, 422, 429, 451, 455, 500 当 code != 200 时的错误消息
"success"