语音克隆

通过语音克隆技术，你可以克隆任何声音作为 AI 的音色。

核心亮点

🎤 多种输入：支持上传音频文件或在线录音
🎭 高度还原：音色、语气高度还原
🔄 智能识别：支持音频转文本，自动生成参考文本

语音克隆界面

使用步骤

1. 准备音频

格式：MP3、WAV、M4A、OGG
大小：不超过 10MB
要求：清晰无杂音，安静环境录制

注意

请确保你有权使用该音频，不要用于非法用途。

2. 创建克隆音色

进入控制台 → AI 设备管理 → 角色管理
选择要配置的 AI 角色，点击「编辑」
在角色配置页面，点击「语音克隆」按钮
填写音色名称（纯英文，如 alice_voice）
选择音频输入方式：
- 上传文件：拖拽或点击上传音频文件
- 在线录音：点击开始录音，录制完成后停止
点击「音频转文本」自动识别音频内容（可选）
填写参考文本（音频中说话的具体内容）
点击「开始克隆」

3. 应用到角色

克隆完成后，新音色会自动添加到音色列表中：

克隆成功后，音色会出现在当前角色的音色选择列表中
也可以在「音色管理」页面查看所有克隆音色
其他角色也可以选择使用这个克隆音色

常见问题

克隆效果不好？

确保音频清晰无杂音
参考文本要与音频内容完全一致
在安静环境重新录制

音色名称有什么要求？

必须为纯英文
以字母开头
可包含字母、数字和下划线
长度 2-50 个字符

相关功能

AI 角色管理 - 配置 AI 角色
音色管理 - 管理所有音色资源
模型配置 - 配置 TTS 模型