Skip to content

语音克隆

通过语音克隆技术,你可以克隆任何声音作为 AI 的音色。

核心亮点

  • 🎤 多种输入:支持上传音频文件或在线录音
  • 🎭 高度还原:音色、语气高度还原
  • 🔄 智能识别:支持音频转文本,自动生成参考文本

语音克隆界面

使用步骤

1. 准备音频

  • 格式:MP3、WAV、M4A、OGG
  • 大小:不超过 10MB
  • 要求:清晰无杂音,安静环境录制

注意

请确保你有权使用该音频,不要用于非法用途。

2. 创建克隆音色

  1. 进入控制台 → AI 设备管理 → 角色管理
  2. 选择要配置的 AI 角色,点击「编辑」
  3. 在角色配置页面,点击「语音克隆」按钮
  4. 填写音色名称(纯英文,如 alice_voice
  5. 选择音频输入方式:
    • 上传文件:拖拽或点击上传音频文件
    • 在线录音:点击开始录音,录制完成后停止
  6. 点击「音频转文本」自动识别音频内容(可选)
  7. 填写参考文本(音频中说话的具体内容)
  8. 点击「开始克隆」

3. 应用到角色

克隆完成后,新音色会自动添加到音色列表中:

  1. 克隆成功后,音色会出现在当前角色的音色选择列表中
  2. 也可以在「音色管理」页面查看所有克隆音色
  3. 其他角色也可以选择使用这个克隆音色

常见问题

克隆效果不好?

  • 确保音频清晰无杂音
  • 参考文本要与音频内容完全一致
  • 在安静环境重新录制

音色名称有什么要求?

  • 必须为纯英文
  • 以字母开头
  • 可包含字母、数字和下划线
  • 长度 2-50 个字符

相关功能

Released under the MIT License.