音色管理
统一管理所有 TTS 模型的音色资源,支持添加系统音色和语音克隆。
核心功能
- 🎵 按模型管理:按 TTS 模型分组显示音色
- 🎤 语音克隆:上传音频克隆定制音色
- 🔊 音色试听:在线试听音色效果
- ✏️ 音色编辑:添加、编辑、删除音色
功能概述
音色管理是独立的功能模块,用于集中管理所有 TTS 模型的音色资源。每个 TTS 模型可以配置多个音色,在创建 AI 角色时可以选择使用。
音色类型
- 系统音色:TTS 服务商提供的预设音色,需要填写音色 ID
- 克隆音色:通过语音克隆技术创建的自定义音色
访问音色管理
- 登录控制台
- 点击左侧菜单「AI 设备管理」→「音色管理」
- 进入音色管理页面
选择 TTS 模型
音色管理页面按 TTS 模型分组显示:
- 在筛选条件区域,选择要管理的 TTS 模型
- 系统会自动加载该模型的音色列表
- 页面显示当前选中的模型名称和音色数量
提示
只有已启用的 TTS 模型才会出现在下拉列表中。如果列表为空,请先在模型配置中启用至少一个 TTS 模型。
音色操作
添加系统音色
为 TTS 模型添加服务商提供的预设音色:
- 选择要配置的 TTS 模型
- 在音色列表中点击「新增音色」按钮
- 填写音色信息:
- 音色名称:自定义的音色名称(如"温柔女声")
- 音色 ID:TTS 服务商提供的音色标识符
- 点击保存
音色 ID 说明
不同 TTS 服务商的音色 ID 格式不同,需要参考服务商文档:
| TTS 服务商 | 音色 ID 示例 | 说明 |
|---|---|---|
| EdgeTTS | zh-CN-XiaoxiaoNeural | 微软 Edge TTS 音色代码 |
| 火山引擎 | BV001_streaming | 火山引擎音色编号 |
| FishSpeech | fish_speech_1 | FishSpeech 音色标识 |
| GPT-SoVITS | speaker_001 | GPT-SoVITS 说话人 ID |
注意
音色 ID 必须与 TTS 服务商的文档完全一致,否则会导致语音合成失败。
编辑音色
修改已有音色的信息:
- 在音色列表中找到要编辑的音色
- 点击「编辑」按钮
- 修改音色名称或音色 ID
- 保存更改
删除音色
删除不需要的音色:
- 在音色列表中找到要删除的音色
- 点击「删除」按钮
- 确认删除操作
注意
删除音色前,请确保没有 AI 角色正在使用该音色。
音色试听
在选择音色前,可以先试听效果:
- 在音色列表中找到要试听的音色
- 点击「试听」按钮
- 系统会播放一段预览语音
- 确认效果后再应用到 AI 角色
语音克隆
通过上传音频文件克隆定制音色。
克隆步骤
- 选择支持克隆的 TTS 模型(如 FishSpeech、GPT-SoVITS)
- 点击页面右上角「克隆音色」按钮
- 在克隆对话框中:
- 填写音色名称(纯英文,如
alice_voice) - 选择音频输入方式(上传文件或在线录音)
- 填写参考文本(音频中说话的内容)
- 填写音色名称(纯英文,如
- 点击「开始克隆」
- 等待克隆完成
音频要求
- 格式:MP3、WAV、M4A、OGG
- 大小:不超过 10MB
- 时长:建议 10-30 秒
- 质量:清晰无杂音,安静环境录制
参考文本
参考文本是音频中说话的具体内容,用于帮助模型更好地学习音色特征:
- 文本需要与音频内容完全一致
- 长度限制:5-500 字符
- 支持使用 ASR 自动识别音频内容
提示
克隆成功后,新音色会自动添加到当前 TTS 模型的音色列表中,可以在 AI 角色配置时选择使用。
→ 详细的语音克隆操作请参考 语音克隆
应用音色到 AI 角色
配置好音色后,需要在 AI 角色中选择使用:
- 进入「AI 角色管理」
- 编辑要配置的 AI 角色
- 在「音色设置」中:
- 选择 TTS 模型
- 从音色列表中选择音色
- 保存配置
常见问题
音色列表为空?
- 检查是否已选择 TTS 模型
- 确认该模型已启用
- 尝试点击「刷新」按钮
音色 ID 在哪里找?
- 查看 TTS 服务商的官方文档
- 通常在服务商的控制台或 API 文档中
- 不同服务商的格式不同,需要准确填写
克隆音色失败?
- 检查 TTS 模型是否支持克隆功能
- 确认音频文件格式和大小符合要求
- 确保参考文本与音频内容一致
- 检查网络连接是否稳定
如何删除克隆的音色?
- 在音色列表中找到克隆的音色
- 点击「删除」按钮即可
- 删除前确保没有角色在使用
