音色管理

统一管理所有 TTS 模型的音色资源，支持添加系统音色和语音克隆。

核心功能

🎵 按模型管理：按 TTS 模型分组显示音色
🎤 语音克隆：上传音频克隆定制音色
🔊 音色试听：在线试听音色效果
✏️ 音色编辑：添加、编辑、删除音色

功能概述

音色管理是独立的功能模块，用于集中管理所有 TTS 模型的音色资源。每个 TTS 模型可以配置多个音色，在创建 AI 角色时可以选择使用。

音色类型

系统音色：TTS 服务商提供的预设音色，需要填写音色 ID
克隆音色：通过语音克隆技术创建的自定义音色

访问音色管理

登录控制台
点击左侧菜单「AI 设备管理」→「音色管理」
进入音色管理页面

选择 TTS 模型

音色管理页面按 TTS 模型分组显示：

在筛选条件区域，选择要管理的 TTS 模型
系统会自动加载该模型的音色列表
页面显示当前选中的模型名称和音色数量

提示

只有已启用的 TTS 模型才会出现在下拉列表中。如果列表为空，请先在模型配置中启用至少一个 TTS 模型。

音色操作

添加系统音色

为 TTS 模型添加服务商提供的预设音色：

选择要配置的 TTS 模型
在音色列表中点击「新增音色」按钮
填写音色信息：
- 音色名称：自定义的音色名称（如"温柔女声"）
- 音色 ID：TTS 服务商提供的音色标识符
点击保存

音色 ID 说明

不同 TTS 服务商的音色 ID 格式不同，需要参考服务商文档：

TTS 服务商	音色 ID 示例	说明
EdgeTTS	`zh-CN-XiaoxiaoNeural`	微软 Edge TTS 音色代码
火山引擎	`BV001_streaming`	火山引擎音色编号
FishSpeech	`fish_speech_1`	FishSpeech 音色标识
GPT-SoVITS	`speaker_001`	GPT-SoVITS 说话人 ID

注意

音色 ID 必须与 TTS 服务商的文档完全一致，否则会导致语音合成失败。

编辑音色

修改已有音色的信息：

在音色列表中找到要编辑的音色
点击「编辑」按钮
修改音色名称或音色 ID
保存更改

删除音色

删除不需要的音色：

在音色列表中找到要删除的音色
点击「删除」按钮
确认删除操作

注意

删除音色前，请确保没有 AI 角色正在使用该音色。

音色试听

在选择音色前，可以先试听效果：

在音色列表中找到要试听的音色
点击「试听」按钮
系统会播放一段预览语音
确认效果后再应用到 AI 角色

语音克隆

通过上传音频文件克隆定制音色。

克隆步骤

选择支持克隆的 TTS 模型（如 FishSpeech、GPT-SoVITS）
点击页面右上角「克隆音色」按钮
在克隆对话框中：
- 填写音色名称（纯英文，如 alice_voice）
- 选择音频输入方式（上传文件或在线录音）
- 填写参考文本（音频中说话的内容）
点击「开始克隆」
等待克隆完成

音频要求

格式：MP3、WAV、M4A、OGG
大小：不超过 10MB
时长：建议 10-30 秒
质量：清晰无杂音，安静环境录制

参考文本

参考文本是音频中说话的具体内容，用于帮助模型更好地学习音色特征：

文本需要与音频内容完全一致
长度限制：5-500 字符
支持使用 ASR 自动识别音频内容

提示

克隆成功后，新音色会自动添加到当前 TTS 模型的音色列表中，可以在 AI 角色配置时选择使用。

→ 详细的语音克隆操作请参考语音克隆

应用音色到 AI 角色

配置好音色后，需要在 AI 角色中选择使用：

进入「AI 角色管理」
编辑要配置的 AI 角色
在「音色设置」中：
- 选择 TTS 模型
- 从音色列表中选择音色
保存配置

常见问题

音色列表为空？

检查是否已选择 TTS 模型
确认该模型已启用
尝试点击「刷新」按钮

音色 ID 在哪里找？

查看 TTS 服务商的官方文档
通常在服务商的控制台或 API 文档中
不同服务商的格式不同，需要准确填写

克隆音色失败？

检查 TTS 模型是否支持克隆功能
确认音频文件格式和大小符合要求
确保参考文本与音频内容一致
检查网络连接是否稳定

如何删除克隆的音色？

在音色列表中找到克隆的音色
点击「删除」按钮即可
删除前确保没有角色在使用

音色管理 ​

功能概述 ​

音色类型 ​

访问音色管理 ​

选择 TTS 模型 ​

音色操作 ​

添加系统音色 ​

音色 ID 说明 ​

编辑音色 ​

删除音色 ​

音色试听 ​

语音克隆 ​

克隆步骤 ​

音频要求 ​

参考文本 ​

应用音色到 AI 角色 ​

常见问题 ​

相关功能 ​