AI 角色管理
在控制台集中管理所有 AI 角色,配置人设提示词、选择模型、设置音色,实现多设备同步。
核心功能
- 🤖 角色配置:设置名称、头像、人设提示词
- 🎯 模型选择:配置 VAD、ASR、LLM、TTS、记忆、意图 6 种模型
- 🎤 音色管理:选择系统音色或克隆专属声音
- ✨ AI 生成:一键生成角色人设提示词
角色配置项
基础信息
| 配置项 | 说明 | 限制 |
|---|---|---|
| 角色名称 | AI 角色的显示名称 | 最多 50 字符 |
| 头像 | 角色头像图片 | 支持 JPG/PNG/GIF,最大 5MB |
| 系统提示词 | 定义角色性格和说话风格 | 最多 2000 字符 |
| 总结记忆提示词 | 用于生成对话总结的提示词 | 最多 2000 字符 |
语音配置
| 配置项 | 说明 |
|---|---|
| 回复语种 | 角色回复使用的语言(中文/英文/日文) |
| 字幕语言 | 设备显示字幕的语言 |
| 唤醒词 | 设备端的语音唤醒词,最多 10 字符 |
| 音色选择 | 从 TTS 模型的音色列表中选择 |
其他配置
| 配置项 | 说明 |
|---|---|
| 聊天历史配置 | 保留的对话历史轮数 |
| 排序 | 角色在列表中的显示顺序 |
| 是否公开 | 公开后其他用户可以使用(仅管理员可设置) |
模型配置
AI 角色需要配置 6 种模型,每种模型负责不同的功能:
| 模型类型 | 说明 | 作用 |
|---|---|---|
| VAD(语音活动检测) | 判断用户是否在说话 | 检测语音开始和结束 |
| ASR(语音识别) | 将语音转换为文字 | 识别用户说的内容 |
| LLM(大语言模型) | 生成对话回复 | 理解问题并生成回答 |
| Intent(意图识别) | 识别用户意图 | 触发特定功能(如播放音乐) |
| Memory(记忆管理) | 管理对话记忆和上下文 | 记住之前的对话内容 |
| TTS(语音合成) | 将文字转换为语音 | 让 AI 角色"说话" |
配置步骤
- 进入角色配置页面
- 在「模型配置」区域,依次选择各类型模型
- 每种类型会显示已启用的模型列表
- 选择合适的模型后保存
注意
- 必须为每种类型选择一个模型,否则角色无法正常工作
- 模型需要先在「模型管理」中添加并启用
- 选择 TTS 模型后,才能选择对应的音色
AI 生成提示词
控制台支持使用 AI 自动生成系统提示词,帮助你快速创建角色人设。
使用步骤
- 填写角色名称(如「萌系猫娘」)
- 点击系统提示词旁边的「AI 生成」按钮
- 等待 AI 生成完整的系统提示词
- 在生成的基础上进行修改和调整
- 保存配置
提示词编写建议
如果你想手动编写提示词,可以参考以下结构:
- 角色设定:萌系姓名、二次元身份设定、萌属性
- 语言指定:明确指定「用中文/英文/日文回答」
- 语气风格:傲娇/天然呆/元气/腹黑/温柔系等
- 口癖设定:如「喵~」、「呐~」、「嘛~」等专属语气词
- 回答长度:建议限制字数以适配设备显示
- 特殊设定:如称呼主人、特定反应模式等
提示
AI 生成功能需要后台配置 Dify 服务,如果生成失败请联系管理员检查配置。
语音克隆
语音克隆功能让你可以创建专属的 AI 声音,让角色拥有独特的音色。
前提条件
- TTS 模型必须支持克隆功能(如 FishSpeech、GPT-SoVITS)
- 需要准备一段清晰的音频样本
音频输入方式
方式一:上传文件
- 支持格式:MP3、WAV、M4A、OGG
- 文件大小:最大 10MB
- 建议时长:10-30 秒
方式二:在线录音
- 点击「开始录音」按钮
- 录音过程中会显示音频可视化
- 录音完成后可以预览播放
克隆步骤
- 在角色配置页面,点击「语音克隆」按钮
- 选择支持克隆的 TTS 模型
- 输入音色名称(纯英文,如
alice_voice) - 上传音频文件或在线录音
- 填写参考文本(5-500 字符)
- 可点击「音频转文本」自动识别
- 点击「开始克隆」
- 克隆成功后,新音色会自动添加到音色列表
参考文本说明
参考文本是音频中说话的内容,用于帮助模型更好地学习音色特征。
- 文本需要与音频内容一致
- 长度限制:5-500 字符
- 支持使用 ASR 自动识别音频内容
注意
- 音色名称必须以字母开头,只能包含英文字母、数字和下划线
- 克隆质量取决于音频清晰度,建议使用安静环境录制
- 不同 TTS 模型的克隆效果可能有差异
音色选择与试听
选择 TTS 模型后,可以为角色选择合适的音色。
音色类型
- 系统音色:TTS 模型自带的预设音色
- 克隆音色:通过语音克隆创建的自定义音色
音色管理
音色资源在独立的「音色管理」页面统一管理:
- 按 TTS 模型分组显示
- 添加/编辑/删除音色
- 音色试听功能
→ 详细操作请参考 音色管理
试听功能
- 选择音色后,点击「试听」按钮
- 系统会播放一段预览语音
- 确认音色效果后保存配置
权限控制
角色权限
| 用户类型 | 权限 |
|---|---|
| 管理员 | 可编辑所有角色,可设置公开状态 |
| 创建者 | 可编辑自己创建的角色 |
| 普通用户 | 只能查看公开角色,无法编辑 |
公开角色
- 管理员可以将角色设置为「公开」
- 公开角色对所有用户可见
- 其他用户可以使用公开角色,但无法编辑
角色操作
复制角色
- 在角色列表点击「复制」按钮
- 系统会创建一个角色副本
- 副本会自动添加到你的角色列表
- 可以在副本基础上修改配置
删除角色
- 在角色列表点击「删除」按钮
- 确认删除操作
- 删除后无法恢复
注意
保存配置后,需要重启设备,新的配置才会生效。
