🎵 语音合成
支持多种音色、情绪、语速调节的文本转语音服务
合成设置
中文声调:1一声 2二声 3三声 4四声 5轻声 · 英文IPA · 日文假名 · 文本替换均支持
⚡语音控制
🎚️音频设置
音色选择
生成结果
选择音色,输入文本后生成语音
✨ 使用指南
掌握 MiniMax TTS 高级功能,打造自然生动的语音合成
核心功能
MiniMax TTS 支持多种高级语音控制功能。通过情绪控制、语气词标签、停顿控制、内联发音、发音词典等功能,生成自然生动的语音。 支持 9 种情绪、18 种语气词、内联拼音/IPA/粤拼、自定义词典、停顿时长等。
✓今天是不是很开心呀(laughs),当然了!<#1#>让我来为你介绍一下。
情绪控制
9种情绪让语音更生动
happy - 高兴、sad - 悲伤、angry - 愤怒
fearful - 害怕、surprised - 惊讶、disgusted - 厌恶
calm - 中性、fluent - 生动、whisper - 低语
语气词标签
18种语气词让语音更自然
笑声:(laughs)、(chuckle) 轻笑
呼吸:(breath) 换气、(inhale) 吸气、(exhale) 呼气
其他:(coughs) 咳嗽、(sighs) 叹气、(sneezes) 喷嚏
停顿控制
精确控制语音停顿时长
使用 <#x#> 标记控制停顿,x 为停顿时长(秒)
示例:你好<#1.5#>世界 → 停顿1.5秒
发音控制
内联临时覆盖 + 词典全局生效
📝 内联 — 括号直接写在文本中
(he2)平 拼音 · (lɪv) IPA · (sung3) 粤拼
覆盖单次出现
📖 词典 — 在下方输入框配置
处理/(chu3)(li3) · 20日/はつか · omg/oh my god
规则全局生效
示例与说明
🎭 综合示例 (需 speech-2.8)
内联发音 + 语气词 + 停顿 + 发音词典同时生效:
"The word live is pronounced (lɪv) as a verb and (laɪv) as an adjective. 今天是不是很开心呀(laughs),当然了!<#1#>让我来为你介绍一下。"
⚠️ 注意事项
使用规则
• 内联发音只覆盖单次出现,多处多音字用发音词典
• 发音词典全局生效,匹配所有出现位置
• 停顿标记需在可发音文本之间,不可连续使用
• 文本不超过 10000 字符,换行分隔段落
• 粤语需设语言增强为 Chinese,Yue
模型差异
⚠️ 情绪不支持 whisper
✅ 独有 fluent 生动 · whisper 低语