🎵 语音合成

支持多种音色、情绪、语速调节的文本转语音服务

🎵

合成设置

中文声调:1一声 2二声 3三声 4四声 5轻声 · 英文IPA · 日文假名 · 文本替换均支持

语音控制
0.5-2
0-10
-12~12
🎛️仅 2.8
🎚️音频设置
🎤

音色选择

🎵

生成结果

🎵

选择音色,输入文本后生成语音

✨ 使用指南

掌握 MiniMax TTS 高级功能,打造自然生动的语音合成

💡

核心功能

MiniMax TTS 支持多种高级语音控制功能。通过情绪控制、语气词标签、停顿控制、内联发音、发音词典等功能,生成自然生动的语音。 支持 9 种情绪、18 种语气词、内联拼音/IPA/粤拼、自定义词典、停顿时长等。

今天是不是很开心呀(laughs),当然了!<#1#>让我来为你介绍一下。

😊
情绪控制

9种情绪让语音更生动

happy - 高兴、sad - 悲伤、angry - 愤怒

fearful - 害怕、surprised - 惊讶、disgusted - 厌恶

calm - 中性、fluent - 生动、whisper - 低语

🎭
语气词标签

18种语气词让语音更自然

笑声:(laughs)(chuckle) 轻笑

呼吸:(breath) 换气、(inhale) 吸气、(exhale) 呼气

其他:(coughs) 咳嗽、(sighs) 叹气、(sneezes) 喷嚏

⏸️
停顿控制

精确控制语音停顿时长

使用 <#x#> 标记控制停顿,x 为停顿时长(秒)

示例:你好<#1.5#>世界 → 停顿1.5秒

📖
发音控制

内联临时覆盖 + 词典全局生效

📝 内联 — 括号直接写在文本中

(he2)平 拼音 · (lɪv) IPA · (sung3) 粤拼

覆盖单次出现

📖 词典 — 在下方输入框配置

处理/(chu3)(li3) · 20日/はつか · omg/oh my god

规则全局生效

📋

示例与说明

🎭 综合示例 (需 speech-2.8)

内联发音 + 语气词 + 停顿 + 发音词典同时生效:

"The word live is pronounced (lɪv) as a verb and (laɪv) as an adjective. 今天是不是很开心呀(laughs),当然了!<#1#>让我来为你介绍一下。"

⚠️ 注意事项

使用规则

• 内联发音只覆盖单次出现,多处多音字用发音词典
• 发音词典全局生效,匹配所有出现位置
• 停顿标记需在可发音文本之间,不可连续使用
• 文本不超过 10000 字符,换行分隔段落
• 粤语需设语言增强为 Chinese,Yue

模型差异

speech-2.8 语气词 · 情绪 · 内联发音 · 词典 · 音色微调 · 混合音色

⚠️ 情绪不支持 whisper

speech-2.6 不支持语气词、音色微调

✅ 独有 fluent 生动 · whisper 低语