Files
speech-tts/README.md
2026-03-28 20:23:03 +08:00

198 lines
4.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# MiniMax TTS 文字转语音工具
> 基于 MiniMax API 的文字转语音 Web 界面,单 HTML 文件,开箱即用。
---
## 🚀 推广
**MiniMax Token Plan 惊喜上线!** 新增语音、音乐、视频和图片生成权益。邀请好友享双重好礼,助力开发体验!
好友立享 **9折** 专属优惠 + Builder 权益,你赢返利 + 社区特权!
👉 立即参与https://platform.minimaxi.com/subscribe/token-plan?code=6DMYqmSJX2&source=link
---
## 功能特性
- 🌐 支持 MiniMax 全部 TTS 模型speech-2.8-hd、speech-02-hd 等)
- 🔄 支持 hex 音频流实时播放(自动解码)
- 📦 支持下载为 .wav 文件
- ⚙️ 实时调节语速
- 🎯 自动携带认证头
---
## 安装部署(三种方式任选其一)
### 方式一:直接用(推荐小白)
直接用浏览器打开 HTML 文件,无需任何安装:
1. 下载 `speech-t2a.html` 文件
2. 双击用浏览器Chrome/Edge/Firefox打开即可
---
### 方式二Python 一键启动(最简单)
适合有 Python 环境的用户Windows/Mac/Linux 通用):
**步骤:**
1. 下载本项目,解压到任意目录
2. 打开终端/命令行,进入项目目录:
```bash
# Windows 用户:按 Win+R输入 cmd然后
cd C:\path\to\speech-t2a
# Mac/Linux 用户:打开终端,输入:
cd /path/to/speech-t2a
```
3. 运行启动命令:
```bash
python3 -m http.server 8197
```
4. 打开浏览器,访问:**http://localhost:8197/speech-t2a.html**
> ⚠️ 关闭终端会停止服务,需要保持窗口开启
---
### 方式三Nginx 部署(适合有服务器的用户)
适合有云服务器、软路由、NAS 等设备的用户,可长期运行:
**步骤:**
1.`speech-t2a.html` 上传到服务器,例如 `/var/www/speech-t2a/`
2. 编辑 Nginx 配置:
```bash
sudo vim /etc/nginx/conf.d/speech-t2a.conf
```
3. 写入以下配置:
```nginx
server {
listen 8197;
server_name 你的域名或IP;
# 静态文件目录
root /var/www/speech-t2a;
index speech-t2a.html;
# 允许浏览器访问
location / {
try_files $uri $uri/ =404;
add_header Access-Control-Allow-Origin *;
}
}
```
4. 重启 Nginx
```bash
# 测试配置是否正确
sudo nginx -t
# 重启服务
sudo systemctl restart nginx
```
5. 访问:**http://你的服务器IP:8197/speech-t2a.html**
> 💡 阿里云/腾讯云等云服务器需在安全组开放 `8197` 端口
---
## API 申请与配置
### 1. 获取 MiniMax API Key
1. 访问 [MiniMax 开放平台](https://platform.minimaxi.com/)使用置顶链接可以立减百分之10
2. 注册并登录
3. 进入控制台 → API Key → 创建新 Key
4. 复制 Key格式类似 `Group-xxxxxxxxxxxxxxxx`
### 2. 填写到页面
1. 打开页面后,找到 **「API Key」** 输入框
2. 粘贴你的 Key
3. 点击 **「保存」** 或直接使用
---
## 模型说明
| 模型 | 说明 | 推荐场景 |
|------|------|---------|
| `speech-2.8-hd` | 高清音质 | 通用场景(推荐) |
| `speech-2.6-hd` | 高清音质 | 备用选择 |
| `speech-2.8-turbo` | 快速生成 | 追求速度 |
| `speech-2.6-turbo` | 快速生成 | 追求速度 |
| `speech-02-hd` | 克隆音质 | 声音克隆 |
| `speech-02-turbo` | 克隆快速 | 声音克隆 |
---
## 使用流程
```
1. 打开页面
2. 填写 API Key
3. 输入要转语音的文字
4. 选择语速(默认 1.0
5. 点击「生成」
6. 等待播放 / 下载音频
```
---
## 常见问题
### Q: 播放没声音?
- 检查浏览器是否允许页面播放音频
- 确认 API Key 填写正确
- 查看浏览器控制台F12是否有报错
### Q: 生成失败?
- 确认 API Key 有效且有余额
- 检查网络是否能访问 MiniMax API
- 确认文字内容不为空
### Q: 音频是 hex 编码无法播放?
- 这是正常现象,页面会自动解码并播放
- 如需原始文件,点击「下载」按钮
### Q: 如何长期运行不丢服务?
- 推荐用 **Nginx 部署**(方式三)
- 或使用 PM2、Systemd 等进程管理工具
---
## 技术信息
- **单文件**:仅需一个 HTML 文件,无需后端
- **跨平台**:浏览器支持的系统都能用
- **离线可用**:页面加载后即可离线生成(需已填 API Key
- **API 端点**`https://api.minimaxi.com/v1/t2a_v2`
- **备用端点**`https://api-bj.minimaxi.com/v1/t2a_v2`
---
## 截图
![MiniMax TTS](screenshot.png)