speech-tts/README.md

# MiniMax TTS 文字转语音工具

> 基于 MiniMax API 的文字转语音 Web 界面，单 HTML 文件，开箱即用。

---

## 🚀 推广

**MiniMax Token Plan 惊喜上线！** 新增语音、音乐、视频和图片生成权益。邀请好友享双重好礼，助力开发体验！

好友立享 **9折** 专属优惠 + Builder 权益，你赢返利 + 社区特权！

👉 立即参与：https://platform.minimaxi.com/subscribe/token-plan?code=6DMYqmSJX2&source=link

---

## 功能特性

- 🌐 支持 MiniMax 全部 TTS 模型（speech-2.8-hd、speech-02-hd 等）
- 🔄 支持 hex 音频流实时播放（自动解码）
- 📦 支持下载为 .wav 文件
- ⚙️ 实时调节语速
- 🎯 自动携带认证头

---

## 安装部署（三种方式任选其一）

### 方式一：直接用（推荐小白）

直接用浏览器打开 HTML 文件，无需任何安装：

1. 下载 `speech-t2a.html` 文件
2. 双击用浏览器（Chrome/Edge/Firefox）打开即可

---

### 方式二：Python 一键启动（最简单）

适合有 Python 环境的用户（Windows/Mac/Linux 通用）：

**步骤：**

1. 下载本项目，解压到任意目录
2. 打开终端/命令行，进入项目目录：

```bash
# Windows 用户：按 Win+R，输入 cmd，然后：
cd C:\path\to\speech-t2a

# Mac/Linux 用户：打开终端，输入：
cd /path/to/speech-t2a
```

3. 运行启动命令：

```bash
python3 -m http.server 8197
```

4. 打开浏览器，访问：**http://localhost:8197/speech-t2a.html**

> ⚠️ 关闭终端会停止服务，需要保持窗口开启

---

### 方式三：Nginx 部署（适合有服务器的用户）

适合有云服务器、软路由、NAS 等设备的用户，可长期运行：

**步骤：**

1. 将 `speech-t2a.html` 上传到服务器，例如 `/var/www/speech-t2a/`
2. 编辑 Nginx 配置：

```bash
sudo vim /etc/nginx/conf.d/speech-t2a.conf
```

3. 写入以下配置：

```nginx
server {
    listen 8197;
    server_name 你的域名或IP;

    # 静态文件目录
    root /var/www/speech-t2a;
    index speech-t2a.html;

    # 允许浏览器访问
    location / {
        try_files $uri $uri/ =404;
        add_header Access-Control-Allow-Origin *;
    }
}
```

4. 重启 Nginx：

```bash
# 测试配置是否正确
sudo nginx -t

# 重启服务
sudo systemctl restart nginx
```

5. 访问：**http://你的服务器IP:8197/speech-t2a.html**

> 💡 阿里云/腾讯云等云服务器需在安全组开放 `8197` 端口

---

## API 申请与配置

### 1. 获取 MiniMax API Key

1. 访问 [MiniMax 开放平台](https://platform.minimaxi.com/)使用置顶链接可以立减百分之10
2. 注册并登录
3. 进入控制台 → API Key → 创建新 Key
4. 复制 Key（格式类似 `Group-xxxxxxxxxxxxxxxx`）

### 2. 填写到页面

1. 打开页面后，找到 **「API Key」** 输入框
2. 粘贴你的 Key
3. 点击 **「保存」** 或直接使用

---

## 模型说明

| 模型 | 说明 | 推荐场景 |
|------|------|---------|
| `speech-2.8-hd` | 高清音质 | 通用场景（推荐） |
| `speech-2.6-hd` | 高清音质 | 备用选择 |
| `speech-2.8-turbo` | 快速生成 | 追求速度 |
| `speech-2.6-turbo` | 快速生成 | 追求速度 |
| `speech-02-hd` | 克隆音质 | 声音克隆 |
| `speech-02-turbo` | 克隆快速 | 声音克隆 |

---

## 使用流程

```
1. 打开页面
      ↓
2. 填写 API Key
      ↓
3. 输入要转语音的文字
      ↓
4. 选择语速（默认 1.0）
      ↓
5. 点击「生成」
      ↓
6. 等待播放 / 下载音频
```

---

## 常见问题

### Q: 播放没声音？
- 检查浏览器是否允许页面播放音频
- 确认 API Key 填写正确
- 查看浏览器控制台（F12）是否有报错

### Q: 生成失败？
- 确认 API Key 有效且有余额
- 检查网络是否能访问 MiniMax API
- 确认文字内容不为空

### Q: 音频是 hex 编码无法播放？
- 这是正常现象，页面会自动解码并播放
- 如需原始文件，点击「下载」按钮

### Q: 如何长期运行不丢服务？
- 推荐用 **Nginx 部署**（方式三）
- 或使用 PM2、Systemd 等进程管理工具

---

## 技术信息

- **单文件**：仅需一个 HTML 文件，无需后端
- **跨平台**：浏览器支持的系统都能用
- **离线可用**：页面加载后即可离线生成（需已填 API Key）
- **API 端点**：`https://api.minimaxi.com/v1/t2a_v2`
- **备用端点**：`https://api-bj.minimaxi.com/v1/t2a_v2`

---

## 截图

![MiniMax TTS](screenshot.png)