返回顶部
m

moss-tts-voice

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.2.2
安全检测
已通过
905
下载量
7
收藏
概述
安装方式
版本历史

moss-tts-voice

# MOSS-TTS 语音合成 > ⚠️ **注意**:本工具负责生成音频文件,发送到各渠道需要配合其他工具(如 OpenClaw message 工具) ## 快速开始(3 步) ### 1. 获取 API Key 访问 https://studio.mosi.cn → 注册/登录 → 控制台 → API 密钥 → 创建 ```bash export MOSS_API_KEY="sk-你的密钥" ``` ### 2. 安装依赖 ```bash # 系统依赖 brew install python3 ffmpeg # Python 依赖 pip3 install requests ``` ### 3. 生成语音 ```bash python3 scripts/tts.py \ --text "你好,我是MOSS" \ --channel feishu \ --json ``` 输出: ```json { "success": true, "file": "/tmp/openclaw/moss-tts/voice-xxx.ogg", "format": "ogg" } ``` --- ## ⚠️ 隐私与安全 ### API Key 安全 - **不要提交到 Git**:将 `MOSS_API_KEY` 添加到 `.gitignore` - **使用环境变量**:不要在代码中硬编码密钥 - **定期轮换**:建议定期更换 API Key ### 语音数据上传 - **克隆音色**:上传的音频会存储在 MOSS Studio 服务器 - **实时克隆**:每次请求都会上传音频数据到 MOSS API - **数据保留**:参考 MOSS Studio 隐私政策 **建议**: - 使用公开/非敏感音频进行克隆 - 避免上传包含敏感信息的录音 - 定期清理 MOSS Studio 中不需要的音色 --- ## 功能说明 本工具提供以下功能: 1. **文本转语音** - 将文本转换为自然语音 2. **实时克隆** - 从音频即时克隆声音 3. **预注册音色** - 上传并保存音色供后续使用 4. **格式转换** - 自动转换为适合各渠道的格式 **不包含**: - 直接发送到 IM 渠道(需要配合其他工具) - 音色管理(删除、修改等) --- ## 使用模式 ### 模式一:实时克隆 ```bash python3 scripts/tts.py \ --text "要说的内容" \ --reference_audio "参考音频.ogg" \ --channel feishu ``` ### 模式二:预注册音色(推荐) ```bash # 1. 上传并克隆 curl -X POST https://studio.mosi.cn/api/v1/files/upload \ -H "Authorization: Bearer $MOSS_API_KEY" \ -F "file=@voice.ogg" # → {"file_id": "YOUR_FILE_ID"} curl -X POST https://studio.mosi.cn/api/v1/voice/clone \ -H "Authorization: Bearer $MOSS_API_KEY" \ -d '{"file_id": "YOUR_FILE_ID", "name": "我的声音"}' # → {"voice_id": "YOUR_VOICE_ID"} # 2. 使用(等待 10 秒后) python3 scripts/tts.py \ --text "你好" \ --voice_id "YOUR_VOICE_ID" \ --channel feishu ``` --- ## 输出格式 | 渠道 | 格式 | 说明 | |------|------|------| | feishu | ogg (opus) | 飞书语音消息格式 | | telegram | ogg (opus) | Telegram 语音消息格式 | | whatsapp | ogg (opus) | WhatsApp 语音消息格式 | | discord | mp3 | Discord 文件格式 | | signal | mp3 | Signal 文件格式 | | slack | mp3 | Slack 文件格式 | --- ## 参数说明 | 参数 | 说明 | 必填 | |------|------|------| | `--text` | 待合成文本 | ✅ | | `--reference_audio` | 参考音频(实时克隆) | 二选一 | | `--voice_id` | 预注册音色 ID | 二选一 | | `--channel` | 目标渠道 | ❌ | | `--format` | 输出格式 | ❌ | | `--output` | 输出路径 | ❌ | | `--json` | JSON 输出 | ❌ | --- ## 音频要求 - **格式**: ogg, mp3, wav, m4a - **时长**: 10-30 秒(推荐 20 秒以上) - **音质**: 清晰人声,无背景噪音 - **大小**: < 10MB --- ## 常见问题 ### Q: 如何发送生成的语音? 本工具只生成音频文件。发送需要: 1. 使用返回的文件路径 2. 配合 OpenClaw message 工具或其他方式发送 ### Q: 飞书发送后是文件而不是语音? 确保音频格式正确: ```bash file voice.ogg # 应显示: Ogg data, Opus audio ``` ### Q: 克隆效果不好? - 时长 20 秒以上 - 清晰人声,无噪音 - 正常语速 --- ## API 端点 | 用途 | 端点 | |------|------| | 文本转语音 | `POST /v1/audio/tts` | | 上传文件 | `POST /api/v1/files/upload` | | 克隆音色 | `POST /api/v1/voice/clone` | | 查询音色 | `GET /api/v1/voices` | --- ## 详细文档 - [API 技术细节](references/api-guide.md) - [渠道格式说明](references/channel-formats.md) - [问题排查](references/troubleshooting.md) --- _版本: 1.2.0 | 更新: 2026-03-10_

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 moss-tts-voice-1776277703 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 moss-tts-voice-1776277703 技能

通过命令行安装

skillhub install moss-tts-voice-1776277703

下载 Zip 包

⬇ 下载 moss-tts-voice v1.2.2

文件大小: 12.99 KB | 发布时间: 2026-4-16 17:39

v1.2.2 最新 2026-4-16 17:39
fix some bug in tts.py

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部