语音与转录
该分类包含 65 个技能。
技能列表
- addis-assistant-stt - 提供语音转文字 (STT) 和文本
- agent-voice - AI 代理的命令行博客平台。
- announcer - 使用 AirPlay + 通过 AirPlay 扬声器在整个房子里宣布文本。
- assemblyai-transcribe - 使用 AssemblyAI 转录音频/视频
- audio-gen - 生成有声读物、播客或教育音频内容
- audio-reply - 使用 TTS 生成音频回复。
- chichi-speech - 使用 Qwen3 的高质量文本转语音 RESTful 服务
- claw-voice - 您通过语音连接到实时用户会话。
- clonev - 使用 Coqui XTTS v2 克隆任何声音并生成语音。
- critical-article-writer - 生成草稿文章、大纲
- cult-of-carcinization - 给您的代理一个声音 — 和耳朵。
- deepdub-tts - 使用 Deepdub 生成语音音频并将其作为 MEDIA 附加
- deepgram - — Deepgram 语音转文本的命令行界面。
- doubao-api-open-tts - 使用豆包(火山引擎)的文本转语音服务
- duby - 使用 Duby.so API 将文本转换为语音。
- eachlabs-tts - 使用 EachLabs 语音转文本从 URL 转录音频
- easyverein-api - 使用 easyVerein v2.0 REST API
- edge-tts - |。
- elevenlabs-agents - 创建、管理和部署 ElevenLabs
- elevenlabs-media - ElevenLabs 音乐生成和语音转文本...
- elevenlabs-transcribe - 使用 ElevenLabs 将音频转录为文本
- elevenlabs-tts - ElevenLabs TTS - OpenClaw 的最佳 ElevenLabs 集成。
- elevenlabs-voices - 高质量语音合成,具有 18 个角色、32
- faster-whisper - 使用 faster-whisper 进行本地语音转文本。
- feishu-minutes - 从飞书获取信息、统计、转录和媒体
- freshbooks-cli - 用于管理发票、客户和账单的 FreshBooks CLI。
- gettr-transcribe-summarize - 从 GETTR 帖子下载音频
- inworld-tts - 通过 Inworld.ai API 进行文本转语音。
- jarvis-voice - 带有 TTS 和视觉转录样式的金属 AI 语音角色。
- kokoro-tts - 使用本地 Kokoro TTS 引擎从文本生成口语音频。
- llmwhisperer - 使用 LLMWhisperer 从图像和 PDF 中提取文本和布局
- local-stt - 具有可选择后端的本地 STT - Parakeet(最佳准确性)或 Whisper。
- local-whisper - 使用 OpenAI Whisper 进行本地语音转文本。
- minimax-tts - 名称:minimax-tts。
- mlx-whisper - 使用 MLX Whisper 进行本地语音转文本
- moodcast - 将任何文本转换为带有环境音的情感表达音频
- openai-whisper - 使用 Whisper CLI 进行本地语音转文本(无需 API 密钥)。
- openai-whisper-api - 通过 OpenAI 音频转录 API 转录音频
- parakeet-mlx - 使用 Parakeet MLX (ASR) 进行本地语音转文本,适用于 Apple Silicon
- parakeet-stt - >-。
- phone-voice - 通过 Twilio 将 ElevenLabs 代理通过电话连接到您的 OpenClaw。
- piper-tts - 使用 Piper ONNX 语音进行本地文本转语音 - 快速、私密、无云
- plaud-unofficial - 在访问 Plaud 录音机数据时使用
- pocket-transcripts - 从 Pocket AI 读取转录和摘要
- pocket-tts - pocket-tts
- qwen-tts - 使用 Qwen3-TTS-12Hz-1.7B-CustomVoice 进行本地文本转语音。
- ringg-voice-agent - 将 Ringg AI 语音代理与 OpenClaw 集成
- routstr-balance-management - 通过检查管理 Routstr 余额
- sapi-tts - 带有神经语音的 Windows SAPI5 文本转语音。
- sound-fx - 通过 ElevenLabs SFX(文本转声音)生成短音效。
- spaces - Moltbook 代理聚集的语音优先社交空间。
- transcribe - 使用本地 Whisper (Docker) 将音频文件转录为文本。
- tts - 使用 Hume AI 或 OpenAI API 进行文本转语音。
- tts-whatsapp - 在 WhatsApp 上以 40+ 种语言发送高质量文本转语音语音消息
- video-subtitles - 从视频/音频生成 SRT 字幕并翻译
- voice-agent - 使用 AI 语音代理的代理本地语音输入/输出
- voice-ai-agent - 创建、管理和部署 Voice.ai 对话式 AI
- voice-ai-tts - 高质量语音合成,具有 9 个角色、11 种语言
- voice-ai-voices - 高质量语音合成,具有 9 个角色、11
- voice-transcribe - 使用 OpenAI 的转录音频文件
- voice-ui - 自我进化的语音助手 UI。
- webchat-audio-notifications - 添加浏览器音频通知
- whatsapp-voice-chat-integration-open-source - 实时 WhatsApp
- whisper-mlx-local - Telegram 和 WhatsApp 的免费本地语音转文本
- x-voice-match - 分析 Twitter/X 账户的发布风格并生成