专业级语音输入解决方案,为效率而生
支持 10+ ASR 引擎,覆盖云端与本地:Volcengine、OpenAI、Gemini、DashScope、Elevenlabs、SiliconFlow、Soniox,以及本地 SenseVoice/Paraformer/Zipformer 等
LLM 文本精修,自动标点、格式化,多场景预设提示词,让识别结果更完美
无需切换输入法,任何键盘上都能使用语音输入,支持自动文本插入
零数据收集,支持离线识别,所有数据仅存储在本地,完全掌控你的隐私
看看说点啥能为你做些什么
在说点啥上进行流畅的语音输入,实时识别,精准高效
启用 AI 后处理,一键将识别结果翻译为英文或其他语言
通过小企鹅输入法联动调用说点啥,无缝集成语音识别能力
在任意键盘上通过悬浮球语音输入,按住说话,松开发送
支持主流语音识别服务,包括云端和本地识别,满足不同场景需求:
// 支持灵活配置
{
"engine": "volcengine",
"streaming": true,
"postProcess": true,
"language": "zh-CN"
}
集成 LLM 大语言模型,提供智能文本后处理和编辑功能:
今天天气不错我们句公园散步吧。
今天天气不错,我们去公园散步吧。
采用 Google Material3 设计规范,提供现代化的视觉体验:
浅色模式
深色模式
支持从小企鹅输入法调用说点啥的语音识别能力。使用方式:
选择适合你的版本
完全免费 · 开源
选择你喜欢的方式获取说点啥
从 GitHub 官方源下载
在设置中选择"语音识别设置",选择你想使用的 ASR 服务商,并填入相应的 API 密钥。每个服务商都有详细的配置说明。
支持!使用本地模型 SenseVoice/Paraformer/Zipformer 可实现完全离线识别。首次使用需先下载模型资源。
在设置中开启"语音识别悬浮球",并授予悬浮窗权限和无障碍权限。之后在任何应用中都能通过悬浮球使用语音输入。