作者:大学叔
链接:https://www.zhihu.com/question/47684138/answer/2010504031798309205
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

自己开源的vocotype语音输入,用起来贼爽!!!大小只有10MB,而且有AI优化功能。最近帮我我节省超过20个小时,真的是提高效率的神,强烈推荐!

刚开始vibe coding的时候,要提供给AI的上下文越多越好,但是打字的时间成本实在是太高了,所以做了个语音输入工具;能在所有有文本框的地方进行语音输入,我现在回答这个问题就在进行语音输入

开源地址:github.com/233stone/voc

官网:VocoType – 安全、离线的极速语音输入法

语音输入最重要的两个就是准确率和速度,我的i513400就是0.1秒级别,开源的paraformer准确率也是无敌,而且还是cpu推理,几乎所有的电脑都能用。

使用这么长时间,用它转录这么多字,有很多好用的点。不仅是占用空间小,而且断网也能用,是一个完全离线识别、高速识别、准确率高、保护隐私的软件。替换词典能可以把我常识别错的词给加进去,能做到越用越准越用越懂我;还有现在大家更加关注的隐私问题,这款软件输入的数据不被保存也更不存在大数据监控,不用担心上午打了”冰箱“两个字,下午淘宝就给我推荐冰箱的相关广告链接了!

顶级的模型加上替换词典,几乎可以做到不需要第二次修改文字。如果还需要进一步地修改润色,这里有AI优化功能,把我们说过的话再丢给大模型,在进行一轮纠错。支持通义千问、DeepSeek、硅基流动等等,个平台送的免费token终于有用武之地了。

还有录音视频进行转录功能,内容不超过十分钟都可以免费转录,支持多种格式,也可以对初步转录的内容进行AI纠错、AI整理、MCP,不用暂停下来手动输文字记录啦,大大提升办公效率!

开源地址:github.com/233stone/voc

官网:VocoType – 安全、离线的极速语音输入法

我就是简单介绍一下,里面还有好多高级的玩法,;好用的兄弟记得回来给我点个赞,反正收藏你也不看,不如给一个免费的赞(手动狗头)