0%

视频语音识别字幕相关

学语言的话,除了文字转语音这样系统学课文,还有一个相反的方向,就是视频语音识别字幕,这样日常的听力练习也能有所帮助。

畅想下未来,字幕编辑可能都不需要了,youtube 这样的平台已经都提供了自动字幕,而且会越来越准确。这样的话这个工具是不是就没有价值了?不过对于未来个人的学习来看,尤其语言学习,音频还是重要的,如果一个工具能让你获得学下去的动力,那么这个工具就有了存在的价值。

whisper 还是厉害的,不过基于原因又有了 fastwhisper,whisperX,目前看 whisperX 的字幕准确率最高,而且还能每个字都对应上。

肯定是需要自己可以本地部署这些 model 的,但是受限于资源,看来云厂商的 Api 还是有用的。先用 Api 还是方便快捷,至少速度验证产品,等有了资源再自己部署节省也可以。

Reference

FasterWhisper + WhisperX 免费本地音频识别、转写的终极方案? - 哔哩哔哩
FasterWhisperGUI 更快更强更好用的 whisper - 哔哩哔哩