我准备做一个根据文字合成鬼畜视频的开源工具,目前有什么开源的语音转文字库吗?
資深大佬 : retrocode 3
- 我的想法是提取视频的音频,然后对音频识别文字,反过来根据结果视频切片,最后用片段合成鬼畜视频.
- 讯飞的语音转写是完全符合要求的,不过收费 88 元 10 小时,我是可以接受,但是回头开源出来我估计没多少人会愿意花这个钱陪我玩.
现在有哪些开源的语音识别方案可以识别文字并返回文字所在帧数吗?
大佬有話說 (12)
现在有哪些开源的语音识别方案可以识别文字并返回文字所在帧数吗?