跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 我准备做一个根据文字合成鬼畜视频的开源工具,目前有什么开源的语音转文字库吗?
未分類
15 2 月 2021

我准备做一个根据文字合成鬼畜视频的开源工具,目前有什么开源的语音转文字库吗?

我准备做一个根据文字合成鬼畜视频的开源工具,目前有什么开源的语音转文字库吗?

資深大佬 : retrocode 3

  • 我的想法是提取视频的音频,然后对音频识别文字,反过来根据结果视频切片,最后用片段合成鬼畜视频.
  • 讯飞的语音转写是完全符合要求的,不过收费 88 元 10 小时,我是可以接受,但是回头开源出来我估计没多少人会愿意花这个钱陪我玩.

现在有哪些开源的语音识别方案可以识别文字并返回文字所在帧数吗?

大佬有話說 (12)

  • 資深大佬 : darkscope

    先用讯飞的写呗,功能 work 了再考虑替换

  • 資深大佬 : catsoul

    如果我没记错的话,前几年有这么个东西

  • 主 資深大佬 : retrocode

    @catsoul 那你还记得名字吗?我也想参考下.

  • 主 資深大佬 : retrocode

    @darkscope 是滴,突然的想法,先做个技术选型,不然库是 JAVA 的,结果我做的 electron 就哭了.

  • 資深大佬 : murmur

    根据文字合成鬼畜视频?这样的鬼畜有什么看头么,鬼畜又不是根据声音拼素材,口型同步基本都不做的,还是看创意,要么就改歌

  • 資深大佬 : catsoul

    @retrocode 名字我不知道,之前在朋友圈蛮火的,一句普通的话输入进去,它自动从影视素材的片段库里找到每个字或者词的对应片段,然后合成一个小视频那种。但是因为他没有做语音的平滑处理,所以跟我们常看的鬼畜视频不太一样。

  • 資深大佬 : lovecy

    把流行的素材整理成素材库,文字对应素材库里某个素材的某一段,不就行了,也就是只要有一个人有音频识别文字,大家都能用这段素材了。

  • 主 資深大佬 : retrocode

    @murmur oldschool 嘛,我的想法是这些问题都可以通过单独 pr 优化,并对视频片段进行分类进行处理

  • 主 資深大佬 : retrocode

    @lovecy 不一定要流行的素材库嘛,鬼畜同事岂不美哉,鬼畜也就图一乐,被追着打才刺激

  • 資深大佬 : lovecy

    @retrocode 可以先从流行的开始啊,一开始就允许上传自定义素材,步子迈得太大了吧

  • 資深大佬 : GTim

    说起这件事,我一直很想做另一件事: 汉字常用 7000 左右,常用词语 10w+ 也就是说大概 11w 左右就可以了。剩下的汉子用同读音的汉字来替代就好了。然后,找个语音助手,慢慢把这 10w+ 抓下来就可以了

  • 資深大佬 : baobao1270

    不是开源但是不要钱,UTAU 了解一下

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具