跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 请问大神: 有啥软件或算法能把一段谈话音频按照谈话的每个字切割成 N 段仅有一个字的短音频?
未分類
11 11 月 2020

请问大神: 有啥软件或算法能把一段谈话音频按照谈话的每个字切割成 N 段仅有一个字的短音频?

请问大神: 有啥软件或算法能把一段谈话音频按照谈话的每个字切割成 N 段仅有一个字的短音频?

資深大佬 : sprinter 3

请问大神:

有一段英语谈话音频: Donald J. Trump is the 45th President of the United States.

请问有啥软件或算法能把上述一段谈话音频按照谈话的每个字切割成 N 段仅有一个字的短音频, 如切割成:

Donald

J.

Trump

is

the

45th

President

of

the

United

States.

切割成上述 11 段仅有一个字的短音频. 请问有啥软件或算法能自动实现这个功能?

烦请出出主意, 小女在此谢谢各位大神了!

大佬有話說 (14)

  • 資深大佬 : knightdf

    这直接按波峰波谷切就行了吧?

  • 資深大佬 : oatw

    额,好像还是有难度的。英语为母语的人会有各种连读和略音,一句话里的发音都不是覆盖所有单词的,所以理论上来看是没法直接把每个单词从原音切出来的。

    如果只是追求每个单词的发音,而不强求原声,觉得可以试试先调用语音识别的接口识别成文本,然后再 ai 读单词,哈哈哈~

  • 資深大佬 : laminux29

    https://cloud.google.com/speech-to-text/docs/async-time-offsets#speech_transcribe_async_word_time_offsets_gcs-protocol

  • 資深大佬 : jmc891205

    感觉各种连读吞音很难从音频上区分
    你还是说说你为什么有这样需求吧
    如果是先识别成文本,然后做分词,再按分词结果转换成每个词的语音,那我感觉还好做一些

  • 資深大佬 : takemeaway

    语言识别-》分词-》获取时间轴-》切割音频
    你是想做伪造音频的视频吧?

  • 資深大佬 : loliordie

    aws 和 google 有语音识别的开源 API, 可以去了解一下.

    我使用过 aws 家的, 识别率非常高.

  • 資深大佬 : shintendo

    @takemeaway 我猜是做鬼畜素材

  • 資深大佬 : Elissa

    猜测鬼畜音源+1

  • 資深大佬 : xuanbg

    text to voice ?

  • 資深大佬 : QuinceyWu

    自己剪把 2333

  • 資深大佬 : h4wklee

    我
    劝
    你
    耗
    子
    尾
    汁

  • 資深大佬 : LinSP

    用语音识别 API 获取词时间戳,然后根据时间戳自己去分下,一般的 API 都有这个功能

  • 資深大佬 : jones2000

    语音转文本, 然后用语音一个一个单词念。

  • 資深大佬 : saulshao

    首先是语音识别,然后 nlp

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具