• 您現在的位置是:首頁 >市場 > 2021-04-14 23:46:04 來源:

    Google DeepMind更貼近人類

    導讀 DeepMind的人工智能研究人員利用神經網絡創造了一些最逼真的人類語音。AI稱為WaveNet,它承諾對計算機生成的語音進行重大改進,并最終可用

    DeepMind的人工智能研究人員利用神經網絡創造了一些最逼真的人類語音。AI稱為WaveNet,它承諾對計算機生成的語音進行重大改進,并最終可用于數字個人助理,如Siri,Cortana和亞馬遜的Alexa。該技術通過從英語和普通話人口中抽取真實的人類語音來產生聲音。在測試中,發現WaveNet生成的語音比其他形式的文本到語音程序更加真實,但仍然沒有真正令人信服。

    Google DeepMind更貼近人類

    在500次盲測中,受訪者被要求以1到5的等級判斷樣本句子(其中5個是最現實的)。WaveNet在英語中被評為4.21,在普通話中被評為4.08(實際人類語言在測試中被評為4.55英語和4.21普通話)。在那一方面,WaveNet成功地超越了其他語音方法。

    當其他人工語音生成器專注于語言時,WaveNet針對正在產生的聲波,分析原始音頻信號波形并對其進行建模。在YouTube上聽鋼琴獨奏后,研究人員還使用相同的技術制作音樂。

    “WaveNets為TTS,音樂生成和音頻建模提供了很多可能性。使用深度神經網絡直接生成時間步長的事實對16kHz音頻起作用是非常令人驚訝的,更不用說它優于最先進的TTS系統。我們很高興看到我們接下來可以做些什么,“Deepmind在博客文章中說。

    Deepmind還發表了一篇論文,詳細介紹了該技術。

    該研究機構還負責創建一個AI系統,以擊敗今年的冠軍Go球員。

  • 成人app