您現在的位置是:首頁 >互聯網 > 2020-10-21 14:02:26 來源:
Google的CloudTexttoSpeech獲得更多的語言和聲音
Google LLC今天用新的語言和語音更新了Cloud Text-to-Speech服務,以使其對更多客戶有用。
Google Cloud Text-to-Speech旨在幫助公司為其提供的服務開發更好的對話界面。它的工作原理是將書面文本轉換為以逼真的人類聲音說出的人工語音。
借助這項服務,Google的目標市場是三個主要市場:呼叫中心的語音響應系統;“物聯網”產品,例如汽車信息娛樂系統,電視和機器人;以及諸如Podcast和有聲讀物之類的應用程序,它們可以將文本轉換為語音。
Google產品經理Dan Aharon在博客中表示,Cloud Text-to-Speech正在獲得12種新的語言或變體,包括捷克語,英語(印度),菲律賓語,芬蘭語,希臘語,印地語,匈牙利語,印度尼西亞語,漢語(中國) ,現代標準阿拉伯語和越南語。此更新意味著現在可以使用33種語言和變體提供Cloud Text-to-Speech。
該服務還獲得了多達76種新的聲音,使可用的總數達到187種。其中38種由Google的WaveNet服務提供支持,該服務是一個深度神經網絡,用于生成原始音頻,據說可以產生更逼真的聲音。因此,現在總共有95種WaveNet聲音,對于33種支持的語言和變體中的每一種,至少有一種。
谷歌表示,其WaveNet聲音非常重要,因為呼叫聯絡中心或使用口頭命令與設備通話的人們希望聲音聽起來既自然又人性化。WaveNet的這項功能比其他任何可用技術都好,Aharon說,根據平均意見得分,美國英語中語音合成和人類語音之間的“感知質量差距”縮小了70%。
“實際的影響是,對于大多數聽眾來說,WaveNet語音使人機交互變得順暢而熟悉,” Aharon說。“通過這些更新,Cloud Text-to-Speech開發人員現在可以通過其應用程序吸引眾多國家/地區的數百萬用戶,以及更多的語言。”
星座研究公司(Constellation Research Inc.)分析師Holger Mueller表示,Cloud Text-to-Speech的更新非常重要,盡管乍一看似乎只是“更多的語言和聲音”。他說,最重要的是,這表明Google正在充分利用其機器學習架構。
“質量和發行很重要,因為語音在應用程序中起著重要作用,世界是全球性的,”穆勒說。“因此,更多的語言支持意味著為開發下一代應用程序的團隊提供更快,更高效的開發時間。這很好地展示了Google利用協同效應使其與通常的競爭對手AWS和Azure保持距離。