您現在的位置是:首頁 >動態 > 2020-10-26 14:45:30 來源:
人工智能在語音識別方面勝過人類
導讀 進行對話并精確轉錄是人工智能(AI)研究中的最大挑戰之一。目前,卡爾斯魯厄技術學院(KIT)的研究人員首次成功開發了一種計算機系統,該系統
進行對話并精確轉錄是人工智能(AI)研究中的最大挑戰之一。目前,卡爾斯魯厄技術學院(KIT)的研究人員首次成功開發了一種計算機系統,該系統在以最小的等待時間識別這種自發的語言方面表現優于人類。這是在arXiv.org上報告的。
KIT信息學教授Alex Waibel說:“當人們彼此交談時,會出現停頓,口吃,猶豫,例如'er'或'hmmm',笑聲和咳嗽。” “通常,單詞的發音不清楚。” 這甚至使人們很難準確地記錄談話內容。“到目前為止,這對于AI來說更加困難。” KIT的科學家和KITES的初創公司KITES的員工現在已經對計算機系統進行了編程,該計算機系統比人類更好地執行了此任務,比其他系統更快地執行了該任務。
威貝爾(Waibel)已經開發了一種自動實時翻譯器,可以直接將德語或英語的大學講座翻譯成外國學生使用的語言。自2012年以來,該“演講翻譯器”已在KIT的演講廳中使用。“對自發語音的識別是該系統的最重要組成部分,” Waibel解釋說,“由于識別過程中的錯誤和延誤使翻譯難以理解。 ,人為錯誤率約為5.5%。我們的系統現在達到5.0%。” 但是,除了精度外,系統產生輸出的速度同樣重要,因此學生可以實時聽課。研究人員現已成功減少了這種延遲一秒鐘。Waibel說,這是迄今為止語音識別系統所達到的最小延遲。
錯誤率和等待時間是使用標準化的,國際認可的科學“交換機基準測試”測試的。該基準(由美國國家標準與技術研究院(NIST)定義)在國際AI研究人員的競爭中被廣泛使用,以構建一種在可比條件下甚至更勝一籌的條件下,能夠識別人類自發言語的機器。
Waibel認為,快速,高精度的語音識別是進一步下游處理的重要步驟。它使對話,翻譯和其他AI模塊能夠提供更好的基于語音的與機器的交互。