您現在的位置是：首頁 >要聞 > 2020-11-30 15:03:38 來源：

通過學習音樂家的肢體語言來識別旋律

導讀我們用耳朵聽音樂，也用眼睛聽音樂，欣賞鋼琴演奏者的手指在琴鍵上飛舞，小提琴演奏者的弓弦越過琴弦。當耳朵無法分辨兩種樂器時，眼睛通常

我們用耳朵聽音樂，也用眼睛聽音樂，欣賞鋼琴演奏者的手指在琴鍵上飛舞，小提琴演奏者的弓弦越過琴弦。當耳朵無法分辨兩種樂器時，眼睛通常會通過將每個樂手的動作與每個聲部的節拍相匹配來進行調整。

MIT-IBM Watson AI Lab開發的一種新的人工智能工具利用計算機的虛擬眼睛和耳朵來分離相似的聲音，這些聲音即使對于人類也很難區分。該工具通過將各個音樂家的動作(通過其骨骼關鍵點)與各個部分的速度進行匹配來改進早期迭代，從而使聽眾可以在多個長笛或小提琴中隔離單個長笛或小提琴。

這項工作的潛在應用范圍包括混音，增加錄音中的樂器音量，以及減少導致人們在視頻會議通話中互相交談的混亂情況。這項工作將在本月的虛擬計算機視覺模式識別會議上進行介紹。

該研究的主要作者，該實驗室的IBM研究人員Chuang Gan說：“人體關鍵點提供了強大的結構信息。” “我們在這里使用它來提高AI收聽和分離聲音的能力。”

在這個項目以及其他類似項目中，研究人員已經利用同步音視頻軌道來重現人類的學習方式。通過多種感覺模式學習的AI系統可能能夠以更少的數據更快地學習，而無需人類為每個現實世界的表示添加討厭的標簽。麻省理工學院教授，??該研究的共同資深作者安東尼奧·托拉爾巴(Antonio Torralba)說：“我們從所有的感官中學習。“多傳感器處理是可以執行更復雜任務的嵌入式智能和AI系統的先驅。”

免責聲明：本文由用戶上傳，如有侵權請聯系刪除！

標簽：肢體語言識別旋律

上一篇:計算模型通過預測對語音進行解碼

下一篇:EPFL實驗室開發設計低功耗電路的方法

猜你喜歡

定州城墻（關于定州城墻介紹）

定州四方誠信畜牧科技有限公司（關于定州四方誠信畜牧科技有限公司介紹）

定州詠古（關于定州詠古介紹）

定州南城門（關于定州南城門介紹）

定州北疃烈士陵園（關于定州北疃烈士陵園介紹）

定州冠農農業科技有限公司（關于定州冠農農業科技有限公司介紹）

定州八景（關于定州八景介紹）

定州供銷商貿有限公司（關于定州供銷商貿有限公司介紹）

定州佰仕達塑料制品有限公司（關于定州佰仕達塑料制品有限公司介紹）

定州人物志（關于定州人物志介紹）

10分鐘被AI騙走430萬

快手2023年第一季度營收252點2億元

木倉科技宣布駕考智能模擬器發布

定州中山公園（關于定州中山公園介紹）

錨定本源柔韌生長

Meta被歐盟罰款13億美元

最新文章

崔亞君（關于崔亞君簡介）

怎樣進行工程項目合同管理（關于怎樣進行工程項目合同管理介紹）

掠奪傾國色（關于掠奪傾國色簡介）

定州城墻（關于定州城墻介紹）

建筑工程制圖習題集第五版（關于建筑工程制圖習題集第五版介紹）

怎樣進行黨性修養和黨性分析（關于怎樣進行黨性修養和黨性分析介紹）

建筑工程制圖習題集第6版（關于建筑工程制圖習題集第6版介紹）

掠奪你（關于掠奪你簡介）

崔亞軍（關于崔亞軍簡介）

步步驚心玉檀怎么死的（步步驚心簡介）

胡蘿卜須歌詞（歌手簡介）

崔亞允（關于崔亞允簡介）

掠奪之斧（關于掠奪之斧簡介）

怎樣進行黨性修養與黨性分析（關于怎樣進行黨性修養與黨性分析介紹）

建筑工程制圖習題集第3版（關于建筑工程制圖習題集第3版介紹）

什么是渣油（渣油的解釋）

點擊排行

熱門推薦

隨機推薦