您現在的位置是：首頁 >要聞 > 2020-12-09 15:05:43 來源：

人工智能學習技術可以說明大腦獎勵路徑的功能

導讀來自DeepMind，大學學院和哈佛大學的一組研究人員發現，將學習技術應用于AI系統的經驗教訓可能有助于解釋獎勵途徑如何在大腦中發揮作用。該

來自DeepMind，大學學院和哈佛大學的一組研究人員發現，將學習技術應用于AI系統的經驗教訓可能有助于解釋獎勵途徑如何在大腦中發揮作用。該小組在《自然》雜志上發表的論文中描述了將計算機中的分布強化學習與小鼠大腦中的多巴胺處理進行比較，以及他們從中學到的知識。

先前的研究表明，大腦中產生的多巴胺與獎勵過程有關，多巴胺是在發生好事時產生的，其表達會帶來愉悅的感覺。一些研究還表明，大腦中對多巴胺的存在做出反應的神經元都以相同的方式做出反應-事件會使人或小鼠感覺好壞。其他研究表明，神經元反應更多是一個梯度。在這項新工作中，研究人員發現了支持后一種理論的證據。

分布式強化學習是一種基于強化的機器學習。在設計諸如Starcraft II或Go之類的游戲時，經常使用它。它會跟蹤好動作與壞動作之間的關系，并學會減少壞動作的數量，并發揮更多的性能。但是，這樣的系統不會對所有好的和壞的動作都一視同仁-每個動作在記錄時都經過加權，權重是做出未來動作選擇時所使用的計算的一部分。

研究人員指出，人類似乎也使用類似的策略來提高他們的游戲水平。倫敦的研究人員懷疑，人工智能系統與大腦進行獎勵處理的方式之間的相似性也可能相似。為了找出它們是否正確，他們對小鼠進行了實驗。他們將能夠插入單個多巴胺神經元反應的設備插入大腦。然后，對小鼠進行培訓以執行一項任務，在這些任務中，它們會以期望的方式獲得獎勵。

小鼠神經元反應表明，它們并非都像先前理論所預測的那樣以相同的方式反應。取而代之的是，他們以可靠的不同方式做出了反應，這表明小鼠所體驗到的快樂程度更多地是一種梯度，正如該團隊所預測的那樣。

免責聲明：本文由用戶上傳，如有侵權請聯系刪除！

標簽：人工智能學習技術

上一篇:AlphaFold在預測蛋白質結構中脫穎而出

下一篇:類腦網絡使用障礙來檢測秩序

猜你喜歡

定州市2021年度耕地輪作工作實施方案（關于定州市2021年度耕地輪作工作實施方案介紹）

定州宇飛電子科技有限公司（關于定州宇飛電子科技有限公司介紹）

定州天鷺新能源有限公司（關于定州天鷺新能源有限公司介紹）

定州城墻（關于定州城墻介紹）

定州四方誠信畜牧科技有限公司（關于定州四方誠信畜牧科技有限公司介紹）

定州詠古（關于定州詠古介紹）

定州南城門（關于定州南城門介紹）

定州北疃烈士陵園（關于定州北疃烈士陵園介紹）

定州冠農農業科技有限公司（關于定州冠農農業科技有限公司介紹）

定州八景（關于定州八景介紹）

定州供銷商貿有限公司（關于定州供銷商貿有限公司介紹）

定州佰仕達塑料制品有限公司（關于定州佰仕達塑料制品有限公司介紹）

定州人物志（關于定州人物志介紹）

10分鐘被AI騙走430萬

快手2023年第一季度營收252點2億元

木倉科技宣布駕考智能模擬器發布

最新文章

掠奪尼羅河——埃及的盜墓賊和考古學家（關于掠奪尼羅河——埃及的盜墓賊和考古學家簡介）

開元九龍湖畔（關于開元九龍湖畔介紹）

崔仁荷（關于崔仁荷簡介）

怎樣進行建筑裝飾裝修工程施工（關于怎樣進行建筑裝飾裝修工程施工介紹）

定州市2021年度耕地輪作工作實施方案（關于定州市2021年度耕地輪作工作實施方案介紹）

掠奪型政府（關于掠奪型政府簡介）

怎樣進行建工電氣施工-工程建設十萬個怎么辦（關于怎樣進行建工電氣施工-工程建設十萬個怎么辦介紹）

定州宇飛電子科技有限公司（關于定州宇飛電子科技有限公司介紹）

建筑工程制圖習題集（關于建筑工程制圖習題集介紹）

來電顯示是什么（了解一下）

三個臭皮匠賽過諸葛亮的意思是什么（三個臭皮匠賽過諸葛亮具體含義）

樺可以組什么詞語（樺可以組哪些詞語）

定州天鷺新能源有限公司（關于定州天鷺新能源有限公司介紹）

建筑工程制圖習題集第四版（關于建筑工程制圖習題集第四版介紹）

掠奪獸（關于掠奪獸簡介）

怎樣進行工程項目質量管理（關于怎樣進行工程項目質量管理介紹）

點擊排行

熱門推薦

隨機推薦