• 您現在的位置是:首頁 >人工智能 > 2021-04-29 03:21:31 來源:

    人類如何在人工智能方面保持優勢?

    導讀 在人工智能(AI)中,機器執行特定的操作,觀察結果,相應地調整他們的行為,觀察新的結果,再次調整他們的行為,等等,從這個迭代過程中學習

    在人工智能(AI)中,機器執行特定的操作,觀察結果,相應地調整他們的行為,觀察新的結果,再次調整他們的行為,等等,從這個迭代過程中學習。但這個過程是否會失控?有可能。“人工智能將始終尋求避免人為干預,并創造一種無法阻止的局面,”EPFL分布式編程實驗室教授,EPFL研究的共同作者Rachid Guerraoui說。這意味著AI工程師必須防止機器最終學會如何規避人類命令。研究這個問題的EPFL研究人員發現了一種讓操作人員控制一組AI機器人的方法; 他們將于12月4日星期一提交調查結果,在加利福尼亞州的神經信息處理系統(NIPS)會議上。例如,他們的工作為自動駕駛汽車和無人機的發展做出了重大貢獻,使他們能夠安全地操作數量。

    人工智能中使用的一種機器學習方法是強化學習,其中代理人因執行某些行為而獲得獎勵 - 這是一種從行為心理學中借鑒的技術。將此技術應用于AI,工程師使用點系統,通過執行正確的操作,機器可以獲得積分。例如,機器人可以獲得一個點以正確地堆疊一組盒子而另一個點用于從外部檢索盒子。但是,如果在下雨天,例如,操作人員在機器人向外收集箱子時會中斷機器人,機器人將會知道最好留在室內,堆放箱子并盡可能多地賺取積分。“挑戰不是要停止機器人,而是要對機器人進行編程,以便中斷不會改變其學習過程 - 并且不會

    從單臺機器到整個AI網絡

    2016年,Google DeepMind和牛津大學人類未來研究所的研究人員開發了一種學習協議,可以防止機器從中斷中學習,從而變得無法控制。例如,在上面的示例中,機器人的獎勵 - 它所獲得的點數 - 將根據下雨的機會加權,從而使機器人有更大的動力去取回外面的箱子。“這里的解決方案相當簡單,因為我們只處理一個機器人,”Guerraoui說。

    然而,AI越來越多地被用于涉及數十臺機器的應用中,例如道路上的自動駕駛汽車或空中無人駕駛飛機。“這使得事情變得更加復雜,因為機器開始相互學習 - 特別是在中斷的情況下。他們不僅從單獨中斷的方式學習,還從其他人如何中斷學習,”Alexandre Maurer說。 ,該研究的作者之一。參與這項研究的另一位研究人員哈德里安·亨德里克斯(Hadrien Hendrikx)給出了兩輛自動駕駛汽車在一條狹窄的道路上相互跟隨的例子。他們必須盡快到達目的地 - 不違反任何交通法規 - 汽車中的人員可以隨時接管。如果第一輛車中的人經常剎車,

    給人類最后一句話

    這種復雜性是EPFL研究人員通過“安全可中斷性”解決的目標。他們的突破性方法可以讓人在必要時中斷AI學習過程 - 同時確保中斷不會改變機器的學習方式。“簡而言之,我們在學習算法中添加'遺忘'機制,基本上刪除了機器內存中的一些內容。它有點像黑衣人中的閃存設備,”該研究的另一位作者El Mahdi El Mhamdi說。換句話說,研究人員改變了機器的學習和獎勵系統,使其不受中斷的影響。就像父母懲罰一個孩子一樣,這不會影響家庭中其他孩子的學習過程。

    “我們研究現有的算法,并表明無論AI系統有多復雜,涉及的機器人數量或中斷類型,安全可中斷性都可以發揮作用。我們可以將它與終結者一起使用,但結果仍然相同,”毛雷爾。

    如今,使用強化學習的自動機器并不常見。“當犯錯誤的后果很小時,這個系統運作得很好,”El Mhamdi說。“例如,出于安全考慮,完全自主且沒有人為監督,它不能用于Sion的自動駕駛穿梭巴士。但是,我們可以模擬穿梭巴士和Sion市并運行AI算法在梭車系統學習的過程中獎勵和減少點數。這就是特斯拉正在進行的模擬。一旦系統經歷了足夠的學習,我們就可以在自動駕駛中安裝預先訓練的算法探索率低的汽車,因為這將允許更廣泛的使用。“ 當然,在確保人類仍然擁有最后一句話的同時。

  • 成人app