• 您現在的位置是:首頁 >要聞 > 2021-09-09 03:44:23 來源:

    為什么谷歌相信機器學習是它的未來?

    導讀 本周谷歌I O主題演講中最有趣的演示之一是谷歌語音助手的新版本,該版本將于今年晚些時候推出。一名谷歌員工要求谷歌助理調出她的照片,然

    本周谷歌I/O主題演講中最有趣的演示之一是谷歌語音助手的新版本,該版本將于今年晚些時候推出。一名谷歌員工要求谷歌助理調出她的照片,然后展示她與動物的照片。她拍了拍一個說:“給賈斯汀。”照片已放入通信應用程序中。

    從那里,事情變得更加令人印象深刻。

    她說:“嘿,谷歌,給杰西卡發封電子郵件。”“嗨,杰西卡,我剛從黃石國家公園回來,完全愛上了它。”電話錄下了她的話,并在她的線上打了“嗨,杰西卡”。

    進一步閱讀

    谷歌首次推出“下一代”助手,將用于下一代Pixel手機。

    她說:“受黃石公園探險的影響。”助手得知“黃石歷險記”應該放在主題行,而不是消息正文。

    然后,沒有任何明確的命令,女人回到了命令郵件正文的位置。最后,她說“發送”,谷歌的助手做到了。

    谷歌還表示,谷歌也在努力擴大其助手對個人推薦的理解。如果用戶說“嘿谷歌,媽媽家的天氣怎么樣”,谷歌可以查到“媽媽家”是指用戶媽媽的家,找到她的地址,提供她所在城市的天氣預報。

    谷歌表示,其下一代助手將在今年晚些時候推出“新Pixel手機”,即目前Pixel 3系列之后的手機。

    顯然,罐裝演示和運輸產品有很大的區別。我們將不得不等待,看看與新助手的典型交互是否運行良好。但是谷歌似乎正在朝著建立一個能夠處理語音處理的虛擬助手的夢想穩步前進。

    I/O上的很多公告都是這樣的:谷歌的一系列產品不是發布主要的新產品,而是利用機器學習技術逐漸變得更加復雜和有用。谷歌還吹捧了其機器學習軟件的一些幕后改進,這將允許谷歌創建的軟件和第三方軟件使用更復雜的機器學習技術。

    如果你問機器學習專家,當當前深度學習的熱潮開始時,很多人會在主要作者Alex Krizhevsky之后指出2012年的論文《AlexNet》。作者是多倫多大學的三名研究人員,他們參加了ImageNet競賽,并將圖像分為1000個類別。

    ImageNet組織者提供了100多萬個帶標簽的樣本圖像來訓練網絡。AlexNet通過使用具有八個可訓練層和65萬個神經元的深度神經網絡,實現了前所未有的精度。他們之所以能在如此大量的數據上訓練出如此龐大的網絡,是因為他們已經想出了如何使用專為大規模并行處理而設計的消費級GPU。

    亞歷克斯。net展示了所謂的三腳凳對于深度學習的重要性:更好的算法、更多的訓練數據和更強的計算能力。在過去的七年里,公司一直在努力增強三個方面的能力,以獲得越來越好的業績。

    谷歌幾乎從一開始就帶頭指責。在2012年AlexNet獲得名為ImageNet的圖像識別大賽冠軍兩年后,谷歌以更深層次的神經網絡參加了大賽,并獲得了最高獎。該公司已經聘請了數十位頂級機器學習專家,包括2014年收購深度學習初創公司DeepMind,這讓該公司一直處于神經網絡設計的前沿。

    該公司還擁有無與倫比的大型數據集訪問權限。2013年的一份文件描述了谷歌如何使用深度神經網絡來識別通過谷歌街景拍攝的數千萬張圖像中的地址號碼。

    谷歌在硬件上也很努力。2016年,谷歌宣布打造了一款名為Tensor Processing Unit的定制芯片,專門設計用于加速使用神經網絡的操作。

    “盡管谷歌早在2006年就考慮為神經網絡構建專用集成電路(ASIC),但這種情況在2013年變得緊迫起來,”谷歌在2017年寫道。“當時,我們意識到神經網絡的計算需求正在快速增長。我們可能需要將運營的數據中心數量增加一倍。”

    這就是為什么谷歌I/O在過去三年一直專注于機器學習。公司認為,這些資產(一小批機器學習專家、大量數據和自身定制的芯片)使其成為利用機器學習帶來的機會的理想選擇。

    事實上,今年的谷歌I/O并沒有發布多少與ML相關的新產品,因為公司已經將機器學習集成到了很多主要產品中。安卓已經有語音識別和谷歌助手很多年了。一直以來,谷歌照片都有著令人印象深刻的基于ML的搜索功能。去年,谷歌推出了Google Duplex,它代表用戶通過使用軟件創建的逼真人聲進行預訂。

    相反,關于機器學習的I/O演示集中在兩個方面:將更多的機器學習活動轉移到智能手機上,利用機器學習幫助弱勢群體(包括聾啞人,文)。

    盲或患癌癥的人)。

    過去使神經網絡更準確的努力涉及使它們更深,更復雜。這種方法產生了令人印象深刻的結果,但是它有很大的缺點:網絡經常變得過于復雜而無法在智能手機上運行。

    人們大多通過將計算工作卸載到云來解決這個問題。谷歌和蘋果語音助手的早期版本會錄制音頻并將其上傳到公司服務器進行處理。一切正常,但它具有三個明顯的缺點:延遲時間較長,隱私保護功能較弱,并且該功能只能在線運行。

    因此,谷歌一直致力于在設備上轉移越來越多的計算。當前的Android設備已經具有基本的設備上語音識別功能,但是Google的虛擬助手需要Internet連接。谷歌表示,這種情況將在今年晚些時候隨著谷歌助手的新離線模式而改變。

    這項新功能是本周演示演示閃電般快速響應時間的重要原因。谷歌表示,對于某些任務,助手將“快10倍”。

    進行此切換的關鍵是顯著減小用于語音識別的神經網絡的大小。無論是Google內部還是外部的研究人員都在研究這個問題已有一段時間了。

    例如,2016年的一篇論文描述了一組研究人員如何精簡經典的AlexNet架構。他們發現卷積神經網絡中的某些元素會增加很多參數,而不會大大提高網絡的準確性。通過明智地改造網絡結構,他們能夠將AlexNet中的參數數量減少50倍,而不會降低其準確性。進一步的壓縮技術使他們可以將模型的大小壓縮500倍。

    谷歌表示,它已經使用更復雜的神經網絡實現了類似的壯舉,該網絡用于理解Google助手命令,從而將網絡大小從100GB減小到約500MB。

    Google還一直在努力使Google Assistant更快地做出響應。關于谷歌如何做到這一點的線索來自幾位谷歌研究人員在2018年發表的一篇論文。其他研究人員已經手動調整了神經網絡的結構,而Google研究人員則使該過程自動化。他們使用軟件對不同的神經網絡配置進行了實驗,并考慮了實際智能手機的功能和局限性,從而測量了所得網絡的速度和準確性。

    今年早些時候,谷歌宣布了另一項舉措,以加速設備上機器學習功能。TensorFlow是Google創建的用于機器學習應用程序的框架。TensorFlow Lite是該軟件的移動版本。1月,Google宣布TensorFlow Lite現在在某些智能手機型號上支持GPU加速。

    我們還看到Google和其他公司開始為智能手機開發AI專用硬件。Pixel 2推出了由Google設計的新型圖像處理芯片。 蘋果最新的芯片包括針對機器學習應用進行了優化的“神經引擎”。高通公司的最新芯片還帶有用于AI的專用芯片。有趣的是,下一代Pixel手機是否配備了功能更強大的自定義硬件,以支持Google的設備上助手和其他機器學習應用程序。

    今年早些時候,谷歌推出了一種名為Edge TPU的芯片,這是該公司過去幾年在其數據中心擁有的機器學習芯片的一種小型,低功耗版本。該公司目前正在將其作為“物聯網”產品進行營銷,但是很難想象Google將在下一代Pixel手機和其他未來的硬件產品(如智能揚聲器)中使用該芯片的版本。

    Google不僅為自己的應用程序使用了更多的設備上機器學習。該公司還為第三方開發人員提供了一個名為ML Kit的庫,該庫可用于iOS和Android。它為開發人員提供了現成的機器學習模型,用于執行常見任務,例如識別圖像中的文本和對象,檢測面部以及將文本從一種語言翻譯成另一種語言。

    本周,Google宣布了一種新的ML Kit API,可用于59種語言的設備上翻譯,提供可在有或沒有網絡連接的情況下運行的私有快速翻譯。ML Kit現在還提供了執行設備上對象檢測和跟蹤的功能。

    Google翻譯應用程序已經允許用戶將相機對準現實世界中的一段文字,并查看即時翻譯成另一種語言的信息。現在,用戶將能夠請求軟件以原始語言或其他語言大聲閱讀文本,并在閱讀文本時突出顯示相應的單詞。

    Google強調了其最近推出的實時轉錄應用程序,該應用程序為聽障人士提供了真實對話的字幕。一項名為“實時字幕”的新功能將使Android用戶可以顯示手機正在播放的任何音頻的實時轉錄。另一個稱為實時中繼的功能使聾人可以將電話當作文本聊天來對待:呼叫者的話被實時轉錄為聊天消息。接收者可以打回單詞并讓他們大聲朗讀給呼叫者。

    Google還嘗試使用機器學習來幫助患有退化性疾病的人,使他們完全無法說話。當前,這些人經常不得不緩慢地鍵入消息(如果不是用手指,而是用眼睛),然后用合成語音閱讀。Google希望基于機器學習的軟件能夠吸收更復雜的線索,從而使這些人能夠“說話”得足夠快,可以實時參與對話。

    Google的使命是整理世界各地的信息,并使其易于使用。Google在該任務說明的前半部分取得了很大進展-它可能比該星球上的任何其他公司擁有更多的數據訪問權限。但是,使信息更有用將需要軟件以更復雜的方式理解信息,而這正是機器學習技術可以做到的。

    在本周的I / O大會上,Google發出了明確信號,表明Google的機器學習推動才剛剛起步。該公司正在投入大量資源來開發新的芯片,算法和平臺,因為它認為這些技術有很大的空間來改進其現有產品-或允許創建全新的產品。Google相信,它擁有獨特的人才和資源組合,可以充分利用這些機會。

    猜你喜歡

  • 成人app