您現在的位置是:首頁 >財經 > 2021-04-26 09:55:00 來源:
谷歌鏡頭現在可以識別超過十億種產品
導讀 谷歌在博客中宣布了其人工智能圖像識別應用程序的里程碑,詳細介紹了如何通過將自定義光學字符識別(OCR)引擎與其搜索語言學習及其知識圖譜
谷歌在博客中宣布了其人工智能圖像識別應用程序的里程碑,詳細介紹了如何通過將自定義光學字符識別(OCR)引擎與其搜索語言學習及其知識圖譜相結合來教授鏡頭閱讀。
得益于OCR引擎和培訓,Lens已經非常擅長閱讀產品標簽和其他文本,這有助于識別超過十億種產品。例如,為了區分字母“o”和零,它依賴于谷歌搜索的拼寫校正模型。
谷歌上周通過對iOS谷歌應用程序的更新推出了針對iPhone的鏡頭,詳細介紹了里程碑。
谷歌鏡頭和AR副總裁Aparna Chennapragada表示,世界正在進入一個新的計算階段,她稱之為“相機時代”,幫助用戶搜索他們所看到的內容。谷歌鏡頭是這種轉變的一部分,使得相機不僅僅是拍照和自拍的工具。
參見:“隨著計算機開始像我們一樣,相機將成為我們周圍世界的強大而直觀的界面;人工智能取景器將答案放在問題所在的位置 - 在我們走下街道的街道上疊加方向,突出顯示我們在商店貨架上尋找的產品,或立即翻譯我們面前的任何一個詞在外國城市。我們將能夠支付賬單,喂我們的停車收費表,并了解更多關于我們周圍的任何東西,簡單地通過指向相機,“Chennapragada說。
Lens進一步推動Google的目標,使搜索更具視覺效果,正如它在20周年紀念日中概述的那樣,它通過圖像搜索將Lens帶入網絡。