• 您現在的位置是:首頁 >要聞 > 2020-12-08 16:55:41 來源:

    谷歌AI研究科學家宣布數據集搜索

    導讀 從第一天開始,Google就開始涉足查找信息的業務。多年后,Google談論有關數據集的嚴肅工作。Google正在啟動一個新的搜索引擎,以幫助科學家

    從第一天開始,Google就開始涉足查找信息的業務。多年后,Google談論有關數據集的嚴肅工作。Google正在啟動一個新的搜索引擎,以幫助科學家找到所需的數據集。

    周三,Google AI研究科學家Natasha Noy宣布了Google推出Dataset Search。現在,如果您是科學家,則可以輕松訪問數據集,或者只是另一種追求中的數據“怪胎”,即可為您的工作,故事和智力好奇心尋找數據。

    目標是為您帶來更多的單一界面。Engadget中的Jon Fingas研究了它如何使數據搜索受益。

    “該工具可以更直接地訪問以開放標準提供的數據,從而可以清楚地確定誰創建了信息,如何收集信息以及如何使用它。您不僅可以跟蹤報告的氣候數據,而且可以確保使用它是相關且合法的。”

    這是一項全球性(與國際性一樣)的推送,可以多種語言運行,并且即將支持其他語言。詹姆斯·文森特在《邊緣》中引用了諾伊的話:“我確實認為在過去幾年中,存儲庫的數量激增了。”

    她說:“只需輸入您要查找的內容,我們將幫助您找到存儲庫提供商網站上已發布的數據集。” 當前,數據集和相關數據往往分布在多個數據存儲庫中,人們可能會發現有關這些數據集的信息既未鏈接也未被搜索引擎索引。對于進行搜索的人而言,數據發現充其量是乏味的。

    她認真地支持生態系統,在這種生態系統中,通過Google制定的指南鼓勵數據集提供者自己“以Google(和其他搜索引擎)可以更好地理解其頁面內容的方式來描述其數據”,她說過。

    他們使用開放標準schema.org進行此操作。在Noy的愿望清單上:所有數據集提供者都落后于該通用標準。希望更多的數據存儲庫將使用schema.org標準來描述其數據集。Noyes說,這樣一來,數據集便是“強大的生態系統”的一部分。

    “像這樣的搜索工具僅能滿足數據發布者愿意提供的元數據。我們希望看到你們中的許多人使用開放標準來描述您的數據,使我們的用戶能夠找到他們想要的數據。 。”

    恩加吉特(Engadget)的喬恩·芬加斯(Jon Fingas):“目前,這還不是確定的資源。但是,這只是一個開始,而Google無疑希望這會鼓勵其他人提高其公共數據的可搜索性。”

    如果這還不夠,那么Google將在充分利用有關數據的數據方面削減一些途徑。

    根據The Verge的說法,開放數據研究所所長Jeni Tennison表示,理想情況下,Google會發布自己的數據集,以使用Dataset Search。她說,Google應該發布有關數據集搜索的數據集,該數據集將由“數據集搜索”建立索引,文森特補充說。他引用了她的話:

    Tennison說:“僅僅了解人們的搜索方式很重要……他們使用什么樣的術語,如何表達它們。” “如果我們想掌握人們如何搜索數據并使之更易于訪問,那么如果Google在此基礎上開放自己的數據,那就太好了。” 他補充說,換句話說,Google應該發布有關數據集搜索的數據集,該數據集將由“數據集搜索”建立索引。

  • 成人app