• 您現在的位置是:首頁 >互聯網 > 2020-10-23 10:59:58 來源:

    IBM與Trifacta合作開發用于AI模型的新數據準備工具

    導讀 IBM公司正在嘗試使用與Trifacta Inc 共同開發的新數據準備工具來解決準備用于人工智能和機器學習模型訓練的數據的繁瑣且耗時的過程。兩家

    IBM公司正在嘗試使用與Trifacta Inc.共同開發的新數據準備工具來解決準備用于人工智能和機器學習模型訓練的數據的繁瑣且耗時的過程。

    兩家公司指出,數據準備是構建機器學習和預測模型的關鍵步驟。那是因為數據需要非常準確,否則模型將無效,但是問題是數據科學家最多可以將80%的時間花費在此任務上。

    這是一個非常漫長的時間,可以更好地用于其他事情,這就是今天IBM和Trifacta宣布其新的InfoSphere Advanced Data Preparation工具的原因,他們說這有助于加快流程。

    借助InfoSphere,數據科學家可以將其原始數據集轉換為適合于機器學習模型的格式,同時使用其現有的數據湖和數據倉庫。

    兩家公司表示,該工具旨在“格式化,構造和豐富用于分析處理和標準報告的數據集”。它的工作原理是幫助用戶可視化數據準備過程,以便他們可以連續跟蹤數據的質量,并確保在格式化數據時不會發生錯誤。該過程也完全自動化,這意味著正式員工以及數據科學家可以準備和豐富其數據以進行分析。

    Trifacta首席執行官亞當·威爾遜(Adam Wilson)表示,該公司與IBM合作創建了InfoSphere,此前該公司目睹了許多組織由于數據質量差和準備流程效率低下而難以開展AI計劃。

    威爾遜說:“這項合作將使組織能夠在受管和集中管理的環境中加快自助服務分析的數據準備。”

    Constellation Research Inc.分析師Doug Henschen告訴SiliconANGLE,與IBM的合作實際上是Trifacta的妙招,更不用說為IBM節省時間了,因為它可以帶來“最新的自助服務數據”將功能“推向市場”的過程比它自己完成的過程更快。

    Henschen說:“我認為IBM明智地專注于建模生命周期的開發,部署,監視和持續管理方面,并在可能的情況下開發自動化。” “為什么Trifacta很好地應對了準備挑戰?Trifacta在其云平臺上也與Google建立了重要的合作伙伴關系,因此這是著名合作伙伴對其能力的第二次認可。”

    除了新的數據準備工具外,IBM還宣布了其Cloud Pak for Data服務的一些更新,該服務用于集成,管理和管理各種公共和私有云中的數據。更新包括Cloud Pak for Data上的Watson Knowledge Catalog Professional可用性,據說可以改善“

    分析的數據可發現性”并提供更多治理工具。

    還有用于數據的IBM Cloud Pak的DataStage Edition(旨在減少數據轉換作業的延遲),以及 用于IBM Cloud Pak的Data Watson Discovery(用于在各種云之間發現數據的AI搜索工具)。

  • 成人app