• 您現在的位置是:首頁 >互聯網 > 2020-11-02 14:00:46 來源:

    在GPU加速的數據庫上進行現實檢查

    導讀 圖形處理單元加速的數據庫市場已將自己確立為一個重要的新興市場。但是,尚不清楚GPU加速的數據庫是否或何時進入主流企業數據庫管理系統。

    圖形處理單元加速的數據庫市場已將自己確立為一個重要的新興市場。但是,尚不清楚GPU加速的數據庫是否或何時進入主流企業數據庫管理系統。

    盡管GPU近年來已在數據庫體系結構方面取得了一些進展,但它們似乎不太可能脫離特定于應用程序的協處理器存儲區,并解決大多數組織使用數據庫管理系統的核心事務處理工作負載。

    這是因為GPU不適合加速無法并行化,不涉及浮點數和其他數字處理的數據庫操作,或者需要大量數據在系統總線之間來回移動的數據庫。主要的中央處理單元。

    商業GPU優化的數據庫已經將自己確立為一個有前途的利基市場,主要來自專注于加速數據分析應用程序的創業公司,而這是一個非常擁擠的利基市場。例如:

    Brytlyt的GPU加速分析數據庫可以在幾秒鐘內經濟高效地查詢數十億行數據集。

    BlazingDB的GPU加速數據庫可以對海量數據集運行快速,簡單的SQL查詢。

    Kinetica的平臺可以在數十億行中執行標準的SQL查詢(以微秒為單位),同時可視化結果,執行機器學習模型并提取大量流數據。

    OmniSci的平臺將SQL查詢編譯為可以在Nvidia Corp. GPU,Intel Corp. X86或IBM Corp. Power CPU上運行的機器代碼。

    SQream的GPU加速列式數據庫幾乎實時處理了數萬億行。

    值得注意的是,沒有一家領先的企業級DBMS提供商進入GPU加速數據庫市場。他們中的大多數人都與Nvidia合作, 以GPU加速其云和本地解決方案組合中的AI工作負載。一些與GPU數據庫利基公司合作的合作伙伴 ,還整合了這些合作伙伴的產品,作為分析密集型數據庫內工作負載(如數據倉庫和AI)的加速器。

    GPU作為企業數據庫中的分析協處理器非常有意義。實際上,您可以像在最近的博客中討論的Oracle產品經理一樣,在GPU上運行一些企業數據庫工作負載。通過這樣做,您將獲得更快的分析處理速度,并通過合并列式,內??存中,單實例多數據,智能緩存,高帶寬服務器內存和其他復雜功能,提高數據庫性能,超出供應商可能已經設計的性能。技術應用于基于CPU的處理。

    即便如此,GPU顯然在圖像處理和AI中脫穎而出。CPU經過優化,可以對大量數據執行少量的簡單計算,而GPU擅長并行化大量數據的計算。GPU非常適合用于加速深度學習(重復的矩陣計算以從處理的每個數據集中提取見解)和成像(每個處理的圖像數百萬個矢量計算)的加速。這就解釋了為什么在最近的這篇文章中,對GPU的未來需求可能來自需要將成像與數據驅動的情報進行高性能融合的沉浸式AI應用程序。

    GPU數據庫市場的未來在于很大程度上不在RDBMS范圍內的數據平臺:區塊鏈。相對少量的數據進行高度并行計算就是區塊鏈的全部意義所在–特別是它是區塊鏈共識協議的基礎。實際上,GPU數據庫供應商已經將他們的解決方案出售給了加密貨幣挖掘市場,以處理這些以及其他以區塊鏈為中心的工作負載。

    區塊鏈+深度學習+交互式成像

    如果GPU優化的數據庫市場希望突破其利基市場,那么很可能會受到對結合了區塊鏈,深度學習和交互式圖像的應用程序的需求的驅動。那可能是什么?

    一種可能性是視頻流市場中的區塊鏈服務。正如我幾個月前所討論的,初創公司進入流媒體市場的目的是打破Netflix Inc.,YouTube和其他備受關注的內容看門 人的束縛, 他們將視頻和其他流媒體娛樂過度分配給多設備,多渠道的最終用戶,在世界上。這些初創企業中的大多數都試圖通過構建對等媒體環境來拉平視頻流市場,其中沒有中央服務器來存儲和管理內容。

    這些創業公司的共同點是使用區塊鏈作為以下所有功能的基礎平臺:視頻存儲,分發和治理。據我所知,沒有人將基于AI的視頻處理作為一項整體或擴展功能提供,但這似乎是有前途的下一步,以開發可能賺錢的新服務。這些AI功能-除了一些基于區塊鏈的加密貨幣(發行商,查看者和其他生態系統參與者之間有數種付款方式)之外-似乎是為GPU加速數據庫量身定制的。

    但目前尚不清楚GPU數據庫提供商是否正在探索這種機會。對于它們中的大多數,最可能的增長途徑將是混合數據環境中的高性能查詢加速器。

  • 成人app