您現在的位置是:首頁 >財經 > 2021-04-30 21:57:23 來源:
人工智能計算的爆炸性增長表明企業必須對戰略有所了解
人工智能研究組織OpenAI最近發布的一份報告顯示,自2012年以來,最大機器學習系統中訓練運行所需的計算能力已增加了300,000倍。由于機器學習結果在獲得額外計算資源時有所改善,我們可能會看到對硅基礎設施提出更高要求以獲得更好的結果。
企業越來越多地使用機器學習來自動化復雜問題和分析任務。但OpenAI的研究表明,未來面臨著一個關鍵挑戰:當技術要求不斷變化時,企業如何構建他們所需的業務成果所需的基礎架構?
首先,企業應該嘗試找到解決手頭業務問題所必需的最簡單的算法。雖然大規模復雜的神經網絡現在在機器學習領域風靡一時,但很少涉及的技術很容易解決許多問題。例如,Kaggle上的數據科學競賽通常是通過梯度提升的決策樹而不是深度神經網絡來贏得的。
當然,一些公司遇到的問題最好通過更復雜的模型來解決,但關鍵是盡可能降低復雜性。這提供了幾個好處,因為更簡單的模型更容易排除故障,更容易理解,并且培訓成本更低。
了解物理基礎設施
其次,企業應該只購買滿足其機器學習工作量要求所需的硬件。這似乎是顯而易見的,但在這種情況下尤其重要,因為硅供應商正在迅速改變他們銷售的產品以滿足這個相對較新的市場的需求。考慮Nvidia的新Volta架構,其中包括機器學習任務的專用加速。
在適用的情況下,公司應利用云平臺來簡化AI硬件車隊的配置,尤其是對于沒有固定需求的工作負載。在一個主要云中動態部署大型GPU集群比在私有數據中心采購和設置這樣的環境要容易得多。如果不再需要該群集,企業可以將其關閉。
目前,OpenAI預計頂級算法將在購買成本“單位數百萬美元”的集群上運行。但是,除非現在或在不久的將來滿足業務需求,否則走出去并配置這么大的集群是沒有意義的。
基礎設施需求是一個不斷變化的目標,因為支持這些機器學習系統的算法可能會有所改進。最近由斯坦福大學的數據分析下一步(DAWN)小組舉辦的一次競賽展示了軟件和硬件優化如何以低成本創建高度精確的模型。
使用既定的基礎
在考慮提供大量芯片之前,公司應該對一兩個流行的開源框架進行標準化,這些框架有助于機器學習模型的開發和部署。谷歌的TensorFlow似乎是一個安全的選擇,因為它在開源領域很受歡迎,但還有其他一些選項,包括微軟的Cognitive Toolkit(CNTK),PyTorch(Facebook使用)和Apache MXNet(亞馬遜的首選框架)。
當像Nvidia和Intel這樣的公司嘗試為在其硬件上運行的機器學習算法提供優化的執行環境時,他們通常會將精力集中在少數幾個框架上,如上面列出的那樣。這些類型的軟件優化可以幫助提高性能,而無需公司采購額外的硬件。此外,這些框架使創建機器學習系統變得更加容易,公司可以利用這種敏捷性來利用現場出現的新技術或只是改進處理已知問題的方法。
最重要的是,機器學習是一個快速變化的領域,需要企業批判性地思考他們在基礎設施方面的投資,并建立一個能夠適應可能需要大量計算能力的現有技術變化的敏捷環境。
Blair Hanley Frank是ISG的技術分析師,負責云計算,應用程序開發現代化,人工智能和現代工作場所。他以前是VentureBeat的一名職員作家。