• 您現在的位置是:首頁 >財經 > 2021-04-10 20:07:13 來源:

    IBM如何建立一個有效的數據科學團隊

    導讀 數據科學是一項團隊運動。這種情緒不僅體現在我們在IBM內部的經驗,也體現在我們的企業客戶身上,他們經常向我們詢問如何在他們自己的組織

    數據科學是一項團隊運動。這種情緒不僅體現在我們在IBM內部的經驗,也體現在我們的企業客戶身上,他們經常向我們詢問如何在他們自己的組織內構建數據科學團隊的建議。

    IBM如何建立一個有效的數據科學團隊

    然而,在此之前,重要的是要記住,執行數據科學項目所需的各種技能既稀有又獨特。這意味著我們需要確保每個團隊成員都能專注于他或她最擅長的事情。

    雖然每個角色肯定都是不同的,但每個團隊成員確實需要具備T形技能 - 這意味著他們需要在自己的角色中擁有深度,同時還要粗略地理解相鄰角色。

    讓我們從圖表中更深入地探索每個角色。

    產品所有者

    產品所有者是主題專家,對特定的業務部門及其關注點有深刻的理解。在某些情況下,產品所有者的主要角色將是業務方面,而他們定期與數據科學團隊合作,在回到更廣泛的角色之前解決特定的數據科學問題或一系列問題。

    實際上,循環回到正常角色對數據科學團隊是有益的。這意味著產品所有者充當模型的最終用戶,可以提供具體的反饋和請求。這也意味著產品所有者可以從業務部門內部倡導數據科學。

    產品所有者通常負責:

    定義業務問題并與數據科學家合作以定義工作假設

    幫助根據需要定位數據和數據管理員

    經紀和解決數據質量問題

    數據工程師

    數據工程師是將所有數據移動到重心并通過服務和消息隊列連接數據的向導。他們還構建API以使數據通常可供企業使用,并且他們負責將數據設計到最適合團隊需求的平臺上。有了數據工程師,我們會尋找以下三大技能:

    精通以下至少三項:Python,Scala,Java,Ruby,SQL

    精通消費和構建REST API

    精通將預測和規范模型集成到應用程序和流程中

    數據科學家

    數據科學家傾向于填補兩個不同角色中的一個:機器學習工程師和決策優化工程師。由于市場條件已經導致“數據科學家”成為如此熱門的角色,因此做出這種區分可以消除一些令人困惑的擺動空間。(關于我們的詳細想法,請參閱我們最近關于VentureBeat的文章。)

    機器學習工程師

    機器學習工程師構建機器學習模型,這意味著識別每個模型中使用的重要數據元素和特征。他們確定使用哪種類型的模型,并測試這些模型的準確性和精確度。他們還負責模型的長期監控和維護。他們需要這三項技能:

    應用概率和統計數據的培訓和經驗

    具有數據建模和評估經驗,并深入了解有監督和無監督的機器學習

    體驗至少以下兩種方案的編程:Python,R,Scala,Julia或Java,優先考慮Python專業知識

    決策優化工程師

    決策優化工程技能和經驗與機器學習工程師重疊,但差異很重要。決策優化工程師需要以下三大技能:

    將數學建模和/或約束規劃應用于一系列行業問題的經驗

    熟練掌握Python的編程技巧,并能夠將預測模型作為決策優化問題的輸入

    體驗蒙特卡羅模擬/優化以進行假設情景分析

    數據記者

    這就把我們帶到了數據記者,他們幫助代表模型輸出的團隊成員在驅動它的數據的背景下,誰可以清楚地表達手頭的業務問題。有了數據記者,我們會尋找以下三大技能:

    Python,Java或Scala中的編碼技巧

    在業務問題的上下文中集成數據以及預測和規范模型的輸出

    熟練掌握數據解析,抓取和爭吵

    如果你能夠聚集一個擁有這些基本技能的團隊 - 如果你能確保他們能夠很好地協作并保持對彼此工作的有意義的理解 - 那么你將會很好地發現可以增強任何組織的洞察力和理解力'領先。

    沒有他們,你可能會失明。

    Seth Dobrin是IBM Analytics的副總裁兼首席數據官。

  • 成人app