想留住人才?先要管理好數據科學團隊
2020-04-20 來源:raincent

不管在什么地方做一名管理者,都不是一件易事,但管理一支數據科學團隊的話,可能就特別富有挑戰(zhàn)性了。角色仍然不斷變化,加之人員流動率居高不下,公司正在尋找團隊運作的最佳實踐方式。而成為一名技術專家,卻未必能讓你為管理他人做好準備。
無論你現(xiàn)在是在管理一支數據科學團隊,還是準備啟動一支數據科學團隊,亦或者希望將來能夠成立一支數據科學團隊,本指南將使你成為企業(yè)中更好的數據科學團隊管理者。
如何聘用和留住數據科學家
在最近舉行的數據科學領袖 Rev 峰會上的小組討論中,三位專家分享了他們有關聘用、留住和培養(yǎng)數據科學人才的建議。
他們的建議總結如下。
來自數據科學管理者的建議
首先,招募領導者
如果你從初級員工或剛從學術界畢業(yè)的人開始,沒有導師指導的話,他們很有可能會感到迷茫和沮喪。ShopRunner 的數據科學高級總監(jiān) Michelangelo D’Agostino 建議,首先要安排一個更有經驗的人來帶領團隊。
謹慎甄選管理者
不要只關注技術人才和經驗。小組成員一致認為,謙遜、好奇心以及傾聽和接受反饋的能力,是擔任高級職位的關鍵特征。D’Agostino 說:“即將負責的人必須清楚,他們并沒有所有的好主意或者答案。”他建議,讓未來的員工描述他們失敗的情況,聽聽他們將如何避免重蹈覆轍,以此來衡量他們自我反省的能力。
反思數據挑戰(zhàn)
鑒于競爭激烈的招聘環(huán)境,繁重的開卷考試可以篩選出合格的求職者,要營造出一種緊張的考試氛圍。Insight Data Science 的首席數據科學家 Patrick Phelps 表示,其實無需這些挑戰(zhàn)就能招到優(yōu)秀員工。“這真的很難衡量……并且評分需要很長的時間,”他說,“我寧愿讓一名優(yōu)秀的數據科學家和我的團隊在一個房間里呆上一個小時。”如果確實包含挑戰(zhàn)的話,D’Agostino 建議,讓求職者在辦公室完成一次編碼練習,并像在非正式的代碼審查中進行討論。
數據科學家的招聘和入職計劃
這個招聘和入職計劃模板通過關鍵問題來幫助團隊尋找和培訓新的數據科學家。計劃模板包括吸引頂尖人才、招聘流程、入職、留任等關鍵問題。
通過采取系統(tǒng)的方法,數據科學領導者將最大限度發(fā)現(xiàn)并培養(yǎng)一個團隊,這個團隊要大于團隊組成部分的總和。
可以下載這份招聘計劃的 PDF 版本,便于打印。
吸引頂尖人才
你對候選數據科學家的不同價值主張是什么?列出三個獨一無二的事情,你認為這些事情能讓你與目標候選人群產生共鳴。在小組中測試你的演講,獲取反饋。
有哪些 1~3 級風險,可能會讓機會不如競爭機會那般有吸引力?你如何減輕或者超越它們呢?
招聘過程
你的應聘者最重要的三個特征是什么?
你對每個人的評估計劃是什么?
入職
在最初的 30 天、60 天和 90 天內需要完成哪些活動和成果?
你的新員工需要知道的最重要的“部落知識”是什么?她 / 他將如何學習這些知識?例子包括數據源、項目方法、利益相關者動態(tài)、顯著的得失等。
留任和管理
你希望應聘者在一年內發(fā)展什么技能?
一年后,哪些指標將決定該應聘者是否成功?例子包括某些業(yè)務指標、社區(qū)貢獻、生成的見解數目或項目迭代速度。
留住你的人才
不要過分夸大這個角色。約有半數的數據科學家在他們的崗位上不超過兩年。Domino 的客戶成功經理 Conor Jensen 建議,為了降低人員流動率,要誠實地告訴應聘者你正在招聘的職位的具體情況。“要非,F(xiàn)實地知曉關于角色的定位,痛苦將會是什么,你認為影響會在哪里,以及時間線是什么樣的。”他說,“很多時候,我們對作為數據科學家將要完成的事情感到亢奮,而且我們可以領先一步。”
了解團隊成員的動機。 Jensen 建議花點時間去發(fā)現(xiàn)每個員工的目標、興趣和個人激勵。然后你可以將它們與獎勵項目配對,并以一種有意義的方式來認可他們的成就。
提供支持。 Phelps 說:“數據科學可能是一門失敗的學科:模型失敗、流程失敗、數據源變得糟糕透頂。”他建議提供積極的支持,并提醒團隊成員,可能需要數年的時間才能看到影響。Jensen 還建議將問題分解成可控的小塊,這樣員工就不會被巨大的項目給嚇破膽。
創(chuàng)造學習機會。 D’Agostino 觀察到,數據科學家經常因為感到無聊而辭職。如果核心項目不夠前沿,他建議為團隊成員創(chuàng)造學習新事物的機會,例如,每周一次午餐討論最新的研究成果,或者偶爾舉辦黑客馬拉松來測試新的軟件框架和計算技術。
成功數據科學管理者的習慣
以下是我們在許多成功的數據科學管理者身上觀察到的七個習慣,沒有特定的順序。
與其他利益相關者建立聯(lián)系。 通過打開與其他團隊的溝通渠道,避免摩擦和交叉。在每個新項目開始之前,考慮讓數據科學家和產品經理在一個房間呆上一個小時,以確保他們達成共識。讓數據科學家不帶筆記本電腦參加會議,可以迫使他們與其他利益相關者溝通。給數據科學家機會向工程師、產品經理和其他人解釋他們的工作,也可以改善溝通。
跟蹤性能。使用模板來跟蹤你所討論的內容、你所設定的目標,以及你在單獨討論會議中給出的反饋。依靠記憶是行不通的。
目標是將項目投入到生產中。準備團隊部署他們自己的 API 服務并生成代碼,可以幫助你更快地工作,并且,你還不會被可能無法使用的工程資源所阻塞。
開始隨叫隨到的輪換。隨著團隊規(guī)模的擴大,每周安排一次數據科學家隨叫隨到的輪換,以修復出現(xiàn)故障的模型。這樣有助于更好地編制文檔,并讓那些沒有安排隨叫隨到的人有時間專注于核心項目。
敢于問一些愚蠢的問題?此坪唵蔚膯栴},可以為發(fā)現(xiàn)和解決基本問題打開大門。
活到老,學到老。 進行大量的閱讀以跟上這個快速發(fā)展的領域的步伐。不僅要閱讀技術材料,還要了解管理和組織心理學相關的知識。
放下,但不至于永遠。 如果你是新任管理者,請考慮三到六個月放下編碼的工作。否則,你可能永遠不會真正接受管理者的角色轉變,而且可能為團隊提供的服務水平低下。成功進入角色之后,你就可以自由地處理那些非關鍵項目,或者那些沒有人愿意做的事情。
知識管理
數據科學家經常對知識管理這一話題感到恐懼。有些人認為這是對他們從“真正的”工作中分散注意力;其他人并沒有完全理解這意味著什么。甚至很多人看到這個概念的價值,也會覺得這個過程很痛苦。
但是,Point72 的首席市場情報官 Matthew Granade 和 Domino 數據實驗室產品總監(jiān) Mac Steele 表示,知識管理能力將成為企業(yè)競爭優(yōu)勢的一個關鍵因素。在下面的視頻中,他們兩人闡述了為什么知識管理很重要,以及企業(yè)應該如何優(yōu)先考慮知識管理。
數據科學團隊的知識管理要點如下。
什么是知識管理?
知識管理的目標就是捕獲洞察力,這可以定義為“更好的理解”。因此,洞察力是相對的:它是關于不斷改進之前的想法。從 Einstein 到 Freud,洞察力往往被視為“孤獨天才”的專利。事實上,大多數洞察力來自于與他人的合作和對現(xiàn)有想法的拓展。
創(chuàng)建這種“復合機器”需要一種獲取知識的方法,一種供用戶遵循的框架,以及通過反饋改進的機制。企業(yè)的未來將越來越多地取決于它們在這方面的表現(xiàn)。隨著更多的算法和基礎設施得到廣泛的應用,數據科學人才庫不斷增長,數據共享需求不斷擴大,捕獲和增強獨特洞察力的能力將成為一個關鍵的差異化因素。
為何知識管理如此困難?
知識管理的一些挑戰(zhàn)困擾著每個行業(yè):
提前組織知識很困難。分類往往過于死板,因為你不知道將來什么才是重要的。
幾乎沒有參與的動機。正如一位數據科學家所言,“我今年所做的工作是有報酬的,而不是維護我去年所做的工作。”
這是一個典型的集體行動問題。沒有人想成為第一個在文檔上花費時間的人。當知識被捕獲時,人們很難知道如何將其付諸行動。
系統(tǒng)總是落后于現(xiàn)實。如果知識管理需要額外的時間,并且是在與核心工作不同的系統(tǒng)中進行的,那么它的質量勢必會受到影響。
其他障礙則是數據科學團隊獨有的:
人們使用不同的工具。當團隊中一些成員使用 R 語言,而另一些成員使用 Python;當一些成員在 GitHub 中存儲代碼,而另一些人在電子郵件中存儲代碼時,知識管理就變得更加困難了。由于人員流動率較高,培訓人員使用相同的系統(tǒng)就變成了一粧難事。
單個項目的組成部分是分散的。制品和洞察力可以通過 Docker 商店、wiki、幻燈片演示等傳播。
如果你有代碼,但這并不意味著你可以重新運行這段代碼。對 600 篇計算機研究論文進行的元分析發(fā)現(xiàn),只有 20% 的代碼可以重新運行;其中,許多第二次嘗試的結果略有不同。
如何提高知識管理水平
有四個步驟可以幫助數據科學領導者改進其企業(yè)組織中的知識管理水平:
1. 在一個地方盡可能多地獲取知識。
里面的東西越多,你與它們之間的聯(lián)系就越多,價值就以這種方式增長。你不希望人們在邊緣工作。一個包含核心工作和知識管理的公共平臺是確保完成工作并將負擔最小化的關鍵。如果你不能捕捉一切,那就從最有價值的模型或知識開始,然后圍繞它構建一個系統(tǒng)。
測試:分別詢問貴司的五位數據科學家:“您認為這個團隊現(xiàn)在正在做多少個項目?”他們可能會給出不同的答案。
2. 選擇一個允許發(fā)現(xiàn)、來源、重用和模塊化的知識管理系統(tǒng)。
發(fā)現(xiàn): 數據科學家耗費大量時間來搜索信息,從而降低了工作效率。團隊必須做出決定是采用管理知識(Yahoo 方法)還是索引知識(Google 方法)。當領域相對穩(wěn)定時,內容管理就有意義了。當領域是流動的時候,索引和搜索是最好的方案,而且你也不可能事先知道分類法應該是什么樣子的。
測試:讓新員工來處理某個主題,并計算他們收集正確的制品需要多長時間。如果是幾周或幾個月的話,那就是個危險的信號。
來源: 讓人們專注于知識管理的重要方面。使用一個平臺,讓人們可以綜合他們的工作,而不必跟蹤他們使用的軟件版本。
測試:事先寫下你認為團隊成員應該花在文檔上的時間百分比。然后問他們實際花了多長時間。這可能會讓你感到大開眼界。
重用: 如果它不能運行,那么就不會被重用。這不僅需要訪問代碼,還需要訪問數據集的歷史版本。
測試:請新員工重現(xiàn)另一位數據科學六個月前所做的工作,最好是已經離開團隊或組織的人。讓他用最新的數據來更新它。如果這過程需要一周或一個月,那就麻煩了。
分解與模塊化: 確保人們有動機和工具來創(chuàng)建可重用、構建的構件塊。
測試:請兩個從事過類似項目的團隊進行事后分析,并確定重疊的工作。
3. 確定正確的知識單元
復合系統(tǒng)依賴于知識單元。在學術界中,這些都是書籍和論文;而在軟件中,這些都是代碼。在數據科學中,模型是組織的正確選擇,因為它是數據科學家所做的事情。模型包括數據、代碼、參數和結果。
4. 超越技術進行思考
人員和流程層面的變化也很重要。重新定義人們如何看待自己的工作:他們應該花更少的時間去做事,花更多的時間去整理和學習。在招聘和薪酬方面,要將合作放在首位。最后,雖然知識管理應該被視為每個人的工作,但一些組織為管理或促進知識創(chuàng)造了新的角色。
合作
以下三個視頻提供了一系列關于數據科學家與企業(yè)內其他利益相關者之間合作的經驗教訓。
促進合作的內部實踐
視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=f4vx20cf39
營造合作環(huán)境
視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=ommsdpxse7
如何影響公司變革
視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=zz4ifvz4jr
壯大數據科學團隊
氣候公司(The Climate Corporation)科學副總裁 Erik Andrejko 花了數年的時間關注這一問題,建立并發(fā)展多學科數據科學團隊。
在下面的視頻中,Erik 討論了如何繼續(xù)建設世界級的數據科學團隊。他還討論了數據科學的實踐、組織的擴展以及數據科學項目的關鍵組成部分與最佳實踐。
視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=nxv79gqolp
來自財富 500 強的經驗教訓
通過與從敏捷初創(chuàng)公司到財富 500 強等公司合作,我們已經能夠策劃這些組織的用例,并從這些組織中了解不斷增長的數據科學團隊所面臨的挑戰(zhàn)和成功。
在這段視頻中,我們分享了其中的一些經驗,包括:數據科學項目的目標、挑戰(zhàn)、執(zhí)行診斷、管理項目和系統(tǒng),以及利用數據科學平臺進行擴展。
視頻鏈接:
https://www.dominodatalab.com/resources/field-guide/managing-data-science-teams/?wvideo=glml8q24a1
后續(xù)步驟
本指南涵蓋了管理企業(yè)中數據科學團隊的人力資源的各個環(huán)節(jié):招聘和入職,扶持團隊走向成功,培養(yǎng)正確的習慣,獲取和管理知識,以及促進合作,F(xiàn)在,是時候讓這些數據科學家需要做點什么了。了解如何在企業(yè)重管理數據科學項目。
作者介紹:
Domino Data Lab(Domino 數據實驗室),提供了一個開放、統(tǒng)一的平臺,可以大規(guī)模構建、驗證、交付和監(jiān)控模型。他們幫助客戶接受模型管理,快速交付高影響力的模型,并使數據科學成為客戶的競爭優(yōu)勢之一。Domino 是一個數據科學平臺,使數據科學團隊能夠快速開發(fā)和部署推動突破性創(chuàng)新和競爭優(yōu)勢的模型。
原文鏈接:Enterprise Data Science Field guide > Managing Data Science Teams
版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。