中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

為何數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要通才而非專(zhuān)才

2019-03-26    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

在“國(guó)富論”中,亞當(dāng)·斯密通過(guò)一項(xiàng)鋼針工廠(chǎng)流水線(xiàn)的生動(dòng)例子說(shuō)明了勞動(dòng)分工是生產(chǎn)力的主要來(lái)源這一觀點(diǎn):“第一個(gè)人拔出鋼絲,第二個(gè)人拉直鋼絲,第三個(gè)人切割鋼絲,第四個(gè)人削尖針頭,第五個(gè)人打磨鋼針。”

 

 

通過(guò)功能專(zhuān)業(yè)化,每位工人都變得非常嫻熟于其所專(zhuān)一的任務(wù),從而提高了效率。人均產(chǎn)出增加了,工廠(chǎng)生產(chǎn)鋼針的效率也變得極高。按職能劃分的這種分工即使在當(dāng)代社會(huì)勞動(dòng)觀念中也根深蒂固——我們能夠迅速按照彼此專(zhuān)長(zhǎng)來(lái)組織團(tuán)隊(duì),數(shù)據(jù)科學(xué)領(lǐng)域也不例外。

一項(xiàng)端到端算法業(yè)務(wù)需要許多職能,因此公司通常會(huì)組建涵蓋各領(lǐng)域?qū)<业膱F(tuán)隊(duì):科研人員、數(shù)據(jù)工程師,機(jī)器學(xué)習(xí)工程師,因果推理科學(xué)家等等。

 

 

專(zhuān)家的工作由產(chǎn)品經(jīng)理協(xié)調(diào),而職能之間以類(lèi)似鋼針工廠(chǎng)的方式進(jìn)行交接:“一個(gè)人負(fù)責(zé)數(shù)據(jù)來(lái)源,另一人負(fù)責(zé)搭建模型,第三個(gè)人實(shí)施模型,第四個(gè)人評(píng)估模型”等等。

我們并不應(yīng)該為了提高所謂生產(chǎn)力而優(yōu)化我們的數(shù)據(jù)科學(xué)團(tuán)隊(duì)。除非是在當(dāng)你明確知道你正在做什么并且為了尋求提高效率,畢竟流水線(xiàn)的目標(biāo)是執(zhí)行。

在亞當(dāng)斯密的例子中,我們很明確地知道我們想要什么,人們想到的任何產(chǎn)品和服務(wù)都給出了相應(yīng)的要求,這些要求完整地描繪了產(chǎn)品及行為服務(wù)的方方面面。只有這樣,員工才能有效的執(zhí)行他們相應(yīng)的職責(zé)。

但數(shù)據(jù)科學(xué)的目標(biāo)不是執(zhí)行,恰恰相反,數(shù)據(jù)科學(xué)的目標(biāo)是學(xué)習(xí)并發(fā)展更先進(jìn)的新業(yè)務(wù)能力。

比如設(shè)計(jì)出無(wú)法被預(yù)先設(shè)計(jì)的算法產(chǎn)品和服務(wù),類(lèi)似于推薦系統(tǒng),客戶(hù)參與引導(dǎo),風(fēng)格偏好分類(lèi),尺寸匹配,時(shí)裝設(shè)計(jì)系統(tǒng),物流優(yōu)化,季節(jié)性趨勢(shì)檢測(cè)等。這些產(chǎn)品都比較新奇且具有不確定性。

 

 

沒(méi)有現(xiàn)成的藍(lán)圖可供遵循。系數(shù),模型,模型類(lèi)型,超參數(shù)...你需要的所有這些組成部分都必須通過(guò)實(shí)驗(yàn),反復(fù)試錯(cuò)以及不斷迭代來(lái)學(xué)習(xí)。

對(duì)于鋼針工廠(chǎng)而言,學(xué)習(xí)與設(shè)計(jì)是在制造開(kāi)始之前就被完成的。而對(duì)于數(shù)據(jù)科學(xué)而言,你可以隨用隨學(xué),并不非得在應(yīng)用之前就全部學(xué)會(huì)一切。

在鋼針工廠(chǎng)這種學(xué)習(xí)在前的模式中,我們既不期望也不需要工人在產(chǎn)品的任何方面即興發(fā)揮;我們只需要工人們更高效地進(jìn)行生產(chǎn)。按功能分部門(mén)是有意義的,因?yàn)槿蝿?wù)專(zhuān)業(yè)化可以提高流程效率和生產(chǎn)一致性(也即最終產(chǎn)品高度標(biāo)準(zhǔn)化)。

但是,當(dāng)產(chǎn)品仍在不斷發(fā)展,并且目標(biāo)是學(xué)習(xí)時(shí),這樣的分工專(zhuān)業(yè)化至少會(huì)在以下幾個(gè)方面阻擋我們實(shí)現(xiàn)目標(biāo)。

協(xié)調(diào)成本增加

協(xié)調(diào)成本分擔(dān)在溝通、討論、證明和取舍工作時(shí)的時(shí)間里。這些成本與所涉及的人數(shù)呈超線(xiàn)性關(guān)系。當(dāng)數(shù)據(jù)科學(xué)家按職能分組,每次更改以及每次交接等都會(huì)使協(xié)調(diào)成本很高。

例如,統(tǒng)計(jì)建模專(zhuān)家每次想要嘗試新功能都必須與準(zhǔn)備數(shù)據(jù)集的數(shù)據(jù)工程師協(xié)調(diào)。同樣,每個(gè)訓(xùn)練過(guò)的新模型都意味著建模者需要有人協(xié)調(diào)部署。

等待時(shí)間增加

 

 

比協(xié)調(diào)成本更加討厭的是每項(xiàng)工作之間等待的時(shí)間。比如舉行會(huì)議、討論、設(shè)計(jì)評(píng)審所需的時(shí)間,等待時(shí)間通常以數(shù)天或數(shù)周甚至數(shù)月來(lái)衡量!

專(zhuān)家們的時(shí)間表很難協(xié)調(diào),因?yàn)槊總(gè)專(zhuān)家都必須配有數(shù)個(gè)項(xiàng)目。一個(gè)小時(shí)的討論變化的會(huì)議可能需要數(shù)周才能排上日程表。而且,一旦對(duì)變化做出調(diào)整,實(shí)際工作本身也需要在多個(gè)其他項(xiàng)目爭(zhēng)奪專(zhuān)家時(shí)間的情況下進(jìn)行安排。

內(nèi)容縮小

 

 

分工可以通過(guò)獎(jiǎng)勵(lì)人們留在他們的“本專(zhuān)業(yè)”來(lái)人為地限制學(xué)習(xí)。例如,被委任保持在其職能范圍內(nèi)的研究科學(xué)家需要把精力集中在試驗(yàn)不同類(lèi)型的算法上。如:回歸、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等等。

雖然良好的算法選擇可以帶來(lái)改進(jìn),但是,通過(guò)集成新數(shù)據(jù)源等其他活動(dòng),通?梢垣@得更多收益。同樣,科學(xué)家可能會(huì)開(kāi)發(fā)一種能挖掘出數(shù)據(jù)攜帶的所有信息的模型。然而,其較大的機(jī)會(huì)可能卻在于改變目標(biāo)函數(shù)或松弛某些約束條件。

當(dāng)科學(xué)家的工作職能受限時(shí)他們很難看到或做到這一點(diǎn)。研究科學(xué)家專(zhuān)注于優(yōu)化算法,因此他們不太可能追求其他任何東西。

當(dāng)數(shù)據(jù)科學(xué)團(tuán)隊(duì)像鋼針工廠(chǎng)一樣運(yùn)行時(shí),某些癥狀就會(huì)出現(xiàn)。等待數(shù)據(jù)管道更改”和“等待機(jī)器學(xué)習(xí)資源”是常見(jiàn)的阻礙工作的狀態(tài)。數(shù)據(jù)科學(xué)團(tuán)隊(duì)過(guò)度專(zhuān)業(yè)化可能會(huì)讓團(tuán)隊(duì)成員錯(cuò)失更多學(xué)習(xí)的機(jī)會(huì)。

解決這個(gè)問(wèn)題的辦法就是擺脫各司其職的工廠(chǎng)模式。

 

 

為了促進(jìn)學(xué)習(xí)和迭代,數(shù)據(jù)科學(xué)家們應(yīng)有更全面的角色,廣泛的職責(zé)與專(zhuān)業(yè)技術(shù)實(shí)質(zhì)上并不沖突。

組織構(gòu)架需要促使數(shù)據(jù)科學(xué)家們不斷學(xué)習(xí)。這意味著招聘“全棧數(shù)據(jù)科學(xué)家” ,也就是“通才”,從概念到建模,從實(shí)施到測(cè)試。

當(dāng)組織方式不同時(shí),這樣的激勵(lì)措施能更好地將學(xué)習(xí)與效率保持一致。例如,假設(shè)你有一個(gè)需要實(shí)現(xiàn)三個(gè)業(yè)務(wù)功能的三人小組。在各司其職的工作模式下,三位員工致力于每項(xiàng)技能,且沒(méi)有其他人可以完成他們的工作。而在全棧的工作模式中,每個(gè)通用數(shù)據(jù)科學(xué)家都致力于其業(yè)務(wù)方向,這樣就增加了規(guī)模,也有助于學(xué)習(xí)能力的提高。

由于等待環(huán)節(jié)的人數(shù)減少,協(xié)調(diào)成本直線(xiàn)下降。通用數(shù)據(jù)科學(xué)家在各職能之間流動(dòng),擴(kuò)展數(shù)據(jù)管道以處理更多的數(shù)據(jù),嘗試在模型中添加新功能,將新版本部署到生產(chǎn)環(huán)境進(jìn)行因果測(cè)試,并在新想法出現(xiàn)時(shí)能夠立即重復(fù)以上步驟。因此,迭代周期會(huì)下降。

 

 

我們的全才專(zhuān)家可能不像任何一個(gè)職能部門(mén)的專(zhuān)家那樣?jì)故。但我們并不尋求?shí)現(xiàn)某一種卓越的職能或小幅度的優(yōu)化。相反,我們尋求學(xué)習(xí)和發(fā)現(xiàn)具有階梯式變化影響的全新業(yè)務(wù)能力。

憑借整體解決方案的完整背景,通用數(shù)據(jù)專(zhuān)家可以看到單一領(lǐng)域?qū)<覠o(wú)法看到的機(jī)會(huì)。去嘗試更多的創(chuàng)新, 盡管失敗,但失敗成本較低,有利于快速迭代和激勵(lì)學(xué)習(xí)。

值得注意的是,賦予全棧數(shù)據(jù)科學(xué)家的這種自主性和技能的多樣性在很大程度上取決于一個(gè)假設(shè)的可靠數(shù)據(jù)平臺(tái)。

構(gòu)建良好的數(shù)據(jù)平臺(tái)能將數(shù)據(jù)科學(xué)家從應(yīng)用容器、分布式處理、自動(dòng)故障轉(zhuǎn)移和其他高級(jí)計(jì)算機(jī)科學(xué)概念的復(fù)雜性中抽離出來(lái)。

除此之外,強(qiáng)大的數(shù)據(jù)平臺(tái)還可以為實(shí)驗(yàn)基礎(chǔ)架構(gòu)提供無(wú)縫銜接、自動(dòng)化監(jiān)控和警報(bào)、自動(dòng)擴(kuò)展的功能,并實(shí)現(xiàn)調(diào)試輸出和算法結(jié)果的可視化。這些組件由數(shù)據(jù)平臺(tái)工程師設(shè)計(jì)和構(gòu)建,但很明顯,數(shù)據(jù)科學(xué)家和數(shù)據(jù)平臺(tái)團(tuán)隊(duì)之間沒(méi)有任何交接。

全棧數(shù)據(jù)科學(xué)模型依賴(lài)于優(yōu)秀的人才,他們不是獨(dú)角獸,它們既可以被發(fā)現(xiàn)也可以被制造出來(lái)。這種人才的需求很大,因此,強(qiáng)大的公司價(jià)值觀, 有競(jìng)爭(zhēng)力的薪酬以及有趣的工作才是吸引此類(lèi)人才的關(guān)鍵。

正因如此, 通用人才自身在工作中所展現(xiàn)的自主性、掌控力和目的性也是提高他們對(duì)工作滿(mǎn)意度的關(guān)鍵因素,因?yàn)樗麄儾灰蕾?lài)別人取得成功,并且可以掌握端到端的業(yè)務(wù)能力,并且可以有目的性的完成自己的項(xiàng)目以獲得成就感。

相關(guān)報(bào)道:

https://hbr.org/2019/03/why-data-science-teams-need-generalists-not-specialists

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:“金剛護(hù)體”好看能打 夏普80英寸8K電視詳解

下一篇:全球最具創(chuàng)造力企業(yè)榜單出爐:谷歌排第一,阿里、華為未進(jìn)前十