中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

我是如何建立完美的數(shù)據(jù)科學(xué)團(tuán)隊(duì)

2019-10-10    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

by Jean Georges Perrin 來源:DZone

當(dāng)我組建第一個(gè)數(shù)據(jù)科學(xué)團(tuán)隊(duì)時(shí),這個(gè)術(shù)語在《哈佛商業(yè)評論》上幾乎沒有印出來。我不知道我正在組建一支在大數(shù)據(jù)和數(shù)據(jù)科學(xué)領(lǐng)域處于先驅(qū)地位的團(tuán)隊(duì),F(xiàn)在是反思這個(gè)十二年前開始的故事的好時(shí)機(jī)。

首先,我真的很想為這篇文章冠以“我如何建立一支完美的數(shù)據(jù)科學(xué)團(tuán)隊(duì)(不知道如何)”的標(biāo)題。但是,我不想給人留下我不知道自己在做什么的印象(我認(rèn)為我做了) 。不過,這是我的故事...

2007年,我創(chuàng)立了GreenIvory。這個(gè)想法是為網(wǎng)絡(luò)營銷人員建立一個(gè)工具箱。無論營銷人員是想要自動(dòng)化內(nèi)容分發(fā),內(nèi)容生成,還是通過情感分析來衡量品牌知名度,我們都有一個(gè)解決方案(還有更多解決方案!)。不久之后,該團(tuán)隊(duì)開始研究NLP(自然語言處理),并于2011年初發(fā)布了首款可進(jìn)行情感分析的產(chǎn)品。我們解決了許多技術(shù)難題,但我們將重點(diǎn)放在人員和組織方面。

“green team”由一群才華橫溢的軟件工程師組成。每位工程師在系統(tǒng)的各個(gè)關(guān)鍵要素上都有自己的強(qiáng)項(xiàng):UI,數(shù)據(jù),爬蟲,系統(tǒng),操作等。我們之前已經(jīng)推出了幾個(gè)項(xiàng)目和產(chǎn)品。這是一個(gè)工作模型。然而,我們沒有足夠的科學(xué)。 我們需要可以幫助我們將科學(xué)知識注入工程團(tuán)隊(duì)的人。 那時(shí)我們與斯特拉斯堡大學(xué)合作,聘請了一位數(shù)據(jù)科學(xué)家(當(dāng)時(shí)他并沒有這個(gè)頭銜)。

時(shí)間軸和業(yè)務(wù)價(jià)值

 

 

我們的主要問題是時(shí)間表。或更確切地說,數(shù)據(jù)科學(xué)與工程學(xué)之間缺乏一致性。那時(shí),我們已經(jīng)在遵循敏捷方法論。與當(dāng)時(shí)的大多數(shù)公司一樣,它是本地生產(chǎn)的版本,但它是團(tuán)隊(duì)驅(qū)動(dòng)的,我們擁有一個(gè)出色的敏捷冠軍。運(yùn)行正常。

每個(gè)Sprint都在交付業(yè)務(wù)價(jià)值,我們經(jīng)常在開發(fā)過程中更新工件,面臨的挑戰(zhàn)就是將科學(xué)家的工作在工程組織。

 

 

歸結(jié)為將他直接整合到開發(fā)團(tuán)隊(duì)中。我希望他充當(dāng)燈塔。這并不容易。有點(diǎn)文化沖突。工程師們不明白為什么要花這么多時(shí)間來獲取東西,以及為什么要花這么多時(shí)間來做。在他的身邊,這位科學(xué)家無法理解為什么他的實(shí)驗(yàn)雖然在Mac上取得了成功,但是當(dāng)我們向他的算法拋出數(shù)百萬個(gè)句子時(shí)卻無法擴(kuò)展。

最后,經(jīng)過無數(shù)次結(jié)對編程,討論并建立了更強(qiáng)的團(tuán)隊(duì)合作精神,我們得以在產(chǎn)品中利用科學(xué)。

反例

 

 

最近,我經(jīng)歷了一個(gè)不同的組織,數(shù)據(jù)科學(xué)家被停在一個(gè)筒倉中。當(dāng)時(shí)的想法是將科學(xué)作為一種面向消費(fèi)者的產(chǎn)品交付給業(yè)務(wù)分析師和用戶。

不要誤會(huì)我的意思,他們能夠交付,但是筒倉仍然是筒倉。團(tuán)隊(duì)積累的知識和智慧并沒有滲透到組織的其他部門。

副作用是該團(tuán)隊(duì)不斷發(fā)展,最終與另一個(gè)團(tuán)隊(duì)合并……您知道發(fā)生了什么:他們需要更多的披薩。而且,當(dāng)您需要更多披薩時(shí),生產(chǎn)率就會(huì)下降。如果不在原始的《敏捷宣言》中,則必須在其第一個(gè)修訂中。

十二年來的數(shù)據(jù)科學(xué)團(tuán)隊(duì)

最近,我在Think 2019上參加了Stacey Ronaghan的鼓舞人心的演講。Ronaghan是IBM的數(shù)據(jù)科學(xué)家。她正在總結(jié)自己作為數(shù)據(jù)科學(xué)家的經(jīng)驗(yàn),并加入了一個(gè)團(tuán)隊(duì)。那時(shí)我才意識到,十二年前,我們相距不遠(yuǎn)。

 

 

她將團(tuán)隊(duì)定義為成功的關(guān)鍵驅(qū)動(dòng)力。她與之合作的團(tuán)隊(duì)在數(shù)據(jù)科學(xué)領(lǐng)域扮演著不同的角色,例如高管發(fā)起人,數(shù)據(jù)庫管理員(該公司負(fù)責(zé)處理數(shù)據(jù)!),業(yè)務(wù)分析師,項(xiàng)目經(jīng)理(在2019年,我們稱為Scrum Masters),SME(主題專家) ),解決方案架構(gòu)師,軟件工程師,設(shè)計(jì)師和設(shè)計(jì)思維實(shí)踐者。是的,這是一個(gè)非常折衷且具有跨職能的團(tuán)隊(duì)。就像軟件工程團(tuán)隊(duì)一樣。

交付基于為組織帶來的價(jià)值。團(tuán)隊(duì)并不是孤立地生活,也不是為了學(xué)習(xí)而只是在遙遠(yuǎn)的舒適繭中學(xué)習(xí)。他們交付。他們解決問題。

解決問題有助于他們帶來業(yè)務(wù)價(jià)值。像敏捷團(tuán)隊(duì)一樣。她的團(tuán)隊(duì)工作敏捷。也可以實(shí)現(xiàn)兩周的Sprint。

像在軟件產(chǎn)品組織中一樣,她的團(tuán)隊(duì)經(jīng)歷了建立MVP(最小可行產(chǎn)品)的過程。那是她的客戶可以接管的地方。

結(jié)論

 

 

每個(gè)利益相關(guān)者都有一個(gè)角色。科學(xué)家可以定義愿景,構(gòu)思構(gòu)想,找到正確的算法。然后,工程師可以將其“帶回家”,并將其轉(zhuǎn)換為工具箱或平臺中的生產(chǎn)代碼。最后,應(yīng)用程序開發(fā)人員可以結(jié)合現(xiàn)已在平臺上工業(yè)化的科學(xué)技術(shù),以構(gòu)建出色的產(chǎn)品。這就是我所說的數(shù)據(jù)科學(xué)的工業(yè)化。

經(jīng)過這些經(jīng)驗(yàn),并能夠與其他人面對一些想法和部分經(jīng)驗(yàn),這是我的結(jié)論(到目前為止):

♦ 數(shù)據(jù)科學(xué)團(tuán)隊(duì)與軟件工程團(tuán)隊(duì)沒有太大區(qū)別。

♦ 期望有所不同,因?yàn)槠渲械膶?shí)驗(yàn)部分更為重要。

♦ 可以應(yīng)用標(biāo)準(zhǔn)軟件方法(Agile, SAFe…),但在研究方面更具挑戰(zhàn)性。

♦ 隨著TDD成為標(biāo)準(zhǔn),測試驅(qū)動(dòng)數(shù)據(jù)科學(xué)還不存在。

♦ 存在諸如偏見之類的新挑戰(zhàn),但這難道不是QA的一部分嗎?

♦ 模型的治理也是前所未有的挑戰(zhàn)。

標(biāo)簽: 數(shù)據(jù) 蒲哦

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:60多個(gè)有用的數(shù)據(jù)可視化圖形庫

下一篇:數(shù)據(jù)科學(xué)的專業(yè)認(rèn)證越來越重要