中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

不要讓數(shù)據(jù)科學(xué)成為一場(chǎng)騙局

2018-08-10    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用
現(xiàn)在的公司熱衷于將數(shù)據(jù)科學(xué)視為點(diǎn)石成金的魔法,垂涎數(shù)據(jù)科學(xué)將帶來的革命性成果,爭(zhēng)相追隨科技巨頭,并翹首以待。他們重金聘請(qǐng)價(jià)格不菲的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師,斥巨資投入到軟件和硬件上,并花了很多時(shí)間暢想美好的未來。然而,盡管付出了這么多的努力和金錢,很多公司幾乎沒有從中獲得任何實(shí)質(zhì)性的好處。因?yàn)樗麄儼奄Y源浪費(fèi)在了太多實(shí)驗(yàn)或沒有明確商業(yè)用途的項(xiàng)目以及與實(shí)現(xiàn)組織目標(biāo)不相干的活動(dòng)上。

當(dāng)曲終人散,錢也燒得差不多了,用于支持這些工作的資源也將消失殆盡。到了那個(gè)時(shí)候,數(shù)據(jù)科學(xué)將被視為一場(chǎng)騙局。

為了不讓數(shù)據(jù)科學(xué)淪為騙局,并為我們帶來真正的價(jià)值,企業(yè)需要考慮將數(shù)據(jù)科學(xué)從研究工作轉(zhuǎn)變?yōu)闃I(yè)務(wù)和流程的組成部分。與此同時(shí),他們還需要考慮建立真正的信息架構(gòu)基礎(chǔ)。我們?yōu)榇藰?gòu)建了一個(gè) AI 階梯:數(shù)據(jù)基礎(chǔ)、分析、機(jī)器學(xué)習(xí)、AI 和認(rèn)知:

 

 

為了打破目前的這種只投資無回報(bào)的模式,企業(yè)可以嘗試解決以下幾個(gè)問題:

尋找、留住和培養(yǎng)合適的人才和團(tuán)隊(duì)
為數(shù)據(jù)和數(shù)據(jù)科學(xué)制定企業(yè)戰(zhàn)略
實(shí)施數(shù)據(jù)科學(xué)計(jì)劃
應(yīng)對(duì)文化沖擊

尋找、留住和培養(yǎng)合適的人才和團(tuán)隊(duì)

偉大的數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要具備四種技能組合:數(shù)據(jù)工程師、機(jī)器學(xué)習(xí)工程師、優(yōu)化工程師和數(shù)據(jù)記者。如果你想要吸引更多的候選人,請(qǐng)?jiān)诎l(fā)布工作崗位時(shí)嘗試使用這四個(gè)職位和技能組合,而不是使用一刀切的“數(shù)據(jù)科學(xué)家”。

要想留住人才,需要注意幾個(gè)方面的問題。首先,需要將團(tuán)隊(duì)與他們要實(shí)現(xiàn)的價(jià)值聯(lián)系在一起:他們的項(xiàng)目如何影響業(yè)務(wù)線和整個(gè)企業(yè)?其次,他們需要感受到自己被賦能,并且知道有人在支持他們。最后,在為團(tuán)隊(duì)做出規(guī)劃時(shí),將 20-25%的空閑時(shí)間用于創(chuàng)新項(xiàng)目,比如參加類似 Kaggle 的比賽,以及學(xué)習(xí)新的工具和技能;ㄙM(fèi)這么多時(shí)間在生產(chǎn)力方面看起來似乎很昂貴,但它為團(tuán)隊(duì)提供了發(fā)展技能的途徑——而且它比雇用和培訓(xùn)新人才更加有效。

為數(shù)據(jù)和數(shù)據(jù)科學(xué)制定企業(yè)戰(zhàn)略

制定與實(shí)際價(jià)值(特別是成本規(guī)避、成本節(jié)省或凈收入)相一致的決策。這是整個(gè)過程最重要的一環(huán),也是將數(shù)據(jù)科學(xué)從研究轉(zhuǎn)變?yōu)闃I(yè)務(wù)一部分必須跨出的第一步。簡(jiǎn)單地說,它要求在業(yè)務(wù)所有者做出決策時(shí)與他們進(jìn)行直接對(duì)話,詢問他們是基于哪些數(shù)據(jù)做出這些決策、數(shù)據(jù)的完整性、是否有足夠的數(shù)據(jù)治理,以及企業(yè)將如何使用已開發(fā)的模型。

你可以使用直接集成到流程和應(yīng)用程序的儀表盤來推動(dòng)決策,但要注意,數(shù)據(jù)可能會(huì)形成先入為主的概念。相反,我們應(yīng)該嘗試去尋找那些真正影響基礎(chǔ)決策的可能性:

“我們應(yīng)該如何定位產(chǎn)品,以最低的成本實(shí)現(xiàn)最佳的可用性?”

“哪些方面最有助于對(duì)特定客戶進(jìn)行交叉銷售或增銷?”

“哪些團(tuán)隊(duì)表現(xiàn)最好?哪些團(tuán)隊(duì)表現(xiàn)最差?“

“如何在 y 的約束下通過優(yōu)化 x 來削減供應(yīng)鏈的成本?”

 

 

重視每個(gè)決定。更快地制定決策并提高效率可以規(guī)避成本、節(jié)省成本或創(chuàng)造額外收入?梢允褂 CFO 倡導(dǎo)的任何方法和術(shù)語來表達(dá)這一價(jià)值。

確定決策的優(yōu)先級(jí)。這個(gè)過程創(chuàng)建了一個(gè)決策組合,可以作為數(shù)據(jù)科學(xué)待辦項(xiàng)的基礎(chǔ)。通過評(píng)估成功的可能性、實(shí)現(xiàn)的簡(jiǎn)易程度和價(jià)值的多少(基于上表中的評(píng)分指標(biāo))來確定待辦項(xiàng)的優(yōu)先級(jí)。我們已經(jīng)開發(fā)了一個(gè)框架(https://ibm.biz/DecisionPortfolio),可以通過完成這個(gè)練習(xí)為組合內(nèi)容安排優(yōu)先級(jí)。

 

 

離散的交付。接下來,做出最重要的決定,并將其分解為可管理的塊,并在小的 sprint 中完成這些塊任務(wù)。先確定最小可行產(chǎn)品(MVP),然后繼續(xù)迭代?梢钥紤]每三周一個(gè) sprint,在兩個(gè) sprint 后就可以開始交付價(jià)值(無論多小)。

實(shí)施數(shù)據(jù)科學(xué)計(jì)劃

要讓數(shù)據(jù)從研究項(xiàng)目變成公司業(yè)務(wù)的組成部分,需要實(shí)施數(shù)據(jù)科學(xué)計(jì)劃。除了組建團(tuán)隊(duì)和制定策略之外,還需要將模型集成到流程、應(yīng)用程序和儀表盤中,還要計(jì)劃對(duì)模型進(jìn)行持續(xù)監(jiān)控和再訓(xùn)練。

真正的模型集成意味著我們不能像部署 csv 文件或普通代碼那樣部署模型。它們應(yīng)該更像是可重用且可信賴的服務(wù):版本化的 RESTful API,可以直接從數(shù)據(jù)科學(xué)平臺(tái)獲得輸出。將模型作為 csv 文件進(jìn)行部署會(huì)切斷與整個(gè)流程的連接,并且無法獲得來自實(shí)現(xiàn)方的反饋。將 R 或 Python 代碼交給開發(fā)團(tuán)隊(duì),讓他們將其轉(zhuǎn)換成 API,這種效率是最低的,但這也是在為后續(xù)做準(zhǔn)備工作。建立一個(gè)健壯的流程通常需要三到六個(gè)月,還需要建立反饋循環(huán),以便讓團(tuán)隊(duì)可以輕松地重新訓(xùn)練和部署模型。

將預(yù)測(cè)性或規(guī)范性分析應(yīng)用到業(yè)務(wù)中必然會(huì)要求你基于反饋重新訓(xùn)練模型,以便跟上變化的節(jié)奏。我們已經(jīng)看到了一些例子,為了驅(qū)動(dòng)一個(gè)決策,一個(gè)團(tuán)隊(duì)在一年內(nèi)開發(fā)了一百多個(gè)模型,但在第二年卻什么也沒有開發(fā)出來,因?yàn)檫@個(gè)團(tuán)隊(duì)現(xiàn)在完全專注于監(jiān)控和再訓(xùn)練現(xiàn)有的模型。關(guān)鍵是要認(rèn)識(shí)到,這不是他們的方法出了問題,他們確實(shí)需要構(gòu)建那么多模型來解決問題。問題在于,在模型部署的過程中,他們沒有對(duì)這些模型的監(jiān)控和再訓(xùn)練進(jìn)行自動(dòng)化。

除非你已經(jīng)經(jīng)歷過大量的數(shù)據(jù)科學(xué)項(xiàng)目,否則實(shí)施數(shù)據(jù)科學(xué)的挑戰(zhàn)可能會(huì)讓你大吃一驚——它們都是真實(shí)存在的。

衍生數(shù)據(jù)產(chǎn)品。我們經(jīng)常會(huì)忽略這樣的一個(gè)事實(shí),即我們的工程特征本身就是有價(jià)值的數(shù)據(jù)。作為建模和工程的一部分,應(yīng)該考慮將這些新數(shù)據(jù)部署為 API,并將它們集成到適當(dāng)?shù)臄?shù)據(jù)資產(chǎn)中,而不是讓它們保持私有。例如,如果數(shù)據(jù)科學(xué)團(tuán)隊(duì)設(shè)計(jì)了一個(gè)可以組合客戶數(shù)據(jù)、產(chǎn)品數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)的功能,那么就將這個(gè)功能部署為 API,并讓相應(yīng)的模型調(diào)用該 API。

應(yīng)對(duì)文化沖擊

對(duì)于眾多企業(yè)來說,數(shù)據(jù)科學(xué)之所以可能成為騙局有很多原因,其中有一個(gè)原因尤為突出:文化抵制。要突破管理層的阻力,要注意那些有興趣參與的人。一旦他們開始在流程和應(yīng)用程序中應(yīng)用數(shù)據(jù)和模型,或許支持者就會(huì)超過阻礙者。到了某些時(shí)候,管理層會(huì)問他們已經(jīng)有了哪些突破,這時(shí)阻礙者就會(huì)感到壓力,然后改變他們的立場(chǎng)。你向管理層展示的價(jià)值往往就是通過規(guī)避成本、節(jié)省資金或創(chuàng)造新價(jià)值來超越其他人。

個(gè)人貢獻(xiàn)者可能會(huì)出于其他原因抵制這種轉(zhuǎn)變。他們可能擔(dān)心會(huì)被機(jī)器取代,或者創(chuàng)建者不完全了解整個(gè)過程或環(huán)境。這兩種擔(dān)憂都是實(shí)實(shí)在在的。但是,在大多數(shù)情況下,自動(dòng)化不會(huì)讓人失業(yè),只是讓工作變得更安全或更有效率,所以要幫助團(tuán)隊(duì)認(rèn)識(shí)到這一點(diǎn)。對(duì)于另一個(gè)擔(dān)憂(數(shù)據(jù)科學(xué)團(tuán)隊(duì)并不真正了解他們所做的事情),可以考慮讓其中一個(gè)人承擔(dān)產(chǎn)品所有者或主題專家的角色,這讓其他抵制者感覺到支持者是“我們當(dāng)中的一員”。當(dāng)他恢復(fù)到正常的角色時(shí),你就有了當(dāng)前數(shù)據(jù)科學(xué)方法以及未來實(shí)現(xiàn)和部署的支持者。

最后,你可以通過大眾的力量來應(yīng)對(duì)文化沖擊。確定一個(gè)場(chǎng)景,并組織一個(gè)由高層贊助的黑客馬拉松。黑客馬拉松應(yīng)該包括有關(guān)機(jī)器學(xué)習(xí)、云計(jì)算和 API 的基本演示和高級(jí)對(duì)話。讓團(tuán)隊(duì)親自操刀,并允許公司里的個(gè)人參加,不管他們接受過何種培訓(xùn)或擁有何種背景。

為了將數(shù)據(jù)科學(xué)的煉金術(shù)轉(zhuǎn)化為真金,企業(yè)必須讓數(shù)據(jù)科學(xué)為業(yè)務(wù)帶來有形的價(jià)值。他們不能只專注于實(shí)驗(yàn),而是將數(shù)據(jù)科學(xué)作為業(yè)務(wù)模式的組成部分,并與公司的優(yōu)先事項(xiàng)保持一致。如果你遵循上述的方法,樂章將再次奏響,資金將繼續(xù)流動(dòng),數(shù)據(jù)科學(xué)將不會(huì)成為一場(chǎng)騙局。

作者 | Seth Dobrin

英文原文:https://www.datasciencecentral.com/profiles/blogs/don-t-let-data-science-become-a-scam

標(biāo)簽: 安全 代碼 云計(jì)算

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:數(shù)據(jù)可視化的七大趨勢(shì)

下一篇:全球最嚴(yán)個(gè)人數(shù)據(jù)保護(hù)法GDPR實(shí)施之后