中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

民科危險!公民數(shù)據(jù)科學(xué)家也一樣

2018-12-25    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

公民數(shù)據(jù)科學(xué)家(Citizen Data Scientist , CDS)的概念始于2017年,在2018年火爆全球。

似乎可以將CDS看作公民科學(xué)家概念的延續(xù),這個概念背后的想法是:技術(shù)輔助工具已經(jīng)非常先進(jìn),自動化調(diào)參工具的出現(xiàn)、各種MOOC自學(xué)平臺上課程和實(shí)驗(yàn)室層出不窮,所以現(xiàn)在,如果付出足夠多的學(xué)習(xí)時間,似乎所有人都可以迅速具備收集和分析數(shù)據(jù)的能力,也就是,成為一名“數(shù)據(jù)科學(xué)家”了。

這一概念不止激勵鼓舞了大批想要成為“數(shù)據(jù)科學(xué)家”的個人,也讓很多缺人的企業(yè)有了希望。

數(shù)字信息的增長已經(jīng)對數(shù)據(jù)科學(xué)和分析專業(yè)人員產(chǎn)生了越來越大的需求。與之相對,相關(guān)人才供給遠(yuǎn)遠(yuǎn)不夠。因此,供需之間的差距正在擴(kuò)大。

不斷增長的數(shù)據(jù)職場缺口下,雇傭這一類公民數(shù)據(jù)科學(xué)家,是許多大公司面臨“人荒”困境,寄予厚望的解決方案。

大批非相關(guān)專業(yè)出身、靠著自我培訓(xùn)和技術(shù)工具成長起來的公民數(shù)據(jù)科學(xué)家,開始涌入這個領(lǐng)域。

草根公民數(shù)據(jù)科學(xué)家的特征

 

 

那么,“草根”出身的公民數(shù)據(jù)科學(xué)家有什么特點(diǎn)呢?

如上圖,盡管是非統(tǒng)計(jì)等數(shù)據(jù)科學(xué)相關(guān)專業(yè)出身,我們并不否認(rèn),來自業(yè)務(wù)領(lǐng)域或者其他專業(yè)的公民數(shù)據(jù)科學(xué)家,本身具備以下優(yōu)點(diǎn):

深耕業(yè)務(wù)領(lǐng)域,對組織機(jī)構(gòu)有深刻認(rèn)知,對與業(yè)務(wù)優(yōu)先次序相關(guān)的問題的興趣;

對商業(yè)領(lǐng)域有獨(dú)特視角、分析技術(shù)在商業(yè)問題中的實(shí)證應(yīng)用、可以證明商業(yè)價值;

參與多個分析領(lǐng)域和活動、有著實(shí)踐經(jīng)驗(yàn)并且有著廣泛人脈。

“草根”數(shù)據(jù)科學(xué)家有風(fēng)險

“草根”公民數(shù)據(jù)科學(xué)家越來越多,他們開始不止從事最基本的數(shù)據(jù)收集和分析工作,也開始承擔(dān)數(shù)據(jù)的預(yù)測等核心工作。

就像耐克聲稱他們的Air Jordans可以讓每個鄰居小孩成為下一個皮蓬(Scottie Pippen)非常不靠譜一樣,技術(shù)帶來的輔助力量是有限的,風(fēng)險也開始隨之出現(xiàn)。

 

 

顯而易見,雖然現(xiàn)在所有電動工具都可以在商店買得到,但并不是所有人都可以成為木匠大師;就算有很多在線炒股軟件,也并非所有人都能成為百萬富翁交易員。

真正的科學(xué)要通過專業(yè)訓(xùn)練。這是不管多少技術(shù)工具都無法取代的。

 

 

“高質(zhì)量的數(shù)據(jù)仍然非常重要”,針對“公民數(shù)據(jù)科學(xué)家”,全美排名第四的CTO、天睿公司首席技術(shù)官、全球數(shù)據(jù)倉庫技術(shù)專家Stephen Brobst告訴大數(shù)據(jù)文摘,現(xiàn)在盡管分析工具越來越智能,但他們的使用前提依然是沒有偏向(bias)的數(shù)據(jù),和懂得這些數(shù)據(jù)的專業(yè)人士。

“深度學(xué)習(xí)算法實(shí)際上非常適合處理數(shù)據(jù)質(zhì)量問題。很多公司現(xiàn)在用無監(jiān)督學(xué)習(xí)的反饋循環(huán)來解決數(shù)據(jù)質(zhì)量問題,但我們還是希望,在數(shù)據(jù)搜集的過程中就盡量最小化數(shù)據(jù)偏見。數(shù)據(jù)科學(xué)沒有魔法,它不是一個工具就可以解決的問題。你可以通過一些步驟來測試有偏見的數(shù)據(jù),但這是件很微妙的事情。”

“你必須雇用那些知道自己在做什么的人。”Stephen稱,業(yè)內(nèi)現(xiàn)在存在很多只懂業(yè)務(wù)、不懂統(tǒng)計(jì)的“公民數(shù)據(jù)科學(xué)家(citizen data scientist),這是非常危險的。他們嚴(yán)重依賴技術(shù)工具進(jìn)行數(shù)據(jù)搜集和分析,并不知道自己在做什么,“這很可能會導(dǎo)致嚴(yán)重破壞性的結(jié)果。”

“草根”數(shù)據(jù)科學(xué)家為什么危險?

以下幾種原因可以解釋:

首先,認(rèn)知偏差。下邊這張圖可以很清楚地解釋什么是認(rèn)知偏差。

技術(shù)能力可以靠短期培養(yǎng),但是,認(rèn)知能力不行,它需要幾年甚至十幾年的專業(yè)訓(xùn)練。不同專業(yè)的人對待同一組數(shù)據(jù)和場景會有很不同的認(rèn)知。

 

 

其次,研究邏輯謬誤,或者說辛普森悖論。

所有技術(shù)工具的使用前提是假設(shè)你的數(shù)據(jù)首先是優(yōu)質(zhì)無偏差的,大多數(shù)“草根”數(shù)據(jù)科學(xué)家通過SQL入門,并直接跳入Keras和TensorFlow ......

畢竟MOOC(慕課,同為在線學(xué)習(xí)網(wǎng)站)的認(rèn)證課程中就是這么教的。

 

 

第三,數(shù)據(jù)的民主化并不直接導(dǎo)致洞察力的民主化。

這一點(diǎn)很容易理解。eBay并沒有讓每個人都一夜成為零售巨頭,手機(jī)也并沒有提高人們的智商。盡管現(xiàn)在我們比以往任何時候都有著更多的健康和飲食信息,但世界上的人比以往任何時候都更加肥胖。工具速度,工具規(guī)模,正確的使用方法 – 這些永遠(yuǎn)不會取代真正的專業(yè)訓(xùn)練。

所以,放棄“草根”數(shù)據(jù)科學(xué)家的幻想吧!

現(xiàn)在坐下來腳踏實(shí)地學(xué)習(xí)一些有意義的、真正的智慧建立和驗(yàn)證的東西。技術(shù)工具允許我們所有人都充滿渴望,只有那些投入時間和精力,擁有專業(yè)訓(xùn)練和教育的人才能夠提升到可以提供有意義和預(yù)測性分析的水平。

相關(guān)報道:https://comprehension360.corsairs.network/rise-of-the-citizen-scientist-452a28a93cb

標(biāo)簽: 大數(shù)據(jù) 排名

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:對比兩年斯坦福AI報告:32張圖表帶你全盤掌握行業(yè)發(fā)展(附資料)

下一篇:如何構(gòu)建一個機(jī)器學(xué)習(xí)項(xiàng)目來找到工作?