中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何進階成為一名數(shù)據(jù)科學家?

2018-11-08    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

數(shù)據(jù)科學家-21世紀最性感的工作-可以說是每個數(shù)據(jù)分析師的最終目標,既然拿到的Stack Overflow調查問卷中含有數(shù)據(jù)分析師和數(shù)據(jù)科學家的數(shù)據(jù),那本次報告的任務就是橫向對比一下數(shù)據(jù)分析師與數(shù)據(jù)科學家,讓大家對自己的未來的技能樹選擇能有多一點的數(shù)據(jù)支持。

假設問題

目前處在或者即將處在數(shù)據(jù)分析師職位的朋友應該打磨自己的哪項技能?

數(shù)據(jù)分析師為自己未來的數(shù)據(jù)科學家之路應該如何擴充自己的技能樹?

問題解析

本次報告嘗試橫向對比數(shù)據(jù)分析師與數(shù)據(jù)科學家,將在兩個職業(yè)的比較中回答假設問題,這樣做的好處是使兩種職業(yè)更飽滿的展現(xiàn)在讀者面前,因為問題的針對性比較強,對比的過程中也可以很清晰的解答問題,所以本次報告以這樣的形式展現(xiàn)出來

數(shù)據(jù)分析師與數(shù)據(jù)科學家

 

如何進階成為一名數(shù)據(jù)科學家?

 

人物畫像

上圖中的語言與學歷均以占比從高到低排列

薪資

首先拿到這個數(shù)據(jù),自然要從大家最關心的工資說起:

 

如何進階成為一名數(shù)據(jù)科學家?

 

首先可以看出來,兩個職業(yè)在接觸編程人員中都有中等的工資水平,數(shù)據(jù)科學家更是擠進了前十,總的來說是相當不錯的薪資水平了

更細致的來看數(shù)據(jù)分析師與數(shù)據(jù)科學家的工資情況,科學家工資不管是均值還是中位數(shù)都穩(wěn)超分析師,且高工資處分析師的離散程度遠遠大于科學家,也就是說數(shù)據(jù)科學家在高工資處的分布集中度更高

性別

 

如何進階成為一名數(shù)據(jù)科學家?

 

對比前一章報告:Stack Overflow 用戶畫像分析(https://github.com/AAAlvin/Project_Folder/blob/數(shù)據(jù)之道%20-%20Stack的用戶畫像分析.md),不難看出,這兩個職業(yè)的女性從業(yè)率都超過了編程行業(yè)的女性(4.8%)均值,且數(shù)據(jù)科學家甚至達到了兩倍的樣子,可以說是對女性非常友好的編程相關職業(yè)了,其中的原因有可能是很多專業(yè)是學習數(shù)學或者統(tǒng)計的朋友跨行業(yè)自學編程來到數(shù)據(jù)行業(yè)

從不同性別的薪資來看,首先對比其他職業(yè)可以看出這兩個行業(yè)男女工資基本上已經持平,跟其他行業(yè)中男性比女性工資高很多的情況形成強烈對比;隨后從兩個職業(yè)的對比中可以看出,從數(shù)據(jù)分析師進階到數(shù)據(jù)科學家,兩個職業(yè)女性的工資上漲幅度遠超男性,女性工資均值和中位數(shù)上漲了50%和70%,而男性上漲只有45%和16%

編程語言

 

如何進階成為一名數(shù)據(jù)科學家?

 

分析師與科學家

輸出了數(shù)據(jù)分析師與數(shù)據(jù)科學家使用語言蝴蝶圖,將目前比較火的R和Python標亮顯示,從中可以得出的東西還是非常多的:

首先看數(shù)據(jù)分析師這邊,基本都是使用SQL和R,其次是使用EXCEL中的VBA,而python使用的情況只有不到6%,這和我現(xiàn)在了解到的數(shù)據(jù)分析師的情況大致相符,基本是多用SQL做數(shù)據(jù)提取工作,小數(shù)據(jù)使用EXCEL,數(shù)據(jù)量比較大的才考慮使用R或python,目前從數(shù)據(jù)看來,使用R的占了比較大的比重

再從數(shù)據(jù)科學家這邊看,基本上使用python的比例激增到40%,大家應當熟知Python是機器學習的利器,多看中預測結果的準確性,而R多用作統(tǒng)計推斷的語言,所以從語言使用占比來說,在科學家這邊,機器學習一定是一個繞不開的技能,不然Python激增這么多很難有合理的解釋

不難看出的還有一點就是,SQL在科學家中基本不在使用了,而VBA卻仍有不小的比例,看來簡單的取數(shù)據(jù)的工作要么科學家已經交給分析師來做,或者自己動手使用python爬蟲,而小量的數(shù)據(jù)仍有可能使用VBA進行前期分析

目前來看處在分析師職位的朋友應當吧更多的精力放在SQL和R上,然后盡力不要丟掉EXCEL,畢竟這個是基礎技能而且還非常耐用,然后在為數(shù)據(jù)科學家做準備的時候,Python是一定要深入學習的語言,同時深刻了解業(yè)務和機器學習,這些應該是從該數(shù)據(jù)集中展現(xiàn)出來的方向

學歷

 

如何進階成為一名數(shù)據(jù)科學家?

 

學歷柱狀圖最明顯的一點莫過于數(shù)據(jù)科學家的博士學位明顯高于數(shù)據(jù)分析師和其他職業(yè),可以說是門檻超高的一個職業(yè)了,大部分的科學家都接受了相當好的教育,本科以上的學歷高達91%

數(shù)據(jù)分析師的學歷基本屬于平均偏上的水平,可以看到在碩士學位處35%的占比也很高的

綜上數(shù)據(jù)分析師的學歷門檻比較高,而科學家的門檻更高,分析師準備轉行科學家的時候,磨練自己技術的同時還需要加強自己的專業(yè)知識也就是提升學歷,邊上班研究業(yè)務知識,邊申請在職研究生或者博士課程也是可以選在的方向

編程時間相關

 

如何進階成為一名數(shù)據(jù)科學家?

 

 

如何進階成為一名數(shù)據(jù)科學家?

 

從兩個行業(yè)在不同編程年齡的柱狀圖來看,編程時間在6年以下的以數(shù)據(jù)分析師居多,而接觸編程語言超過6年后,當熟練掌握了算法和業(yè)務之后轉行科學家的比例不斷上升,看來6年之內分析師們是需要為自己的數(shù)據(jù)科學家做好技能規(guī)劃

從上班使用電腦時間來看,基本兩者相差不大,都屬于業(yè)界平均水平,只不過在科學家在5-8小時的時候稍微多一點,超過12小時時候稍微少一點

總結與結論

 

如何進階成為一名數(shù)據(jù)科學家?

 

人物畫像

數(shù)據(jù)分析師對自己目前的規(guī)劃與未來的計劃:

目前扎實掌握SQL與VBA,掌握業(yè)務相關知識與R語言,嘗試對數(shù)據(jù)庫有更多的了解;

技能樹深化Python的學習,機器學習或深度學習需要提上日程;

有條件的情況下嘗試在職研究生,學習統(tǒng)計學知識,掌握更全面、系統(tǒng)的理論知識;

標簽: 數(shù)據(jù)分析 數(shù)據(jù)庫

版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:探訪非洲數(shù)據(jù)標注工廠:貧民為硅谷人工智能打工賺錢

下一篇:大數(shù)據(jù)分布式存儲的部署模式:分離式or超融合