中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

進(jìn)階指南:如何從數(shù)據(jù)分析師轉(zhuǎn)型為數(shù)據(jù)科學(xué)家?

2019-03-01    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用
來源:Medium

編譯:李雷、橡樹_Hiangsug

文章解釋了轉(zhuǎn)型為數(shù)據(jù)科學(xué)家的原因,整理了數(shù)據(jù)科學(xué)家應(yīng)該掌握的技能,著重介紹了從數(shù)據(jù)分析師轉(zhuǎn)型為數(shù)據(jù)科學(xué)家的具體方法。

如何從數(shù)據(jù)分析師華麗轉(zhuǎn)型,成為一名數(shù)據(jù)科學(xué)家?好比“把大象裝進(jìn)冰箱”,成為“數(shù)據(jù)科學(xué)家”僅需簡單三步:

1. 進(jìn)入LinkedIn登錄你的賬號。

2. 點擊“編輯個人資料”。

3. 將 “數(shù)據(jù)分析師”這個詞替換為“數(shù)據(jù)科學(xué)家”。

搞定,就是這么簡單!

理想很豐滿,現(xiàn)實很骨感。在現(xiàn)實生活中,我們必須承認(rèn):培養(yǎng)數(shù)據(jù)洞察能力絕非易事。

入門數(shù)據(jù)科學(xué)早已有許多優(yōu)秀的博文可供參考,比如以下兩篇:《成為Jet.com數(shù)據(jù)分析師的自學(xué)之路》和《入門數(shù)據(jù)科學(xué)需掌握的基礎(chǔ)知識》,但是為數(shù)據(jù)分析師提供轉(zhuǎn)型為數(shù)據(jù)科學(xué)家的方法的文章卻少之又少。

《成為Jet.com數(shù)據(jù)分析師的自學(xué)之路》:

https://medium.freecodecamp.org/a-path-for-you-to-learn-analytics-and-data-skills-bd48ccde7325

《入門數(shù)據(jù)科學(xué)需掌握的基礎(chǔ)知識》:

https://medium.freecodecamp.org/aspiring-data-scientist-master-these-fundamentals-be7c54350868

在我開始介紹這條轉(zhuǎn)型之路前,我還是想先花些功夫詳細(xì)描述一下這兩種職業(yè)身份的具體職責(zé)。

 

 

數(shù)據(jù)分析師的主要工作是對數(shù)據(jù)進(jìn)行收集和處理,并通過統(tǒng)計算法分析已處理的結(jié)構(gòu)化數(shù)據(jù),從而為數(shù)據(jù)賦能,改良決策。

數(shù)據(jù)科學(xué)家也會進(jìn)行類似的工作,但對其提出了更高的要求。除上述職責(zé)外,一個優(yōu)秀的數(shù)據(jù)科學(xué)家需要同時具備處理大量非結(jié)構(gòu)化數(shù)據(jù)的能力,甚至擁有對數(shù)據(jù)進(jìn)行實時處理的能力。

他們不僅可以洞悉數(shù)據(jù)背后的價值,還會對數(shù)據(jù)進(jìn)行更深度的清洗和處理,并且用各種各樣的高級算法對數(shù)據(jù)進(jìn)行更深層的分析。除此之外,他們還具有很強的敘事能力和數(shù)據(jù)可視化能力。

我經(jīng)常會接觸到許多才華橫溢的分析師,他們急切地想要在數(shù)據(jù)科學(xué)界大展拳腳,卻總是找不合適的機(jī)會,甚至不知從何入手——而這正是我寫下這篇文章的主要原因。

為什么要成為數(shù)據(jù)科學(xué)家?

影響力:成為一名數(shù)據(jù)科學(xué)家意味著你將有機(jī)會發(fā)現(xiàn)和創(chuàng)造巨大的商業(yè)價值,發(fā)表更高層的決策意見,甚至幫助企業(yè)尋找未來的發(fā)展方向。

成就感:數(shù)據(jù)科學(xué)是一個飛速發(fā)展的領(lǐng)域,其中有許多有趣的問題亟待解決。作為一名數(shù)據(jù)科學(xué)家,你可以建立圖像識別系統(tǒng),開發(fā)文本分類器,識別社交媒體上的惡意評價,投身解決一系列尚未攻克的難題。

前沿性:曾有人預(yù)言,人工智能將最終取代人類工作。與其等著自己的工作被人工智能取代,不如主動出擊,追上這一時代的浪潮。

薪酬待遇:也許數(shù)據(jù)科學(xué)家的薪酬還不足以讓你享受開游艇喝香檳的奢靡生活,但相較于其他工作已經(jīng)相當(dāng)可觀。業(yè)界對數(shù)據(jù)科學(xué)家的需求量依舊較大,優(yōu)秀的數(shù)據(jù)科學(xué)家仍屬高薪稀缺人才。直白來講,為了更好的明天,努力成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家吧!

 

 

數(shù)據(jù)科學(xué)——學(xué)得多,做得多,但賺得也多!

友情提示:量力而行,切忌盲從,不要被金錢和誘惑蒙蔽了雙眼,畢竟貪得無厭沒有好結(jié)果(“華爾街之狼”的下場很慘)。

我是否擁有成為數(shù)據(jù)科學(xué)家的資質(zhì)?

盡管培養(yǎng)處理棘手的數(shù)據(jù)結(jié)構(gòu)和(或)大型數(shù)據(jù)的能力需要數(shù)年的經(jīng)驗積累,但別灰心,實際上大多數(shù)分析師在一定程度上已經(jīng)打下了成為數(shù)據(jù)科學(xué)家的基礎(chǔ)。換句話說,只要肯下功夫,轉(zhuǎn)型為數(shù)據(jù)科學(xué)家沒有想象中那么困難。

那么,成為一名合格的數(shù)據(jù)科學(xué)家到底需要掌握哪些技能?

一個復(fù)雜的數(shù)據(jù)科學(xué)項目可能由眾多子項目構(gòu)成,且項目流程又復(fù)雜多變,所以我們恐怕沒有辦法找到這個問題的標(biāo)準(zhǔn)答案。單就近幾年數(shù)據(jù)科學(xué)的發(fā)展來看,成為一名數(shù)據(jù)科學(xué)家至少需要了解以下幾個方面的技能分支:

數(shù)據(jù)科學(xué)語言:Python / R。

關(guān)系型數(shù)據(jù)庫?:MySQL,Postgress。

非關(guān)系型數(shù)據(jù)庫:MongoDB。

機(jī)器學(xué)習(xí)模型:回歸算法(Regression)、提升決策樹(Boosted Trees)、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)(NNs)等。

圖像處理:Neo4J,GraphX

分布式計算:Hadoop,Spark

云計算?:GCP / AWS / Azure

API 交互:OAuth,Rest

數(shù)據(jù)可視化和Web應(yīng)用:D3,RShiny

專業(yè)領(lǐng)域:自然語言處理(NLP),光學(xué)字符識別(OCR)和計算機(jī)視覺(CV)

 

 

Boosted Trees模型在近幾年的數(shù)據(jù)科學(xué)競賽中大放異彩。

 

 

RShiny數(shù)據(jù)儀表盤是一個優(yōu)秀的交互工具,可供用戶更加直觀地對數(shù)據(jù)進(jìn)行探索。

掌握這些技能需要很長時間(可能比完成學(xué)位課程的時間還要長),即使是為我們熟知的“牛人”們?nèi)栽诓粩嗟貙W(xué)習(xí)。但是,我們大可不必?fù)?dān)心自己能力有限,學(xué)習(xí)知識需要一步步的積累,掌握技能需要一步步的打磨。每天進(jìn)步一點,總有一天我們將擁有足夠豐富的知識儲備和高水平的技能迎接未來的挑戰(zhàn)。

智力水平的高低無法決定我們是否可以獲得成功,堅定的決心和頑強的意志才是通往成功的關(guān)鍵所在。

我具體應(yīng)該怎么做?

在開始行動前,我們需要掌握一些基本的技能:

樹立正確的信念;蛟S在十年前,找到一門合適的數(shù)據(jù)軟件課程可能需要花費數(shù)周之久,但時代已變,線上學(xué)習(xí)材料觸手可及,資源匱乏再也不是逃避學(xué)習(xí)的借口。我們必須保持持續(xù)學(xué)習(xí)的能力,不斷為自己充電,磨練自己的技術(shù)。

學(xué)習(xí)一門編程語言并提升你的數(shù)學(xué)能力。大多數(shù)人都是從學(xué)習(xí)Python和(或)R開始數(shù)據(jù)科學(xué)之路的,而且Coursera和Udemy等網(wǎng)站上提供了大量相關(guān)的免費課程資源。Python用戶喜歡通過Anaconda和Jupyter編程,而R用戶則較多地使用R Studio。就數(shù)學(xué)計算能力而言,吳恩達(dá)(Andrew Ng)的機(jī)器學(xué)習(xí)課程和斯坦福大學(xué)的神經(jīng)網(wǎng)絡(luò)課都很適合于轉(zhuǎn)型人士學(xué)習(xí)。

動手解決問題。你可以嘗試在工作中找到所遇到的實際問題,與業(yè)務(wù)專家和數(shù)據(jù)工程師展開合作,親自動手解決這些問題——這是最好的端到端開發(fā)模式。

參加Kaggle比賽。還有什么比與數(shù)千人同臺競賽更能提升建模技巧呢?Kaggle上的比賽要求十分清晰,提供的數(shù)據(jù)都已經(jīng)過清洗,非常值得一試。剛開始不要太在意比賽的排名,以嘗試的心態(tài)開始你的第一場比賽——每一次嘗試都是新的開始。

緊隨領(lǐng)軍人物的動態(tài)。有些人喜歡把為這一領(lǐng)域做出杰出貢獻(xiàn)的人比作“數(shù)據(jù)科學(xué)界的搖滾巨星”,他們的言行和工作非常值得你花時間去了解和學(xué)習(xí)——時常刷新Geoffrey Hinton,Andrew Ng,Yann LeCun,Rachel Thomas和Jeremy Howard等人的動態(tài),你肯定會有所收獲。

高效地工作。在一定工作積累后,嘗試借助工具提升你的工作效率——使用GitHub等版本控制工具維護(hù)和儲存你的代碼,用Docker對你的代碼進(jìn)行封裝與發(fā)布。

有效地溝通。學(xué)會“推銷”自己的工作。高管們總是喜歡“華麗”的項目展示,所以當(dāng)你在做重要的工作報告時要努力“博眼球”,突出工作的亮點。

Twitter也是另一種獲取信息的媒介,Rachel Thomas等人的動態(tài)十分值得關(guān)注。

為自己鋪路

即使你掌握了世界上所有的技能,如果你的公司無法提供合適的開發(fā)工具,配置相應(yīng)的開發(fā)環(huán)境,你也很難施展拳腳。

現(xiàn)實生活中總會有一些不可控的因素阻礙我們前進(jìn)的腳步,與其浪費時間糾結(jié)于此,我們更加應(yīng)該關(guān)注那些我們可以改變的因素并積極做出行動。

 

 

加入新的團(tuán)隊,這是最簡單可行的轉(zhuǎn)型方法。大多數(shù)中到大型的公司都至少會有一個小型數(shù)據(jù)科學(xué)團(tuán)隊——別猶豫,加入他們!

與專業(yè)人士合作,如果你無法“跳槽”,那么就請想方設(shè)法找到在你認(rèn)識范圍內(nèi)知識最淵博的數(shù)據(jù)科學(xué)家并與之合作。

舉例來說,你可以在現(xiàn)有的工作中找到可自動化完成的業(yè)務(wù)流程,然后帶著這一問題找到這方面的專家。但這時千萬不要直接把任務(wù)“甩”給這些專家,嘗試與他們合作,加入到問題的解決過程中來。

搭建數(shù)據(jù)科學(xué)的內(nèi)部環(huán)境,并不是所有的公司都確定它們是否需要數(shù)據(jù)科學(xué)的幫助,或者他們并不知道如何引入數(shù)據(jù)科學(xué)作為分析工具。

傳統(tǒng)的分析系統(tǒng)已經(jīng)讓他們忙得不可開交,且開發(fā)新數(shù)據(jù)分析系統(tǒng)所帶來的安全和審計任務(wù)都相當(dāng)耗時,因此他們只接受效益明顯的商業(yè)應(yīng)用方案——這就是你大顯身手的機(jī)會,用你的知識儲備為公司搭建數(shù)據(jù)科學(xué)發(fā)展環(huán)境,引入合適的數(shù)據(jù)科學(xué)工具,培養(yǎng)內(nèi)部人員的數(shù)據(jù)思維,為數(shù)據(jù)科學(xué)團(tuán)隊儲備力量。

開發(fā)一個明確的業(yè)務(wù)用例,你可以重新審視業(yè)務(wù)流程,思考如何將數(shù)據(jù)科學(xué)應(yīng)用到這些業(yè)務(wù)中,想辦法將數(shù)據(jù)科學(xué)與業(yè)務(wù)完美融合,借助業(yè)務(wù)應(yīng)用的成功案例為數(shù)據(jù)科學(xué)的后續(xù)發(fā)展鋪路。

與有更多技能的人合作,加入多元化的團(tuán)隊不僅可以幫助你更容易獲得更大的成就,你還可以在合作過程中學(xué)習(xí)到其他成員掌握的知識和擁有的技能。

尾記

種一棵樹最好的時間是十年前,其次是現(xiàn)在。珍惜這次機(jī)會,馬上開始你的學(xué)習(xí)之路,從實際問題入手,步步攻克一系列難關(guān)。開弓沒有回頭箭,你必須不斷努力,將全部的信心和熱情投入到工作中,你會驚訝地發(fā)現(xiàn)原來自己也可以獲得如此高的成就!

相關(guān)報道:

https://towardsdatascience.com/from-data-analyst-to-data-scientist-f67a724ea265

標(biāo)簽: Mysql 安全 代碼 媒體 排名 數(shù)據(jù)分析 數(shù)據(jù)庫 網(wǎng)絡(luò) 云計算 轉(zhuǎn)型

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:萬字長文概述NLP中的深度學(xué)習(xí)技術(shù)

下一篇:三大指標(biāo),選到最佳IDC測試供應(yīng)商