中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

現(xiàn)代數(shù)據(jù)科學(xué)家的“忍者“技能

2020-04-28    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

作者:Khush Patel 譯者:劉志勇 來(lái)源:InfoQ

突然間,數(shù)據(jù)科學(xué)家成了“香餑餑”。江湖傳言,剛畢業(yè)的人工智能博士起薪 50 萬(wàn),2 年經(jīng)驗(yàn)的薪水 100 萬(wàn)以上,貌似一當(dāng)上數(shù)據(jù)科學(xué)家,分分鐘就能實(shí)現(xiàn)財(cái)富自由……屏幕前的你,是不是躍躍欲試?如果你想成為一名數(shù)據(jù)科學(xué)家,那么本文將會(huì)給你介紹真正的數(shù)據(jù)科學(xué)家必需的所有技能。

用外行人的話來(lái)說(shuō),火箭專家就是一個(gè)具有火箭科學(xué)知識(shí)(并在火箭科學(xué)方面具有驚人經(jīng)驗(yàn))的人。要成為一名數(shù)據(jù)科學(xué)家并不難。(我說(shuō)的不難,并不是說(shuō)每個(gè)小孩都可以擔(dān)任數(shù)據(jù)科學(xué)家。要知道,成為一名噴氣式飛行員并不需要掌握火箭科學(xué)方面的知識(shí),但仍然也需要付出很多努力。)

 

 

在和 Linkedln 上的許多數(shù)據(jù)科學(xué)家進(jìn)行交流之后,我寫下了這篇文章,收集了其他人 30 多年的經(jīng)驗(yàn)。在本文中,你將會(huì)發(fā)現(xiàn)數(shù)據(jù)科學(xué)家很多令人驚嘆的經(jīng)歷。

讓我們來(lái)看看,如果要成為一名數(shù)據(jù)科學(xué)家,都必須掌握哪些所需的技能。

1. 數(shù)學(xué)與統(tǒng)計(jì)學(xué)

機(jī)器學(xué)習(xí)

各種機(jī)器學(xué)習(xí)技術(shù)的的知識(shí),就好比任何數(shù)據(jù)科學(xué)家的“心臟”一樣。很難想象,會(huì)有這樣的數(shù)據(jù)科學(xué)家,居然沒(méi)有機(jī)器學(xué)習(xí)方面的知識(shí)。大多數(shù)公司要求機(jī)器學(xué)習(xí)工程師至少具備 3~5 年的基礎(chǔ)經(jīng)驗(yàn),之后,才有資格成為任何組織的數(shù)據(jù)科學(xué)家。

在人工智能項(xiàng)目中,機(jī)器學(xué)習(xí)工程師就是“萬(wàn)事通”。萬(wàn)事通意味著,對(duì)問(wèn)題定義、數(shù)據(jù)分析、結(jié)果展示和測(cè)試都有透徹的理解。它包括了從預(yù)處理到選擇合適的算法來(lái)解決問(wèn)題,再到以出色的可視化方式來(lái)展示結(jié)果的方方面面。整個(gè)過(guò)程都要靠你自己動(dòng)手,因?yàn)槟慵仁情_(kāi)發(fā)人員,又是分析人員,同時(shí)還是測(cè)試人員。

所以基本上,你需要擁有機(jī)器學(xué)習(xí)的“超能力”。

雖然你不必親自編寫每一行代碼,但是理解機(jī)器學(xué)習(xí)是很重要的。

統(tǒng)計(jì)建模

統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)家的工作中起著非常重要的作用。僅僅是編寫機(jī)器學(xué)習(xí)算法的代碼這一項(xiàng),你就必須對(duì)數(shù)據(jù)進(jìn)行更多的分析。最后,經(jīng)過(guò)充分預(yù)處理的數(shù)據(jù)可能意味著你的項(xiàng)目已經(jīng)完成了一半。

你需要對(duì)評(píng)估矩陣,以及一些參數(shù),如正確率、錯(cuò)誤率、精確度、召回率、F1 分?jǐn)?shù)和其他術(shù)語(yǔ)有一個(gè)基本的理解,才能完成你的任務(wù)。對(duì)概率和統(tǒng)計(jì)有著超強(qiáng)理解的人可以像數(shù)據(jù)科學(xué)領(lǐng)域的國(guó)王一樣統(tǒng)治世界。

貝葉斯推斷

貝葉斯理論是數(shù)據(jù)分析領(lǐng)域中最重要的理論。數(shù)據(jù)革命始于貝葉斯理論。掌握貝葉斯理論的基礎(chǔ)知識(shí),將會(huì)使你在數(shù)據(jù)科學(xué)競(jìng)賽中所向披靡,勢(shì)如破竹。掌握這一理論,你才能夠輕松地從其他競(jìng)爭(zhēng)對(duì)手中脫穎而出。

有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)

如果數(shù)據(jù)科學(xué)家沒(méi)有監(jiān)督算法知識(shí),就好比沒(méi)有球的足球運(yùn)動(dòng)員。試想,如果一場(chǎng)足球賽中,球員在沒(méi)有球的情況下進(jìn)行比賽,會(huì)是什么樣子?兩個(gè)字:愚蠢。同理,如果數(shù)據(jù)科學(xué)家沒(méi)有掌握有監(jiān)督算法和無(wú)監(jiān)督算法的知識(shí),也是一樣的情景。

 

現(xiàn)代數(shù)據(jù)科學(xué)家的“忍者“技能

 

有監(jiān)督算法包括線性回歸、邏輯回歸、樸素貝葉斯線性判別分析、決策樹、K- 最近鄰算法、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)(多層感知器)等。

無(wú)監(jiān)督算法包括層次聚類、K- 均值、混合模型、 DBSCAN、OPTICS 算法、主成分分析等等。

優(yōu)化

優(yōu)化是一項(xiàng)不為多數(shù)人所能掌握的技能。這是使你有別于其他開(kāi)發(fā)人員的關(guān)鍵因素。訓(xùn)練模型并不很重要,但是,創(chuàng)建一個(gè)優(yōu)化版本的模型需要進(jìn)行大量的工作。超參數(shù)每天都會(huì)讓你頭疼,如果你對(duì)優(yōu)化有著完美的理解,對(duì)你來(lái)說(shuō),優(yōu)化就像進(jìn)行一場(chǎng)沒(méi)有任何障礙的比賽。因此,要成為一名“英雄”,就要優(yōu)化你的優(yōu)化技能。

2. 編程與數(shù)據(jù)庫(kù)

計(jì)算機(jī)科學(xué)基礎(chǔ)

計(jì)算機(jī)科學(xué)技能是很少有人能掌握的。但我有很多熟人,他們都是專業(yè)的機(jī)械工程師。他們開(kāi)始學(xué)習(xí) Python,然后轉(zhuǎn)入數(shù)據(jù)科學(xué)領(lǐng)域。你會(huì)驚訝的發(fā)現(xiàn),他們的表現(xiàn)就像冠軍一樣。

但是,計(jì)算機(jī)科學(xué)概念對(duì)數(shù)據(jù)科學(xué)家的角色來(lái)說(shuō),是非常重要的要求。如果你能夠掌握算法、操作系統(tǒng)、Web 開(kāi)發(fā)和設(shè)計(jì)、計(jì)算機(jī)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)將會(huì)帶來(lái)很大的不同。掌握這些概念,將會(huì)使你的速度提高十倍。

腳本和編程語(yǔ)言

如果沒(méi)有 Python、R 或 MatLab 這樣的腳本或編程語(yǔ)言,就不可能想象數(shù)據(jù)科學(xué)家的生活會(huì)是什么樣子的。如果你沒(méi)有掌握這些腳本或編程語(yǔ)言中的任何一個(gè),那么就請(qǐng)你自己出局吧。沒(méi)有花花草草的話,你就永遠(yuǎn)不會(huì)有一座花園。你能想象沒(méi)有花花草草的花園是什么樣子的嗎?試想一下,那不是花園,那是沙漠。而你必須在沙漠里耕作。這怎么可能呢?你不僅需要了解 Python,還需要了解一些更高級(jí)的庫(kù),如 TensorFlow、PyTorch、帶 MatplotLib 的 Keras、Numpy 和 Pandas。

因此,在腳本和編程語(yǔ)言方面,沒(méi)有妥協(xié)的地方。就像 NO NO NO NO NO NO。就是這樣!

 

 

數(shù)據(jù)庫(kù) SQL 和 NoSQL

每個(gè)項(xiàng)目都有自己的數(shù)據(jù)和存儲(chǔ)格式。全面了解各種數(shù)據(jù)庫(kù),可以幫助你理解和定義項(xiàng)目特有的問(wèn)題。

數(shù)據(jù)可以是任何形式的。你只需接受這些數(shù)據(jù)就可以了。你不能對(duì)客戶說(shuō),“不行,我想要不同格式的數(shù)據(jù)。”記住,你的職責(zé)就是將數(shù)據(jù)轉(zhuǎn)換成所需的算法輸入,并對(duì)其進(jìn)行預(yù)處理。數(shù)據(jù)科學(xué)界指出,粗略的數(shù)據(jù)會(huì)降低正確性,但大量的非結(jié)構(gòu)化數(shù)據(jù)會(huì)帶來(lái)意想不到的結(jié)果。但這需要?jiǎng)?chuàng)新的想法來(lái)解決。這時(shí)候,如果你掌握不同數(shù)據(jù)庫(kù)的知識(shí),將有助于你解決問(wèn)題。它可以是結(jié)構(gòu)化的、非結(jié)構(gòu)化的、圖像、文本、音頻或者其他東西。

將數(shù)據(jù)轉(zhuǎn)換為可視化

可視化是一件令人驚嘆的事情,你可以用數(shù)據(jù)來(lái)做。當(dāng)你感受到可視化的重要性時(shí),你就會(huì)從內(nèi)部感受到數(shù)據(jù)?梢暬钦故窘Y(jié)果的最佳方式。在演示中不用說(shuō)一句話,你的老板就會(huì)明白一切。因此,它是數(shù)據(jù)科學(xué)領(lǐng)域取得成功的關(guān)鍵。

數(shù)據(jù)科學(xué)工具知識(shí)

不同工具的指令就像在比賽中使用特斯拉賽博皮卡一樣。當(dāng)然,你也可以用“塔塔 Nano”(印度生產(chǎn)的全球最便宜的汽車)完成一場(chǎng)比賽,但是,這值得去完成一場(chǎng)比賽嗎?明智地使用任何工具也是一項(xiàng)技能。所有的工具都可以在互聯(lián)網(wǎng)上找到,但你必須能夠正確地使用它。

像 Tableau、SAS、Apache Spark、Excel、RapidMiner、KNIME、QlikView 這樣的工具,可以提高你的效率并縮短項(xiàng)目期限。

 

 

云計(jì)算

對(duì)云計(jì)算的了解并不是必須的,但可以作為一種資產(chǎn)。一些內(nèi)置的庫(kù)和服務(wù)可以很好地使用,比如,Google MLKit、Google Colaboratory、Kaggle 服務(wù)器、IBM Watson 和其他 API、Microsoft Azure AI 工具包和 AWS 存儲(chǔ)。

至此,全部技術(shù)細(xì)節(jié)我都講完了。

但是,你仍然對(duì)如何成為一名數(shù)據(jù)科學(xué)家一無(wú)所知。

3. 領(lǐng)域知識(shí)和軟技能

對(duì)業(yè)務(wù)充滿熱情

數(shù)據(jù)科學(xué)家也經(jīng)常從業(yè)務(wù)角度考慮問(wèn)題,因?yàn)闅w根結(jié)底,什么才是最重要的呢?錢。是的,我再說(shuō)一次,錢!

你必須有很強(qiáng)的業(yè)務(wù)策略。它會(huì)提升你在組織中的價(jià)值,最重要的是你的名聲。作為數(shù)據(jù)科學(xué)家,有一個(gè)關(guān)于業(yè)務(wù)視角的想法是很好的。

對(duì)數(shù)據(jù)充滿好奇心

優(yōu)秀的數(shù)據(jù)科學(xué)家具備根據(jù)自己的經(jīng)驗(yàn)以不同的方式看待數(shù)據(jù)的技能。數(shù)據(jù)科學(xué)家能看到的東西,初級(jí)工程師往往看不到,是因?yàn)閿?shù)據(jù)科學(xué)家有經(jīng)驗(yàn)的“放大鏡“和驚人的才能。所以,數(shù)據(jù)很能說(shuō)明問(wèn)題。作為一名數(shù)據(jù)科學(xué)家,你只需仔細(xì)聆聽(tīng)。

問(wèn)題解決能手

人工智能是沒(méi)有人能夠做到完美境界的領(lǐng)域。你可以面對(duì)很多挑戰(zhàn),只要你能夠跳出框框想問(wèn)題即可。從字面上來(lái)看,解決問(wèn)題就需要跳出框框來(lái)思考。你身邊有個(gè)解決方案,但你只需將它放入你的腦海中,它就會(huì)解決你的問(wèn)題。

戰(zhàn)略決策者

作為一名數(shù)據(jù)科學(xué)家,在某些階段,你必須更上一層樓,因?yàn),在完成某些任?wù)后,你將會(huì)意識(shí)到,使用另一種技術(shù),可以更輕松的完成這項(xiàng)任務(wù)。因此,要運(yùn)用一些腦力和技巧來(lái)做決定。只需繼續(xù)使用基本的解決方案,然后再回來(lái)應(yīng)用一些高級(jí)版本即可。

4. 溝通

與高級(jí)管理層接觸

這完全是關(guān)于人脈關(guān)系網(wǎng)、人際交往技巧和個(gè)人能力的問(wèn)題。一分耕耘,一分收獲。這就像是你的數(shù)據(jù)科學(xué)職業(yè)競(jìng)賽中的強(qiáng)力助推器。與機(jī)構(gòu)接觸,他們會(huì)在組織需要的時(shí)候幫助你。與上級(jí)保持良好的溝通,可以讓你及時(shí)了解即將進(jìn)行的項(xiàng)目。提前做好準(zhǔn)備是最好的表現(xiàn)方式。

講故事的技巧

作為數(shù)據(jù)科學(xué)家,你必須參加很多會(huì)議,從董事會(huì)到客戶,再?gòu)氖紫夹g(shù)官到許多其他人。因此,如果不給他們展示代碼的話,你就必須給他們解釋一個(gè)場(chǎng)景。因此,只要展示你的魔力,人們就會(huì)認(rèn)為你是天使。只要把故事講好,你就可以睡個(gè)好覺(jué)了。

了解人工智能的最新趨勢(shì)

要隨時(shí)了解市場(chǎng)上的最新趨勢(shì)和技術(shù)。這會(huì)讓你成為一個(gè)積極的領(lǐng)導(dǎo)者。在這個(gè)技術(shù)時(shí)代(21 世紀(jì)),只有積極的領(lǐng)導(dǎo)者才能統(tǒng)治世界。

如果你擁有這些技能,那么你就是這個(gè)競(jìng)賽的冠軍。這可是神一般的水平啊!

 

 

作者介紹:

Khush Patel,人工智能愛(ài)好者,機(jī)器學(xué)習(xí)工程師,F(xiàn)acebook 人工智能學(xué)者、發(fā)明家。

原文鏈接:

https://towardsdatascience.com/ninja-skills-of-modern-data-scientist-621622e59614


標(biāo)簽: 數(shù)據(jù) 蒲Ъ

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:在時(shí)間關(guān)系數(shù)據(jù)上AutoML:一個(gè)新的前沿

下一篇:一文盤點(diǎn)2019年AI領(lǐng)域都發(fā)生了什么