中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何11步轉(zhuǎn)行數(shù)據(jù)科學(xué)家 (適用數(shù)據(jù)員/ MIS / BI分析師)

2019-04-17    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

數(shù)據(jù)科學(xué)作為一個(gè)專業(yè)領(lǐng)域迅速崛起,吸引了來自各種職業(yè)背景的人。工程師、計(jì)算機(jī)科學(xué)家、市場(chǎng)和金融畢業(yè)生、分析師、人力資源人員——每個(gè)人都想嘗一塊 “數(shù)據(jù)科學(xué)餡餅”。

那么,為什么我要特別關(guān)注這些職業(yè):數(shù)據(jù)分析/數(shù)據(jù)倉庫(MIS)/商業(yè)智能(BI)呢?讓我先解釋一下。

我經(jīng)常遇到一些優(yōu)秀的商業(yè)智能分析師 (BI),尋求獲得自己人生的第一個(gè)數(shù)據(jù)科學(xué)角色。但他們常常因缺乏機(jī)會(huì)而沮喪。他們中很多人感覺自己的角色是重復(fù)的,或者只需要扮演好被要求的角色。

他們實(shí)際上忽略了一個(gè)事實(shí):比起任何其他職業(yè)的人,他們離數(shù)據(jù)科學(xué)更近。

商業(yè)智能分析師 (BI) 為何能更輕松地過渡到數(shù)據(jù)科學(xué)領(lǐng)域

商業(yè)智能專業(yè)人士比幾乎所有試圖過渡到數(shù)據(jù)科學(xué)的人都擁有巨大優(yōu)勢(shì),原因如下:

♦ 商業(yè)智能分析師已經(jīng)在各個(gè)項(xiàng)目中接觸到了數(shù)據(jù)科學(xué)家;
♦ 知曉如何管理和處理數(shù)據(jù)(有時(shí)按比例);
♦ 有業(yè)務(wù)背景,他們密切地從事相關(guān)業(yè)務(wù);
♦ 他們有基本的數(shù)據(jù)探索步驟的經(jīng)驗(yàn),因?yàn)槌擞迷趫?bào)告中,業(yè)務(wù)部門也會(huì)經(jīng)常要求這些。

換句話說,這些人工作在數(shù)據(jù)科學(xué)項(xiàng)目的“前半部分”,這已經(jīng)比大多數(shù)有志成為數(shù)據(jù)科學(xué)家的人多了很多行業(yè)經(jīng)驗(yàn)。

如果你正是這樣一位希望從數(shù)據(jù)分析/數(shù)據(jù)倉庫(MIS)/商業(yè)智能(BI)跳轉(zhuǎn)到數(shù)據(jù)科學(xué)家,這篇文章就是為你量身定制的。你可以將這11步作為你能遵循的學(xué)習(xí)路徑。實(shí)際上,我強(qiáng)烈建議你在當(dāng)前的角色中執(zhí)行這些步驟。開始于你正站著的地方,直到破霧而出,進(jìn)入數(shù)據(jù)科學(xué)!我自己整理的一份最新的大數(shù)據(jù)進(jìn)階資料和高級(jí)開發(fā)教程,大數(shù)據(jù)學(xué)習(xí)群:522189307 歡迎進(jìn)階中和進(jìn)想深入大數(shù)據(jù)的小伙伴加入。

在下面的內(nèi)容中--—商業(yè)智能、數(shù)據(jù)倉庫師、數(shù)據(jù)員、數(shù)據(jù)分析員都可以互換使用。這些角色和名稱幾乎沒有區(qū)別,而且有很多重疊。

準(zhǔn)備好和我一起踏上征程了嗎?讓我們一步一步地來。

第一步:進(jìn)行探查分析并解讀分析成果

讓我以三個(gè)BI人員日常報(bào)告的例子開始。

示例 1:

 

 

該BI人員已經(jīng)得到了數(shù)據(jù)結(jié)果,其中包含有關(guān)城市和地區(qū)級(jí)別的業(yè)務(wù)來源,以及業(yè)務(wù)質(zhì)量的詳細(xì)信息。

示例 2:

 

 

在這里,BI人員為“拒絕分?jǐn)?shù)”列添加了RAG (紅-琥珀色-綠) 分析。拒絕分?jǐn)?shù)越低,業(yè)務(wù)質(zhì)量越高。

示例 3:

 

 

在本例中,BI人員通過對(duì)分析結(jié)果進(jìn)行解讀,將報(bào)告提升到了另一個(gè)層次。你可以看到他從報(bào)告中得出的前2個(gè)發(fā)現(xiàn)。

這里我只舉了一個(gè)簡(jiǎn)單的例子對(duì)報(bào)告進(jìn)行解讀分析。你可以根據(jù)正在分享的信息類型加入更多視覺效果/圖表。

以上哪個(gè)示例對(duì)于業(yè)務(wù)用戶更有意義?

看看上面的3個(gè)例子,我傾向于“示例3”,因?yàn)樗鼮闃I(yè)務(wù)增加了更多價(jià)值:

♦ 為報(bào)告添加了更多可理解性;
♦ 它還強(qiáng)調(diào)了可著手的操作領(lǐng)域;
♦ 如果你查看那些“發(fā)現(xiàn)”,其中一個(gè)是區(qū)域級(jí)別匯總報(bào)告后得出的。

這些實(shí)際上能很大地幫助業(yè)務(wù)人員。當(dāng)你與高層管理者合作時(shí),你會(huì)發(fā)現(xiàn)他們中的大多數(shù)需要可著手操作的項(xiàng)目,而不想花時(shí)間在解釋報(bào)告和深入分析上。

想要生成一份類似的報(bào)告,一位BI人員應(yīng)該具有好奇心,關(guān)注細(xì)節(jié),熟練掌握任何一種工具(Excel/SQL/QlikView/Tableau), 以及業(yè)務(wù)知識(shí)。

這個(gè)技能集不僅限于從事BI的人員。它對(duì)于成為一名好的數(shù)據(jù)科學(xué)專家也是關(guān)鍵。在大多數(shù)情況下,一名數(shù)據(jù)科學(xué)家60%—70%的工作是關(guān)于業(yè)務(wù)理解,數(shù)據(jù)探索和對(duì)手頭問題產(chǎn)生見解。

與其它正在向數(shù)據(jù)科學(xué)過渡的人員相比,一位BI人士擁有巨大的優(yōu)勢(shì)。你可以從今天開始練習(xí)這個(gè)技能集,它也將幫助你在現(xiàn)在的工作中做得更好。這是雙贏!

面臨的挑戰(zhàn)和解決方案:

無法在分析結(jié)果與業(yè)務(wù)之間建立聯(lián)系:生成見解與你對(duì)業(yè)務(wù)的理解直接相關(guān)。我建議你與領(lǐng)域?qū)<衣?lián)系,并嘗試解釋它正如何影響著業(yè)務(wù)指標(biāo)。

沒有足夠時(shí)間生成見解:我同意--—你正在緊張的最后期限下,忙著做業(yè)務(wù)報(bào)告,沒有時(shí)間生成見解。這種情況下,我有2個(gè)建議:

不要開始一個(gè)有著非常嚴(yán)格時(shí)間表的報(bào)告(例如日?qǐng)?bào))。挑選有較少時(shí)間限制的報(bào)告任務(wù)。月報(bào)便是一個(gè)很好的開始,因?yàn)樗鼈儼匾男畔⒉⑶覟槟闵钊胪诰蛐畔⑻峁┝藭r(shí)間。

自動(dòng)生成報(bào)告。這將為你節(jié)省大量時(shí)間,你可以利用這些時(shí)間來理解報(bào)告并生成見解。你應(yīng)該學(xué)習(xí) Excel/SAS 的宏指令或其它類似自動(dòng)化報(bào)告工具。

第二步:學(xué)習(xí)統(tǒng)計(jì)學(xué)以支持你對(duì)于報(bào)告的見解

是時(shí)候用一些統(tǒng)計(jì)指標(biāo)來支持你的見解了。不要把你自己局限在僅僅靠視覺解釋來生成見解?纯聪旅娴膱D--—你的第一反應(yīng)是什么?

 

 

這個(gè)圖上可以看到競(jìng)爭(zhēng)前和競(jìng)爭(zhēng)后的平均業(yè)務(wù)來源。現(xiàn)在的問題是“競(jìng)爭(zhēng)是平均業(yè)務(wù)來源增長的背后推動(dòng)力,還是只是一種隨機(jī)增長?”這里,我們需要依靠某些統(tǒng)計(jì)概念來支持我們的見解,比如做 z-檢測(cè), t-檢測(cè)或其它統(tǒng)計(jì)檢驗(yàn)。掌握好統(tǒng)計(jì)知識(shí)將在這些處境中幫助到你。

你應(yīng)該對(duì)以下統(tǒng)計(jì)主題有扎實(shí)的理解,如果你想進(jìn)入數(shù)據(jù)科學(xué)角色的話:

♦ 描述性統(tǒng)計(jì)

♦ 平均數(shù),中位數(shù),眾數(shù)

♦ 方差和標(biāo)準(zhǔn)差

♦ 概率

♦ 伯努利試驗(yàn)與概率質(zhì)量函數(shù)

♦ 中心極限定理

♦ 正態(tài)分布

♦ 推論統(tǒng)計(jì)學(xué)

♦ 置信區(qū)間

♦ 假設(shè)檢驗(yàn)

♦ 協(xié)方差/相關(guān)性

面臨的挑戰(zhàn)和解決方案:

描述性統(tǒng)計(jì)很容易理解,但推理統(tǒng)計(jì)的茶不好喝:實(shí)踐是關(guān)鍵。我建議盡可能地多練習(xí),并對(duì)概念有一個(gè)直觀的理解。在看數(shù)學(xué)方程前先做這件事。這種方法將幫助你首先關(guān)注于應(yīng)用方面,而不是陷入理論的泥潭中。

這些看起來都太統(tǒng)計(jì)學(xué)了,我無法和股東或客戶分享:查看這些報(bào)告的客戶大致有兩類。第一類對(duì)直觀的見解更感興趣,而另一類(風(fēng)險(xiǎn)/數(shù)據(jù)科學(xué)團(tuán)隊(duì))則更關(guān)注統(tǒng)計(jì)見解。與后一類人聯(lián)系,并就你的發(fā)現(xiàn)展開討論。此外,這里最好的策略是用他們的語言討論業(yè)務(wù),而不是統(tǒng)計(jì)語言。例如,開始時(shí)我不會(huì)使用“統(tǒng)計(jì)顯著”一詞,聽眾可能會(huì)感到不舒服。我只會(huì)說,相比于我們從過去中看到的,這個(gè)事件是否有足夠大的可能性發(fā)生。

第三步:把你的發(fā)現(xiàn)呈現(xiàn)給正確的小組

如果你沒有和正確的小組分享你的發(fā)現(xiàn),那探查分析和統(tǒng)計(jì)分析將不會(huì)幫助你進(jìn)入數(shù)據(jù)科學(xué)的角色。

“講故事是一名數(shù)據(jù)科學(xué)專家必須掌握的關(guān)鍵技能。”

這里,我強(qiáng)烈建議在你現(xiàn)有的角色中練習(xí)“講故事”的能力。你可以從以下內(nèi)容開始:

始終在你的報(bào)告或分析中分享詳細(xì)的見解;

分享你的見解并通過演示幻燈片展示你的故事。

這是一個(gè)我個(gè)人職業(yè)生涯非常受益的基本建議——在你的幻燈片中添加可視化效果。如果是報(bào)告或會(huì)議演講,則應(yīng)該對(duì)應(yīng)你的可視化添加背景。困惑嗎?讓我用一個(gè)例子來解釋一下。

 

 

看看下面的可視化。它展示了關(guān)于Sachin Tendulkar職業(yè)生涯中測(cè)試賽的細(xì)節(jié)。你可以在這里使用圖表和數(shù)字討論各種度量。這也展示了為何業(yè)務(wù)理解如此重要——如果你沒有業(yè)務(wù)經(jīng)驗(yàn)的話,你根本無法討論這些指標(biāo)。

面臨的挑戰(zhàn)和解決方案:

不能向小組傳達(dá)統(tǒng)計(jì)見解:不要總使用單一語言(統(tǒng)計(jì)語言)進(jìn)行溝通。我們應(yīng)當(dāng)根據(jù)聽眾來改變我們溝通的方式。例如,你正和一個(gè)統(tǒng)計(jì)小組溝通,那話語中有很多統(tǒng)計(jì)推斷沒問題。如果你與一個(gè)非技術(shù)團(tuán)隊(duì)溝通,統(tǒng)計(jì)和直觀結(jié)合的方式將更有幫助。

以前從未分享過見解,怎么開始?你可能有過這樣的想法:

這些見解對(duì)于業(yè)務(wù)來說有意義嗎?

我可能誤解了這些數(shù)字。這將導(dǎo)致溝通不良并產(chǎn)生負(fù)面影響。

你的擔(dān)心是可理解的,但你不得不從某個(gè)地方開始積累經(jīng)驗(yàn)。我的建議是首先和你的經(jīng)理、有經(jīng)驗(yàn)的同事或你的客戶分享見解。這將給你信心——這是非常重要的推動(dòng)力。所以開始練習(xí)吧!

第四步:探索一個(gè)開源工具來生成報(bào)告或執(zhí)行檢測(cè)分析

到目前為止,我還沒有討論任何生成報(bào)告和見解的工具。我特意回避了這樣的問題,例,你該選擇哪樣工具?哪個(gè)是合適的或更好的?這是因?yàn)槲业哪繕?biāo)是讓你的關(guān)注點(diǎn)聚焦于檢測(cè)分析、統(tǒng)計(jì)概念和磨練你的溝通技巧,這樣你可以用你現(xiàn)在工作中的工具來展現(xiàn)你的新發(fā)現(xiàn)。

現(xiàn)在,是時(shí)候來學(xué)習(xí)一種工具了,它具有以下特點(diǎn):

♦ 處理(大量)數(shù)據(jù)的能力;

♦ 可視化能力;

♦ 建立預(yù)測(cè)模型的能力(機(jī)器學(xué)習(xí)模型);

♦ 深度學(xué)習(xí)支持;

♦ 客戶服務(wù)支持和繁榮的社區(qū)。

你可以在 SAS/R/Python中任意選擇,因?yàn)檫@些工具都有以上功能。在這里,你的初始任務(wù)是非常具體的,在學(xué)習(xí)一個(gè)新工具的同時(shí),讓你自己習(xí)慣執(zhí)行數(shù)據(jù)探索、可視化、檢測(cè)分析和統(tǒng)計(jì)測(cè)試。你不需要在這些工具上擁有完整的專業(yè)知識(shí)(不管怎樣,開始時(shí)不需要)

 

 

面臨的挑戰(zhàn)和解決方案:

沒有編程經(jīng)驗(yàn):記住,你無需成為該工具的專家。重點(diǎn)是你該用一個(gè)新工具來執(zhí)行相同的練習(xí)(如探索,可視化或統(tǒng)計(jì)檢驗(yàn))。你將通過練習(xí)掌握這些技能和工具。

當(dāng)前的數(shù)據(jù)科學(xué)團(tuán)隊(duì)在SAS上工作,我該轉(zhuǎn)移到Python/R上嗎?我建議只從SAS開始。始終選擇當(dāng)前組織中的數(shù)據(jù)科學(xué)團(tuán)隊(duì)正在使用的工具。這將有助于你向數(shù)據(jù)科學(xué)過渡。

第五步:了解建模/預(yù)測(cè)建模的步驟

現(xiàn)在終于到了數(shù)據(jù)科學(xué)最吸引人的部分——建模!在你投身于研究具體模型前,我建議你首先理解存在的問題類型。

大體上,我們可以將建模過程分為5步:

♦ 定義問題

♦ 生成假設(shè)

♦ 探索數(shù)據(jù)

♦ 模型建立

♦ 模型評(píng)估和驗(yàn)證

我將前兩步放到后面講(定義問題和生成假設(shè))。這里我們先討論探索數(shù)據(jù)。

探索分析的步驟類似于檢測(cè)分析,這里我們的主要目標(biāo)是理解每個(gè)變量的行為和它們互相的關(guān)系。良好的統(tǒng)計(jì)知識(shí)將對(duì)你有很大幫助。這一步的終點(diǎn)是生成見解和數(shù)據(jù)清洗。你可能需要輸入丟失值,檢測(cè)和處理異常值和執(zhí)行多種類型的轉(zhuǎn)換。

面臨的挑戰(zhàn)和解決方案:

它是如何區(qū)分于檢測(cè)分析的:它與檢測(cè)分析類似,添加了數(shù)據(jù)清洗和轉(zhuǎn)換步驟。這里,你的重點(diǎn)應(yīng)該是進(jìn)行數(shù)據(jù)探索以實(shí)現(xiàn)特定目標(biāo),例如判斷“給定變量”是否會(huì)對(duì)目標(biāo)變量產(chǎn)生影響。

在沒有首先陳述問題時(shí),我將如何建立和目標(biāo)變量的關(guān)系?你可以使用定義了問題語句的任何開放數(shù)據(jù)集,并開始練習(xí)你的數(shù)據(jù)探索技能。

第六步:評(píng)估模型性能的方法

在模型構(gòu)建的過程中,我們?cè)谝粋(gè)預(yù)先知道了目標(biāo)的數(shù)據(jù)集上訓(xùn)練模型,然后將其應(yīng)用到測(cè)試數(shù)據(jù)集上,以預(yù)測(cè)目標(biāo)變量。我們顯然希望在預(yù)測(cè)目標(biāo)變量時(shí)足夠準(zhǔn)確。

如何檢查模型是否準(zhǔn)確?我們需要一個(gè)能根據(jù)實(shí)際觀察結(jié)果去評(píng)估模型結(jié)果方法。讓我們用一個(gè)例子來理解這一點(diǎn):

 

 

我們有一個(gè)客戶群,C1、C2和C3。我們估計(jì)只有C3會(huì)購買產(chǎn)品A。然而事實(shí)證明,C2和C3都買了這件商品。這意味著我們的準(zhǔn)確率是 66.6%。這個(gè)準(zhǔn)確率就被稱為“評(píng)估指標(biāo)”。

評(píng)估指標(biāo)將根據(jù)你正在解決的問題類型而不同。

現(xiàn)在你已經(jīng)決定了評(píng)估指標(biāo)的方法,但你有“實(shí)際結(jié)果”來評(píng)估你的模型嗎?你不能跳到未來去準(zhǔn)備一個(gè)測(cè)試數(shù)據(jù)集!在這種情況下,我們保留了數(shù)據(jù)集的一個(gè)特定樣本,該樣本集不用來訓(xùn)練模型。稍后我們用這個(gè)樣本集來評(píng)估模型。這種方法稱為模型驗(yàn)證。面臨的挑戰(zhàn)和解決方案:

有必要知道所有的評(píng)估指標(biāo)嗎?不一定。目前,只關(guān)注兩個(gè)評(píng)估指標(biāo)—“RMSE” 和“混淆矩陣”。這兩個(gè)對(duì)于起步已經(jīng)足夠了。你可以使用RMSE應(yīng)對(duì)回歸問題,用混淆矩陣來應(yīng)對(duì)分類問題。

第七步:用線性回歸和邏輯回歸介紹預(yù)測(cè)建模

你已經(jīng)了解了數(shù)據(jù)集并查看了評(píng)估模型性能的指標(biāo)。下一步是什么?

應(yīng)用建模技術(shù)!不要同時(shí)學(xué)習(xí)各種技術(shù),F(xiàn)在只關(guān)注兩個(gè):

♦ 線性回歸

♦ 邏輯回歸

這兩個(gè)技術(shù)將幫助你預(yù)測(cè)連續(xù)變量和分類變量。

 

 

例如:

線性回歸將幫助你預(yù)測(cè)下個(gè)季度保險(xiǎn)公司銷售代理的預(yù)期業(yè)績。

邏輯回歸將幫助你了解交叉銷售產(chǎn)品給特定客戶的可能性。

面臨的挑戰(zhàn)和解決方案:

算法太數(shù)學(xué)化,難以理解:首先你要對(duì)這些技術(shù)建立一個(gè)直觀的理解,然后再深入到數(shù)學(xué)細(xì)節(jié)。這里我建議采用自上而下的方法,更多地關(guān)注實(shí)際方面。你必須能夠解釋模型結(jié)果(例如了解該模型是否運(yùn)行良好)

第八步:確定業(yè)務(wù)問題(與你的角色相關(guān))將其轉(zhuǎn)換為數(shù)據(jù)問題并進(jìn)行預(yù)測(cè)

那么,哪里可以找到你所在領(lǐng)域的數(shù)據(jù)集呢?找到一個(gè)商業(yè)問題可能很困難。

你應(yīng)該與領(lǐng)導(dǎo)層或團(tuán)隊(duì)經(jīng)理交談,并將他們的業(yè)務(wù)挑戰(zhàn)之一作為你的項(xiàng)目。這里,第一步是將業(yè)務(wù)問題轉(zhuǎn)換成數(shù)據(jù)問題。然后,開始順著以下步驟前進(jìn)(我們?cè)谇懊娴?點(diǎn)中討論過)——生成假設(shè),收集數(shù)據(jù),探索數(shù)據(jù),數(shù)據(jù)清理,模型構(gòu)建和驗(yàn)證。

作為一名BI專業(yè)人員,你具有的優(yōu)勢(shì)之一是你已經(jīng)熟悉數(shù)據(jù)集中的變量。你的檢測(cè)分析技能將幫助你理解變量間的關(guān)系。你可以跳轉(zhuǎn)到數(shù)據(jù)清理、轉(zhuǎn)換、確定正確的評(píng)估度量、設(shè)置驗(yàn)證集以及最終構(gòu)建模型等任務(wù)。

面臨的挑戰(zhàn)和解決方案:

無法找到業(yè)務(wù)問題:你可能遭遇這樣的處境,你無法獲得業(yè)務(wù)問題或不能說服業(yè)務(wù)/團(tuán)隊(duì)經(jīng)理了解你的技能集。如果這正是你目前的處境,那么你可以試試這些方法:

以你自己的能力開始構(gòu)建模型,以獲得更為明確的問題陳述:假設(shè)你要分析保險(xiǎn)代理逐月的業(yè)務(wù)來源。你可以在制作分析報(bào)告時(shí)考慮預(yù)測(cè)代理們下個(gè)月的表現(xiàn)。你可以基于過去已有的人口統(tǒng)計(jì)或業(yè)績表現(xiàn)數(shù)據(jù)。一個(gè)月后你再來驗(yàn)證你的結(jié)果,檢查你的預(yù)測(cè)有多好。

參加開放的數(shù)據(jù)科學(xué)競(jìng)賽,提高自己的形象:參加數(shù)據(jù)科學(xué)競(jìng)賽是一個(gè)極好學(xué)習(xí)數(shù)據(jù)科學(xué)的方式,這將提高你的知識(shí)和形象,以及了解你相對(duì)于世界頂級(jí)科學(xué)家所處的位置。

第九步:與企業(yè)主分享你的模型結(jié)果,獲得他們的信任

 

 

在構(gòu)建模型后,你應(yīng)該與你的主管或決策者共享結(jié)果(如團(tuán)隊(duì)或項(xiàng)目經(jīng)理)。作為一名數(shù)據(jù)科學(xué)專家,分享你的發(fā)現(xiàn)是非常重要的(比如哪些特征會(huì)對(duì)目標(biāo)變量產(chǎn)生影響)。你還應(yīng)該圍繞模型結(jié)果和實(shí)際數(shù)字之間的比較進(jìn)行定期更新。

這個(gè)過程將也會(huì)幫助你調(diào)整和改進(jìn)你的模型。如果模型運(yùn)行良好,那么你很有可能獲得另外一個(gè)任務(wù)或參與到核心的數(shù)據(jù)科學(xué)團(tuán)隊(duì)中的機(jī)會(huì)。這也正是我們的目標(biāo),不是嗎?

面臨的挑戰(zhàn)和解決方案:

我的模型表現(xiàn)不好,那我該怎么辦呢?沒關(guān)系的。你可以進(jìn)一步研究數(shù)據(jù)集和尋找問題?梢躁P(guān)注不同的算法,它可能更適合你正在解決的問題。

第十步:不斷學(xué)習(xí)新算法,參加數(shù)據(jù)科學(xué)社團(tuán),專注構(gòu)建個(gè)人檔案

在數(shù)據(jù)科學(xué)領(lǐng)域,學(xué)習(xí)永無止境。這是一個(gè)不斷發(fā)展的領(lǐng)域,我們需要同它一起不斷進(jìn)化。至此你已經(jīng)學(xué)習(xí)了線性回歸和邏輯回歸,是時(shí)候擴(kuò)展你的知識(shí),超越自己了。學(xué)習(xí)決策樹,隨機(jī)森林,甚至神經(jīng)網(wǎng)絡(luò)等算法。

就像我之前提到過的,你應(yīng)該在實(shí)踐中學(xué)習(xí)。擁有算法知識(shí)固然很好,但除非你能把它應(yīng)用于實(shí)踐中。撿回我們之前用過的數(shù)據(jù)集,并應(yīng)用這些新算法。你很可能將看到你的模型有了巨大的改善。

現(xiàn)在,讓我們?cè)诠ぞ吆图夹g(shù)之外更進(jìn)一步。我想強(qiáng)調(diào)在數(shù)據(jù)科學(xué)社區(qū)構(gòu)建你的社交網(wǎng)絡(luò)和個(gè)人資料的重要性。

 

 

開始參加以數(shù)據(jù)科學(xué)為中心的會(huì)議。你將遇到志趣相投的人,還有可以給你指導(dǎo)的經(jīng)驗(yàn)豐富的專家。我看到過很多有抱負(fù)的數(shù)據(jù)科學(xué)人員通過這些活動(dòng)獲得了工作機(jī)會(huì),所以我可以擔(dān)保這確實(shí)有用!

你應(yīng)該關(guān)注個(gè)人資料的數(shù)字化方面。既然你一直在與數(shù)據(jù)科學(xué)項(xiàng)目合作,那就向社區(qū)展示你的工作!將代碼上傳到Gitthub上并開始發(fā)布關(guān)于你的發(fā)現(xiàn)的博客/文章。這將有助于你未來的雇主看到,你對(duì)某些項(xiàng)目有著很好的理解。

面臨的挑戰(zhàn)和解決方案:

我不能決定我該研究哪種算法:這是一個(gè)經(jīng)典問題。曾讓很多有志的數(shù)據(jù)科學(xué)家感到困惑。我的建議是研究你現(xiàn)在的組織中使用的算法。這使你的目光聚焦在你們的數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要的東西上。之前我們提到過組織內(nèi)部轉(zhuǎn)型,還記得嗎?這是一個(gè)很好向已有的數(shù)據(jù)科學(xué)團(tuán)隊(duì)展示你的價(jià)值的方法。

我不知道從哪里找到小組或加入哪里組織?由于數(shù)據(jù)科學(xué)的蓬勃發(fā)展,有很多相關(guān)會(huì)議。如果你無法在你所在的城市找到,那你可以自己主辦一次。我看到過很多人主動(dòng)在Linkedin和meetup.com上發(fā)布聚會(huì)詳細(xì)信息,并要求加入他們的社交網(wǎng)絡(luò)。你會(huì)對(duì)出現(xiàn)的人感到驚訝。

第十一步:在你的組織中專注地向數(shù)據(jù)科學(xué)角色過渡

 

 

雖然并沒有簡(jiǎn)單的方法過渡到數(shù)據(jù)科學(xué),但還是有確定的、常有人走的路徑。其中之一是從你現(xiàn)在的組織中切換到數(shù)據(jù)科學(xué)團(tuán)隊(duì)。讓我解釋一下為什么你該關(guān)注這種方式而不是其他路徑(至少對(duì)于初學(xué)者來說):

♦ 你已經(jīng)知道該領(lǐng)域是如何運(yùn)作的。面對(duì)數(shù)據(jù)集中的某些變量,你非常擅長處理它們,因?yàn)槟憔哂兴璧臉I(yè)務(wù)知識(shí)。

♦ 你的領(lǐng)導(dǎo)和團(tuán)隊(duì)經(jīng)理已經(jīng)熟悉你的表現(xiàn)和職業(yè)道德。他們知道你帶來了什么——信任是任何一個(gè)團(tuán)隊(duì)中的重要因素,尤其是數(shù)據(jù)科學(xué)團(tuán)隊(duì)。這將對(duì)你有利。

♦ 無需花時(shí)間在組織外尋找工作機(jī)會(huì)。每個(gè)人都恐懼在招聘門戶上看著時(shí)間溜走而無法指望能找到一份體面的工作。

♦ 這可能不適用于所有人,但當(dāng)你切換組織時(shí),你可能無法指望大幅的工資增長。記住,你是要過渡到你經(jīng)驗(yàn)有限的部門。

♦ 你只要記住這一點(diǎn),總是在你現(xiàn)在的公司中尋找機(jī)會(huì)。與高層或數(shù)據(jù)科學(xué)團(tuán)隊(duì)交談。建立你的社交網(wǎng)絡(luò),相信我,它最終會(huì)有回報(bào)的。

面臨的挑戰(zhàn)和解決方案:

無法在目前的組織中找到機(jī)會(huì):如果這種情況發(fā)生了,你應(yīng)該撒一張大網(wǎng)。正如我們前面步驟中討論的,你的Linkedin網(wǎng)絡(luò)和數(shù)據(jù)科學(xué)社區(qū)將派上用場(chǎng)。不要堅(jiān)持用在線求職門戶被動(dòng)求職——通過Lindedin和其它專業(yè)網(wǎng)絡(luò)聯(lián)系招聘經(jīng)理。線上展示你的項(xiàng)目。別放棄!這將考驗(yàn)?zāi)愕哪托模谝淮蔚耐黄浦档媚闼冻龅乃信Α?/p>

結(jié)束語

這是一段令人興奮的旅程。我已經(jīng)在幾年前經(jīng)歷過了這樣的過渡。我看到這個(gè)領(lǐng)域隨著時(shí)間推移而發(fā)展,本文的目的是幫助你實(shí)現(xiàn)轉(zhuǎn)變。你目前已經(jīng)完成了很多其它向數(shù)據(jù)科學(xué)過渡的人沒有完成的步驟。記住這一點(diǎn)。

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:16個(gè)用于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的頂級(jí)平臺(tái)

下一篇:像數(shù)據(jù)科學(xué)家一樣思考:12步指南(下)