中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何構建一個機器學習項目來找到工作?

2018-12-25    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

如何找到一份機器學習的工作?對于這個問題, SharpestMindsAI 創(chuàng)始人、物理學家和機器學習專家 Edouard Harris 寫了一篇博客。

我是一個在 YC 初創(chuàng)公司工作的物理學家。我們的工作是幫助剛畢業(yè)的學生得到他們的第一份機器學習工作。

前一段時間,我寫了一篇關于如何才能獲得第一份機器學習工作的文章。我在那篇文章中說,有一件你應該做的事是建立個人機器學習項目。但我并沒有說明如何去做這件事,所以在這篇文章里,我會告訴你怎么做。

由于工作原因,我看到過成百上千的個人項目的例子,它們有的非常好,有的很糟糕。下面我將給你講講其中的兩個非常好的項目。

全力以赴地投入項目

下面是一個真實的故事,只是為了保護隱私,我改了名字。

當雜貨店需要更新庫存的時候,X 公司使會用人工智能去提醒它們。我們有一個名叫 Ron 的學生,他真的很想去 X 公司工作。Ron 實在是太想去 X 公司工作了,因此,他投入所有的精力建立了一個個人項目,這個項目讓他得到了 X 公司的面試機會。

像這樣全力以赴地為進入一家公司做準備是一件冒險的事情,我們通常不建議這樣做。但是我在前面說過,Ron 真的非常想去 X 公司工作。

那么 Ron 建立了一個什么樣的個人項目?

 

 

紅色的矩形框表示缺貨

Ron 先把手機綁到購物車上,之后他推著購物車在雜貨店的過道上來回走動,同時用相機把雜貨店的貨架拍攝下來。他在不同的雜貨店做了 10 到 12 次這樣的工作。

Ron 一到家,就開始著手建立機器學習模型。他的模型可以識別出雜貨店貨架上沒有貨物的地方,這些地方的玉米片(或其他東西)被拿走了。

Ron 在 GitHub 上實時構建模型,并完全公開。每天,他都會對自己的模型進行改進來提高它的準確性,并記錄其中的變化。

當注意到 Ron 所做的事情時,X 公司表現(xiàn)出了極大的興趣。事實上,X 公司甚至對此感到緊張。他們?yōu)槭裁磿o張?因為 Ron 不知不覺地在幾天內(nèi)重構了他們的專有的技術棧的一部分。

X 公司實力強勁,他們的技術在同行業(yè)中首屈一指。盡管如此,在 4 天之內(nèi),Ron 的項目已經(jīng)引起了 X 公司 CEO 的注意。

試驗項目

這是另一個真實的故事。

Alex 是歷史系的學生,同時他輔修了俄語研究。不同于其他歷史專業(yè)的學生,他對機器學習特別感興趣。更不尋常的是,盡管從未寫過一行 Python 代碼,他決定去學習機器學習。

Alex 選擇通過實踐來學習。他決定建立一個分類器來檢測飛機上的飛行員是否失去意識。Alex 想通過觀看飛行員的視頻來探索這個問題。人們很容易通過觀察就能判斷一個飛行員是否失去意識,所以 Alex 認為機器也有可能做到這一點。

以下是 Alex 花了幾個月做的事情:

 

 

Alex 的意識喪失感應探測器模型 G-force

Alex 在 YouTube 上下載了從駕駛艙里拍攝的飛行員駕駛飛機的每個視頻片段。

接下來,他開始標記數(shù)據(jù)。Alex 創(chuàng)建了一個 UI,他可以在上面滾動觀看數(shù)千個視頻片段,這個 UI 上有兩個按鈕,按其中一個按鈕顯示「有意識」,按另一個按鈕顯示「無意識」。按下按鈕后,當前視頻片段會被自動保存在正確標記的文件夾中。這個過程非常無聊,花了他很多很多天的時間。

Alex 為這些圖像建立了一條數(shù)據(jù)管道,可以將飛行員從駕駛艙的背景中裁剪出來,以便使他的分類器更容易地將注意力集中在飛行員身上。最后,他建立了他的意識喪失分類器。

在做這些工作的同時,Alex 也在社交活動中向招聘經(jīng)理展示他項目的照片。每次當他拿出手機展示他的項目時間,他們問會他是怎么做到這些的,關于他如何建造管道,以及他如何收集數(shù)據(jù)。但是他們從來沒有抽出時間去問過他的模型的精確度--低于 50%。

Alex 當然打算提高他的準確性,但是在做這個事情之前他就被錄用了。事實證明,他的項目所帶來的視覺沖擊,以及他在數(shù)據(jù)收集方面不屈不撓、足智多謀的特質,對公司來說比他的模型實際有多好更重要。

我提過 Alex 是主修歷史輔修俄語研究嗎?

他們有什么共同點?

是什么讓 Ron 和 Alex 如此成功?因為他們做到了下面四點:

Ron 和 Alex 沒有花太多精力去建模。我知道這聽起來很奇怪,但是對于現(xiàn)在許多用例來說,建模是一個已經(jīng)解決的問題。在真正的工作中,除非你做的是最先進的人工智能研究,否則無論如何,你將花費 80-90% 的時間來清理數(shù)據(jù)。是什么讓你的個人項目與眾不同?

Ron和Alex收集了他們自己的數(shù)據(jù)。正因為如此,它們最終得到的數(shù)據(jù)比 Kaggle 或 UCI 數(shù)據(jù)庫中的數(shù)據(jù)更混亂。但是這些混亂的數(shù)據(jù)教會了他們?nèi)绾翁幚砘靵y數(shù)據(jù)。相比從學術服務器下載數(shù)據(jù),這種方式讓他們更好地理解了他們的數(shù)據(jù)。

Ron 和 Alex 創(chuàng)造了可以被看到的東西。面試不是讓你的技能被一個通曉一切的面試官客觀地評估,而是一個向別人推銷自己的過程。人類是視覺動物。所以,拿出你的手機,向面試官展示你所做的一切吧,確保你所做的看起來很有趣是值得的。

Ron 和 Alex 的所作所為看起來很瘋狂,實際上也很瘋狂。一般人不會把手機綁在購物車上。普通人不會花時間從 YouTube 視頻中裁剪飛行員,你知道誰會干這種事情嗎?想盡所有辦法都要達到目標的人。而公司真的很想雇傭這些人。

Ron 和 Alex 看起來似乎做了太多的工作,但實際上,這并不比你在一份真正的工作中所需要做的事情多。這就是最關鍵的一點:當你沒有做 X 的工作經(jīng)驗時,招聘經(jīng)理會從你做過的事情中尋找那些和 X 相關的事情。

幸運的是,你只需要構建一兩個項目---Ron 和 Alex 的項目在他們所有的面試中被反復使用。

因此,如果要我用一句話概括一個偉大的機器學習項目的秘密,那就是:構建一個帶有一個有趣的數(shù)據(jù)集的項目,這個數(shù)據(jù)集必須是花費了顯而易見的努力收集來的,并使這個項目盡可能給人以深刻的視覺印象。

標簽: 代碼 服務器 數(shù)據(jù)庫

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:民科危險!公民數(shù)據(jù)科學家也一樣

下一篇:數(shù)據(jù)科學和機器學習面試問題集錦