中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

2018年最流行的深度學(xué)習(xí)框架?這份科學(xué)的排行榜可以告訴你

2018-09-27    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

深度學(xué)習(xí)仍然是機(jī)器學(xué)習(xí)領(lǐng)域最熱門的技術(shù)。深度學(xué)習(xí)框架變化迅速,僅僅五年前 Theano 還一枝獨秀,而最近出現(xiàn)了各種各樣的框架,它們都有不同的特性。在本文中,為了評估 2018 到底哪些框架比較流行,作者從領(lǐng)英職位需求、谷歌搜索熱度、Medium 文章數(shù)、arXiv 論文數(shù)和 GitHub 活躍度等方面審視不同的框架。

我想尋找值得關(guān)注的框架,于是就開發(fā)了這個排行榜。Python 語言是深度學(xué)習(xí)使用的熱門語言,因此我主要關(guān)注能兼容 Python 的框架。我使用了來自 7 個不同類別的 11 個數(shù)據(jù)源,并用來評估框架使用、用戶興趣和流行度。

數(shù)據(jù)地址:https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

 

 

2018.09 by Jeff Hale顯然,TensorFlow 是絕對贏家,還有一些令人驚訝的發(fā)現(xiàn)。我們一起來看一下~

角逐者

我們考慮的這些框架都已經(jīng)開源,它們主要都使用 Python,一些可以兼容 R 或其他語言。

 

 

TensorFlow 是絕對冠軍。在 GitHub 活躍度、谷歌搜索、Medium 文章數(shù)、亞馬遜書籍和 arXiv 論文這些數(shù)據(jù)源上,它所占的比重都是最大的。它還擁有最多的開發(fā)者用戶,以及出現(xiàn)在最多的在線職位描述中。

 

 

Keras 具備「一個為人類而非機(jī)器設(shè)計的 API」。它在幾乎所有評估中都是第二流行的框架。Keras 的后端可以基于 TensorFlow、Theano 或 NLTK。如果你是剛?cè)腴T深度學(xué)習(xí)的新手,使用 Keras 是不錯的選擇。

 

 

PyTorch 是第三流行的框架,也是第二流行的獨立框架。它比 TensorFlow 出現(xiàn)時間晚,但發(fā)展迅速。PyTorch 允許定制化,而 TensorFlow 不能。PyTorch 是由 Facebook 支持開發(fā)的。

 

 

Theano 由蒙特利爾大學(xué)于 2007 年開發(fā),是最老的 Python 深度學(xué)習(xí)框架,F(xiàn)在它的流行度下降了很多,其開發(fā)者和維護(hù)者宣布將停止更新維護(hù) Theano。不過,Theano 仍然頻繁出現(xiàn)在職位描述中。

 

 

MXNet 由 Apache 孵化。它和 Theano 的得分很接近,目前處于第四流行的深度學(xué)習(xí)庫。它擁有大量貢獻(xiàn)者、搜索結(jié)果、相關(guān)書籍和學(xué)術(shù)文章。但是它的使用率比去年有所下降,搜索它的用戶也不是很多。

 

 

CNTK 是微軟推出的認(rèn)知工具包。它的推出旨在與谷歌、Facebook 競爭,但并沒有獲得特別多的使用。

FastAI 基于 PyTorch 構(gòu)建。其 api 受到 Keras 的啟發(fā),所需代碼甚至還更少。FastAI 正為今年 10 月的 1.0 版本發(fā)布而經(jīng)歷重寫,F(xiàn)astAI 背后的男人 Jeremy Howard 曾經(jīng)是 Kaggle 比賽冠軍以及 Kaggle 主席。

你可能會問為什么 FastAI 會在這個名單上,職業(yè)開發(fā)者對它沒什么需求,它的使用也不廣泛。但是,它通過免費在線課程平臺 fast.ai 獲得了大批用戶。同時,F(xiàn)astAI 也很強(qiáng)大易用,它的使用率可能會很快增長。

Caffe 不在本名單中,因為它之前更新到 Caffe2,2018 年 3 月 Caffe2 被融合進(jìn) PyTorch。

評估準(zhǔn)則

為了全面地評估深度學(xué)習(xí)框架的流行程度,我選擇以下類別和角度為它們進(jìn)行評分:

在線職位描述
KDnuggets 使用調(diào)查
谷歌搜索熱度
Medium 文章數(shù)量
Amazon 書籍?dāng)?shù)量
arXiv 論文數(shù)
GitHub 活躍度

支持本次評分的數(shù)據(jù)都在今年 9 月 16 號收集完,原數(shù)據(jù)地址為:https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit?usp=sharing

我使用了 plotly 數(shù)據(jù)可視化庫和 Python 的 Pandas 庫來探索并展示各框架的流行度,對于交互性的 plotly 圖表,請看 Kaggle Kernel:https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

在線職位描述

深度學(xué)習(xí)框架在目前的職場中有著什么樣的需求?我搜索了領(lǐng)英的職位描述,具體而言為 Simply Hired、Monste 和 Angel List。

 

 

TensorFlow 在職位描述中明顯要比其它框架出現(xiàn)得更多,所以如果你希望從事深度學(xué)習(xí),最好還是學(xué)習(xí)這個框架。

我搜索職位描述的方法是采用「machine learning」+「框架名」,所以 TensorFlow 就是采用「machine learning TensorFlow」來搜索的。我其實還采用了其它搜索方法,但還是這種搜索方法給出的結(jié)果更好。此外,額外的關(guān)鍵詞對于區(qū)分不同框架而言是非常有必要的,因為我最初還嘗試在這個分析中加入 Caffe 庫。

使用情況

KDnuggets 是一個流行的數(shù)據(jù)科學(xué)網(wǎng)站,他們調(diào)查了世界各地數(shù)據(jù)科學(xué)家的軟件庫使用情況,他們會向用戶問道:

在過去的 12 個月中,你在實際項目上會使用哪些分析、大數(shù)據(jù)、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具?

以下展示了大家對框架的偏好程度:

 

 

Keras 在使用總量上非常驚人,它幾乎和 TensorFlow 一樣。所以說美國老板對員工的 TensorFlow 技能有壓倒性的需求,而在國際上 Keras 使用的頻率同樣也非常高。

僅有這一個類別是包含國際數(shù)據(jù)的,因為其他類別加入國際數(shù)據(jù)可能會非常麻煩。KDnuggets 做這一份報告已經(jīng)好幾年了,我在這個分析中只用了今年的數(shù)據(jù),但我們需要注意 Theano、MXNET 和 CNTK 相比于去年在使用上有所滑落。

谷歌搜索熱度

在最大的搜索引擎上度量各框架的搜索熱度,這也是一個非常好的流行度衡量方法。我們在 Google Trends 中搜索過去幾年的搜索熱度歷史,雖然它并不提供具體的搜索數(shù)值,但還是能提供相對圖表。

 

 

截至 2018 年 9 月 15 日,TensorFlow 平穩(wěn)占據(jù) 78% 的搜索比重。PyTorch 接近 Keras,而其它框架的搜索量在 3 左右或低于 3。

下面我們來簡要看一下搜索量隨著時間的變化,以了解更多歷史背景。下面的表格展示了近兩年的谷歌搜索情況。

 

 

TensorFlow 藍(lán)色、Keras 紅色、PyTorch 黃色、Theano 綠色。TensorFlow、Keras 和 PyTorch 的搜索量在 2016 年末和 2017 年增長迅速。有趣的是,它們在最近幾個月增長緩慢。我們可以從中看到某種季節(jié)性,暑假下降寒假上升。

谷歌搜索趨勢只允許同時對比五項,因此其它庫在另外一個表上進(jìn)行對比。所有這些結(jié)果都是在美國區(qū)域的搜索結(jié)果。盡管搜索關(guān)鍵詞 Theano 和 Keras 還有其它意思,但那些意思主要是在美國以外使用。

Medium 文章數(shù)

我計算了多個出版物類型,出現(xiàn)較早的框架在出版方面比較有優(yōu)勢,未來排行榜將關(guān)注出版物數(shù)量的變化。下面來看 Medium 文章。

 

 

這次出現(xiàn)了新的冠軍。從 Medium 文章提及量來看,Keras 超越 TensorFlow,但也算勢均力敵。FastAI 的表現(xiàn)也超出以往。我猜測出現(xiàn)上述結(jié)果的原因是 Keras 和 FastAI 對新手比較友好。深度學(xué)習(xí)新人對它們有很大興趣,而 Medium 是一個教程論壇。

下面我們來看哪些框架在亞馬遜上的實體書比較多。

亞馬遜書籍

我在亞馬遜 Books->Computer Science 分類下搜索了每個深度學(xué)習(xí)框架,結(jié)果如下:

 

 

TensorFlow 又一次奪得冠軍。MXNET 相關(guān)書籍的數(shù)量超出預(yù)期,且多于 Theano。PyTorch 的書相對較少,但這有可能是因為該框架還比較年輕。該評估標(biāo)準(zhǔn)對年頭久的庫較為有利,因為出版書籍需要時間。

或許 Theano 在學(xué)術(shù)論文方面會比較好吧。

arXiv 論文

arXiv 是在線數(shù)據(jù)庫,大部分機(jī)器學(xué)習(xí)學(xué)術(shù)論文都會發(fā)表在 arXiv 上。我在該網(wǎng)站上搜索了每個框架,結(jié)果如下:

 

 

同樣,TensorFlow 的學(xué)術(shù)論文較多。最大的意外是其它框架的學(xué)術(shù)論文總數(shù)不敵 TensorFlow。注意 Keras 在 Medium 和亞馬遜上的流行度比學(xué)術(shù)論文要高得多。PyTorch 在這塊表現(xiàn)也不好,應(yīng)該還是因為出現(xiàn)時間較短的緣故。

GitHub 活躍度

GitHub 活躍度是框架流行度的另一個指標(biāo)。我分別調(diào)查了 star、fork、watcher 和貢獻(xiàn)者數(shù)量,因為它們單獨的意義要比整體的組合的意義更大。

 

 

很明顯,TensorFlow 是 GitHub 上最流行的框架,擁有大量活躍用戶。FastAI 還不錯,畢竟才誕生一年。有趣的是各個框架的貢獻(xiàn)者數(shù)量要比其它三個指標(biāo)接近得多。

收集和分析這些數(shù)據(jù)之后,是時候總結(jié)一下了。

計算排行榜分?jǐn)?shù)步驟

我用以下步驟創(chuàng)建排行榜得分:

將所有特征縮放到區(qū)間 [0,1] 之間。

聚合職位描述和 GitHub 活躍度這兩個子類別。

根據(jù)下圖中的權(quán)重對類別進(jìn)行加權(quán)。

 

 

如上圖所示,在線職位描述和 KDnuggets 使用調(diào)查組成了分?jǐn)?shù)的一半,而網(wǎng)頁搜索、出版物和 GitHub 關(guān)注度組成了另一半。這種分割應(yīng)該是對不同類別最合適的平衡。

4. 為了方便理解,將加權(quán)后的得分乘 100。

5. 將每個框架的各類別得分相加,整合成最終的排行榜得分。

 

 

Google Sheet 地址:https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit#gid=0

下圖是對子類別進(jìn)行加權(quán)相加之后的得分。

 

 

Jupyter Notebook 地址:https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

下圖再次展示了最終的排行榜得分。

 

 

2018.09 by Jeff Hale100 是最高分,在每一類中代表第一名。TensorFlow 得分接近 100,這也不足為奇,因為這一框架幾乎包攬了所有類別的第一名。點擊以下鏈接獲取圖中未顯示信息:https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

展望

TensorFlow 現(xiàn)在獨占鰲頭,這種局勢短期內(nèi)似乎不會改變。然而,考慮到深度學(xué)習(xí)世界中事物的發(fā)展速度,TensorFlow 被趕超也不是不可能。

時間會證明 PyTorch 是否會超越 TensorFlow,就像 React 超越 Angular 一樣。PyTorch 和 React 都是 Facebook 支持的靈活框架,用戶通常認(rèn)為這兩個框架比谷歌的同類框架易用。

FastAI 能吸引課程之外的用戶嗎?它有大量的學(xué)生,使用 API 比 Keras 更容易。

給學(xué)習(xí)者的建議

如果你正考慮學(xué)習(xí)其中一種框架且具備 Python、numpy、pandas、sklearn 和 matplotlib 的技能,我建議你從 Keras 入手。該框架用戶基礎(chǔ)很大,在求職時非常有用,Medium 上有很多相關(guān)文章,API 也很易用。

如果你已經(jīng)學(xué)過 Keras,那么選擇下一個要學(xué)習(xí)的框架可能有點困難。我建議你去學(xué) TensorFlow 或 PyTorch,而且要好好學(xué),這樣才能做出良好的深度學(xué)習(xí)模型。

TensorFlow 顯然是為迎合需求而學(xué)習(xí)的框架,但 PyTorch 的易用性和靈活性使得它使用起來更加友好。

一旦掌握了這些框架,我建議你留意 FastAI。如果想同時學(xué)習(xí)基礎(chǔ)和高級深度學(xué)習(xí)技能,請查看 FastAI 的免費在線課程,F(xiàn)astAI 1.0 承諾幫助用戶輕松實施最新的深度學(xué)習(xí)策略并快速迭代。

無論你選擇了哪個框架,我希望你現(xiàn)在深入了解一下哪個框架需求量最大、使用最頻繁、最受關(guān)注。

原文鏈接:https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

標(biāo)簽: Google 大數(shù)據(jù) 代碼 谷歌 開發(fā)者 數(shù)據(jù)庫 搜索 搜索引擎

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:李開復(fù)紐約時報專欄:美國對中國AI的幾大誤解

下一篇:吳恩達(dá)新書手稿完工,現(xiàn)在開放免費下載 | 資源