中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

GitHub 2018 機器學(xué)習&數(shù)據(jù)科學(xué)年度官方報告

2019-01-30    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

近日,GitHub 發(fā)布了 2018 年度機器學(xué)習和數(shù)據(jù)科學(xué)具體報告。報告顯示,Python 是機器學(xué)習 repo 中最常用的語言,Numpy 是最流行的機器學(xué)習&數(shù)據(jù)科學(xué)包,最受歡迎項目的桂冠則毫無懸念地由 TensorFlow 摘取。

在 GitHub 的 2018 年度報告中,機器學(xué)習和數(shù)據(jù)科學(xué)是 GitHub 上的熱門話題。TensorFlow是貢獻者最多的項目之一,PyTorch 是增長最快的項目之一,Python 是 GitHub 上第三流行的語言。

為了深入研究 GitHub 上的機器學(xué)習和數(shù)據(jù)科學(xué)現(xiàn)狀,GitHub 發(fā)布了關(guān)于二者的具體報告,統(tǒng)計了 2018 年 1 月 1 日到 12 月 31 日的貢獻數(shù)據(jù),包括 push 代碼、打開 issue 或 pull request、評論 issue 等。至于最流行的包,GitHub 使用了來自依賴圖的數(shù)據(jù),包括所有開放 repo 和依賴圖中現(xiàn)有的私有 repo。

編程語言

 

 

GitHub 查看了「machine-learning」相關(guān) repo 的貢獻者,對這些 repo 最常用的語言進行了排序。Python 是機器學(xué)習 repo 中最常用的語言,也是 GitHub 平臺上第三流行的語言。但是,并非所有機器學(xué)習 repo 都使用 Python:GitHub 上的一些常用語言也是機器學(xué)習項目的常用語言。C++、JavaScript、Java、C#、Shell 和 TypeScript 都在 GitHub 常用語言前十名中,同時也是機器學(xué)習項目常用語言前十名。Julia、R 和 Scala 僅為機器學(xué)習項目前十,但在 GitHub 平臺的使用率并沒有那么高。Julia 和 R 是數(shù)據(jù)科學(xué)家常用的語言,Scala 在和大數(shù)據(jù)系統(tǒng)(如 Apache Spark)互動時的使用率逐漸提高。

流行的機器學(xué)習和數(shù)據(jù)科學(xué)包

 

 

GitHub 從依賴圖中抓取數(shù)據(jù),計算機器學(xué)習或數(shù)據(jù)科學(xué)項目導(dǎo)入不同流行 Python 包的比例。上述列表展示了這些項目導(dǎo)入包的 top 10。從中,我們可以看到:

支持在多維數(shù)據(jù)上的數(shù)學(xué)運算的 Numpy 包是最常導(dǎo)入的包,幾乎 1/3 的機器學(xué)習和數(shù)據(jù)科學(xué)項目使用了 Numpy 包。

用于科學(xué)計算的 Scipy 包、用于管理數(shù)據(jù)集的 pandas、可視化庫 matplotlib 在機器學(xué)習和數(shù)據(jù)科學(xué)項目中的使用率均超過 40%。

Scikit-learn 是流行的機器學(xué)習包,包含大量機器學(xué)習算法的實現(xiàn),幾乎 40% 的機器學(xué)習和數(shù)據(jù)科學(xué)項目使用該包。

接近 1/4 的機器學(xué)習和數(shù)據(jù)科學(xué)項目使用用于處理神經(jīng)網(wǎng)絡(luò)的 tensorflow 包。

前十名中的其余各包是實用程序包:six 是 Python 2 和 3 兼容庫,python-dateutil 和 pytz 是處理日期的包。

最受歡迎的機器學(xué)習項目

 

 

GitHub 還查看了 2018 年「機器學(xué)習」標簽下貢獻者最多的開源項目。tensorflow 是目前最受歡迎的項目,貢獻者人數(shù)是第二名 scikit-learn 的 5 倍。前十名中的 explosion/spaCy 和 RasaHQ/rasa_nlu 項目聚焦于自然語言處理問題,CMU-Perceptual-Computing-Lab/openpose、thtrieu/darkflow、ageitgey/face_recognition 和 tesseract-ocr/tesseract 聚焦于圖像處理問題。Julia 語言源代碼也是 2018 年貢獻者最多的項目之一。

原文鏈接:https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning/

標簽: 大數(shù)據(jù) 大數(shù)據(jù)系統(tǒng) 代碼 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:2019年深度學(xué)習的十大預(yù)測

下一篇:一文看懂機器學(xué)習3種類型的概念、根本差別及應(yīng)用