中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

用 Python 做機(jī)器學(xué)習(xí)不得不收藏的重要庫(kù)

2019-01-10    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

  

 

Python通常被應(yīng)用統(tǒng)計(jì)技術(shù)或者數(shù)據(jù)分析人員當(dāng)做工作中的首選語言。數(shù)據(jù)科學(xué)家也會(huì)用python作為連接自身工作與WEB 應(yīng)用程序/生產(chǎn)環(huán)境集成中。

Python在機(jī)器學(xué)習(xí)領(lǐng)域非常出色。它具有一致的語法、更短的開發(fā)時(shí)間和靈活性,非常適合開發(fā)能夠直接插入生產(chǎn)系統(tǒng)的復(fù)雜模型和預(yù)測(cè)引擎。

Python的一個(gè)最大的資產(chǎn)是其廣泛的庫(kù)。

庫(kù)是一組用給定語言編寫的程序和功能的集合。一組健壯的庫(kù)可以使開發(fā)人員更容易執(zhí)行復(fù)雜的任務(wù),而無需重寫許多代碼。

機(jī)器學(xué)習(xí)很大程度上是基于數(shù)學(xué)。具體來說就是數(shù)學(xué)優(yōu)化、統(tǒng)計(jì)和概率。Python庫(kù)幫助那些不具備開發(fā)人員知識(shí)的研究人員/數(shù)學(xué)家輕松地“進(jìn)行機(jī)器學(xué)習(xí)”。

以下是機(jī)器學(xué)習(xí)中最常用的一些庫(kù):

Scikit-learn 經(jīng)典的ML算法

 

 

Scikit-learn 是最流行的ML 庫(kù)之一,他支持很多監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)算法。例如:線性回歸,邏輯回歸,決策樹,聚類 ,k-means等。

他基于兩個(gè)python庫(kù):Numpy 和 Scipy 。 他為常見的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘提供了一組算法:聚類,回歸和分類。甚至像數(shù)據(jù)轉(zhuǎn)換,特征選擇,集成學(xué)習(xí)這樣的任務(wù)也可與通過簡(jiǎn)短幾行代碼實(shí)現(xiàn)。

對(duì)于機(jī)器學(xué)習(xí)的新手來說,Scikit-learn 是一個(gè)夠用的工具,直到你自己開始實(shí)現(xiàn)更復(fù)雜的算法。

Tensorflow for Deep Learning 深度學(xué)習(xí)

 

 

如果你在機(jī)器學(xué)習(xí)的世界里,你可能聽過,嘗試過或者實(shí)現(xiàn)過某種形式的深度學(xué)習(xí)的算法。但是他們是必要的嗎?回答可能是不必要。但是完成他們后感覺很酷對(duì)嗎? 回答是:對(duì)的!酷斃了。

Tensorflow 有趣的地方在于,當(dāng)你使用python 編寫代碼,你可以編譯和運(yùn)行在你的CPU 或者GPU 上,而且你不需要寫 c++或者 CUDA 的代碼,就可以運(yùn)行在GPUs 集群上。

他使用一個(gè)多層節(jié)點(diǎn)的系統(tǒng),允許你快速的簡(jiǎn)歷,訓(xùn)練,部署具有大量數(shù)據(jù)集的人工神經(jīng)網(wǎng)絡(luò)。這讓谷歌能夠識(shí)別照片中的物體,通過語音識(shí)別程序理解在口語中的單詞。

Theano is also for Deep Learning

 

 

Theano 是另一個(gè)用于數(shù)值計(jì)算的優(yōu)秀類庫(kù),有點(diǎn)類似于Numpy。Theano 允許你高效的定義,優(yōu)化和評(píng)估涉及多維數(shù)組的數(shù)學(xué)表達(dá)式。

使Theano 與眾不同的是它利用了計(jì)算機(jī)的GPU。這使得它能夠比單獨(dú)在CPU上運(yùn)行時(shí)快100倍進(jìn)行數(shù)據(jù)密集型計(jì)算。Theano的速度使得它對(duì)于深度學(xué)習(xí)和其他復(fù)雜的計(jì)算任務(wù)特別有價(jià)值。

Theano 庫(kù)的最終發(fā)布是在去年——2017年,版本1.0.0包含了許多新特性、界面更改和改進(jìn)。

Pandas 數(shù)據(jù)提取與預(yù)處理

panda是一個(gè)非常流行的庫(kù),它提供了簡(jiǎn)單易用且直觀的高級(jí)數(shù)據(jù)結(jié)構(gòu)。

它有許多內(nèi)建的方法來分組、組合數(shù)據(jù)和過濾以及執(zhí)行時(shí)間序列分析。

panda可以輕松地從SQL數(shù)據(jù)庫(kù)、CSV、Excel、JSON文件等不同來源獲取數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行操作。圖書館有兩個(gè)主要結(jié)構(gòu):

Series“級(jí)數(shù)”---- 一維 。

 

 

Data Frames“數(shù)據(jù)幀”---- 二維。

 

 

如果想得知關(guān)于如何使用序列和數(shù)據(jù)看框架的更多細(xì)節(jié),請(qǐng)查看的我的其他文章。

Matplotlib用于數(shù)據(jù)可視化

 

 

如果你不能很好的與其他人交流,那么最好的,最復(fù)雜的機(jī)器學(xué)習(xí)就顯得沒有意義。

那么如何從這些數(shù)據(jù)中轉(zhuǎn)換出價(jià)值呢?你如何激勵(lì)你的業(yè)務(wù)分析師,告訴他們充滿“洞察力”的“故事”?

這就是Matplotlib發(fā)揮作用的地方。它是每個(gè)數(shù)據(jù)科學(xué)家用于創(chuàng)建2D圖形和圖形的標(biāo)準(zhǔn)Python庫(kù)。它是命令行簡(jiǎn)單,這意味著它需要更多的命令來生成好看的圖形和數(shù)字,而不是使用一些高級(jí)庫(kù)。

然而,這也帶來了靈活性。有了足夠的命令,您可以使用Matplotlib制作任何您想要的圖形。您可以構(gòu)建不同的圖表,從直方圖和散點(diǎn)圖到非笛卡爾坐標(biāo)圖。

它支持所有操作系統(tǒng)上的不同GUI后端,還可以將圖形導(dǎo)出到通用矢量和圖形格式,如PDF、SVG、JPG、PNG、BMP、GIF等。

Seaborn是另一個(gè)數(shù)據(jù)可視化庫(kù)

 

 

Seaborn是一個(gè)流行的可視化庫(kù),它建立在Matplotlib的基礎(chǔ)之上。它是一個(gè)高級(jí)庫(kù),這意味著更容易生成某些類型的圖,包括熱圖、時(shí)間序列和小提琴圖。

最后

這是機(jī)器學(xué)習(xí)中最重要的Python庫(kù)的集合。如果您打算使用Python和數(shù)據(jù)科學(xué),那么這些庫(kù)是值得一看的,同時(shí)也值得您熟悉。

我是否錯(cuò)過了任何重要的Python ML庫(kù)?如果是,請(qǐng)務(wù)必在下面的評(píng)論中提到它。盡管我試圖介紹最有用的庫(kù),但可能仍然沒有介紹其他一些值得研究的庫(kù)。

原標(biāo)題 :Essential libraries for Machine Learning in Python

作者:Shubhi Asthana 翻譯: 就2

原文鏈接:https://medium.freecodecamp.org/essential-libraries-for-machine-learning-in-python-82a9ada57aeb

標(biāo)簽: 代碼 谷歌 數(shù)據(jù)分析 數(shù)據(jù)庫(kù) 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:我們?cè)撊绾蚊鎸?duì)和使用機(jī)器學(xué)習(xí)技術(shù)?

下一篇:強(qiáng)化學(xué)習(xí)時(shí)代正在到來