中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

21個(gè)必知的機(jī)器學(xué)習(xí)開(kāi)源工具,涵蓋5大領(lǐng)域

2020-12-04    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

本文將介紹21個(gè)你可能沒(méi)使用過(guò)的機(jī)器學(xué)習(xí)開(kāi)源工具。

每個(gè)開(kāi)源工具都為數(shù)據(jù)科學(xué)家處理數(shù)據(jù)庫(kù)提供了不同角度。

本文將重點(diǎn)介紹五種機(jī)器學(xué)習(xí)的工具——面向非程序員的工具(Ludwig、Orange、KNIME)、模型部署(CoreML、Tensorflow.js)、大數(shù)據(jù)(Hadoop、Spark)、計(jì)算機(jī)視覺(jué)(SimpleCV)、NLP(StanfordNLP)、音頻和強(qiáng)化學(xué)習(xí)(OpenAI Gym)。

 

 

你肯定已經(jīng)知道一些知名的開(kāi)源工具,如R、Python、Jupyter筆記本等。但除此之外,還有一個(gè)世界——一個(gè)在雷達(dá)下機(jī)器學(xué)習(xí)工具存在的世界。它們雖沒(méi)有那些知名的開(kāi)源工具出色,但卻可以幫助用戶解決許多機(jī)器學(xué)習(xí)的任務(wù)。

開(kāi)源機(jī)器學(xué)習(xí)工具可分為以下5類:

1. 面向非程序員的開(kāi)源機(jī)器學(xué)習(xí)工具

對(duì)于沒(méi)有編程背景和技術(shù)背景的人來(lái)說(shuō),機(jī)器學(xué)習(xí)似乎很復(fù)雜。這是一個(gè)廣闊的領(lǐng)域,可以想象,初次接觸機(jī)器學(xué)習(xí)有多令人害怕。一個(gè)沒(méi)有編程經(jīng)驗(yàn)的人能在機(jī)器學(xué)習(xí)領(lǐng)域獲得成功嗎?

事實(shí)證明,能獲得成功!以下三種工具可以幫助非程序員跨越技術(shù)鴻溝,進(jìn)入聲名鵲起的機(jī)器學(xué)習(xí)世界:

· Uber Ludwig:Uber’s Ludwig是一個(gè)建立在TensorFlow上的工具箱。Ludwig允許用戶訓(xùn)練和測(cè)試深度學(xué)習(xí)模型,而不需要編寫(xiě)代碼。用戶需要提供的只是一個(gè)包含數(shù)據(jù)的CSV文件,一個(gè)用作輸入的列表,以及一個(gè)用作輸出的列表——而剩下工作將由Ludwig來(lái)完成。它對(duì)實(shí)驗(yàn)非常有用,因?yàn)橛脩糁恍韬馁M(fèi)很少的時(shí)間和精力,就能構(gòu)建復(fù)雜的模型。并且用戶可以對(duì)其進(jìn)行調(diào)整和處理之后再?zèng)Q定是否要將其運(yùn)用在代碼中。

· KNIME:KNIME可供用戶使用拖放界面創(chuàng)建整個(gè)數(shù)據(jù)科學(xué)工作流。用戶可以基本實(shí)現(xiàn)從功能工程到功能選擇的所有功能,甚至可以通過(guò)這種方式將預(yù)測(cè)機(jī)器學(xué)習(xí)模型納入工作流程中。這種可視化執(zhí)行整個(gè)模型工作流的方法非常直觀,并且在處理復(fù)雜的問(wèn)題時(shí)非常有用。

 

 

· Orange:用戶不必知道如何編寫(xiě)代碼以使用orange來(lái)挖掘數(shù)據(jù)、處理數(shù)字以及由此得出自己的見(jiàn)解。相反,用戶可執(zhí)行基本可視化、數(shù)據(jù)操作、轉(zhuǎn)換和數(shù)據(jù)挖掘等任務(wù)。由于Orange的易用性及其添加多個(gè)附加組件以補(bǔ)充其功能的能力,該工具最近在學(xué)生和教師中十分流行。

還有許多更有趣、免費(fèi)的開(kāi)源軟件可以提供很好的機(jī)器學(xué)習(xí)功能,而無(wú)需編寫(xiě)(大量)代碼。

此外,一些付費(fèi)服務(wù)也可以考慮,如Google AutoML、 Azure Studio、 Deep Cognition和 Data Robot.

2. 旨在部署模型的開(kāi)源機(jī)器學(xué)習(xí)工具

部署機(jī)器學(xué)習(xí)模型是一個(gè)十分重要但最容易被忽視的任務(wù),用戶應(yīng)該加以注意。它肯定會(huì)出現(xiàn)在面試中,所以用戶需很好地了解這個(gè)話題。

以下四種工具可以使用戶更易將其項(xiàng)目運(yùn)用到現(xiàn)實(shí)設(shè)備上。

· MLFlow: MLFlow旨在與機(jī)器學(xué)習(xí)庫(kù)或算法配合使用,并管理包括實(shí)驗(yàn)、再驗(yàn)和機(jī)器學(xué)習(xí)模型部署在內(nèi)的整個(gè)生命周期。目前,MLFlow在Alpha中有3個(gè)部分——跟蹤、項(xiàng)目和模型。

 

 

· Apple’s CoreML: CoreMLl是一個(gè)十分受歡迎的工具,它可將機(jī)器學(xué)習(xí)模型內(nèi)置到用戶的iOS/Apple Watch/Apple TV/MacOS的應(yīng)用程序中。CoreML的閃光點(diǎn)在于用戶無(wú)需對(duì)神經(jīng)網(wǎng)絡(luò)或機(jī)器學(xué)習(xí)有廣泛的了解,最終達(dá)到雙贏的結(jié)果!

 

 

· TensorFlow Lite: TensorFlow Lite是一套幫助開(kāi)發(fā)人員在移動(dòng)設(shè)備(Android和iOS)和物聯(lián)網(wǎng)設(shè)備上運(yùn)行TensorFlow模型的工具,旨在方便開(kāi)發(fā)人員在網(wǎng)絡(luò)“邊緣”的設(shè)備上進(jìn)行機(jī)器學(xué)習(xí),而不是從服務(wù)器來(lái)回發(fā)送數(shù)據(jù)。

· TensorFlow.js :TensorFlow.js是用戶在網(wǎng)上部署機(jī)器學(xué)習(xí)模型的首選。這是一個(gè)開(kāi)放源碼庫(kù),供用戶在瀏覽器中構(gòu)建和處理機(jī)器學(xué)習(xí)模型。它可為GPU加速,還自動(dòng)支持WebGL。用戶可以導(dǎo)入現(xiàn)有的預(yù)培訓(xùn)模型,也可以在瀏覽器上重新處理整個(gè)現(xiàn)有機(jī)器學(xué)習(xí)模型!

 

 

3. 大數(shù)據(jù)開(kāi)源機(jī)器學(xué)習(xí)工具

大數(shù)據(jù)是一個(gè)研究如何進(jìn)行分析、如何系統(tǒng)地從數(shù)據(jù)集中提取信息或以其他方式處理傳統(tǒng)數(shù)據(jù)處理軟件無(wú)法處理的太大或太復(fù)雜的數(shù)據(jù)集的領(lǐng)域。想象一下,每天處理數(shù)百萬(wàn)條推特進(jìn)行情緒分析。這感覺(jué)像是一項(xiàng)艱巨的任務(wù),不是嗎?

放寬心!以下三種工具可以幫助用戶處理大數(shù)據(jù)。

· Hadoop: Hadoop是處理大數(shù)據(jù)最杰出也是最相關(guān)的工具之一。Hadoop允許用戶使用簡(jiǎn)單的編程模型在計(jì)算機(jī)集群之間對(duì)大型數(shù)據(jù)集進(jìn)行分布式處理。它旨在對(duì)單個(gè)服務(wù)器到數(shù)千臺(tái)機(jī)器,每臺(tái)機(jī)器都提供本地計(jì)算和存儲(chǔ)。

 

 

· Spark: Apache spark被認(rèn)為在大數(shù)據(jù)應(yīng)用程序方面是Hadoop的進(jìn)階版。Apache spark的關(guān)鍵在于填補(bǔ)了Apache Hadoop在數(shù)據(jù)處理方面的空白。有趣的是,Spark可以同時(shí)處理批量數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。

· Neo4j: 在處理大數(shù)據(jù)相關(guān)問(wèn)題方面,Hadoop可能不是絕佳的選擇。例如,用戶需要處理大量的網(wǎng)絡(luò)數(shù)據(jù)或圖形相關(guān)問(wèn)題(如社交網(wǎng)絡(luò)或人口統(tǒng)計(jì)模式等)時(shí)。而圖形數(shù)據(jù)庫(kù)(Neo4j)則是最佳選擇。

 

 

4. 用于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和音頻的開(kāi)源機(jī)器學(xué)習(xí)工具

· SimpleCV: 參與任何計(jì)算機(jī)視覺(jué)項(xiàng)目都必須使用OpenCV。但你有沒(méi)有考慮過(guò)SimpleCV?SimpleCV可供用戶訪問(wèn)幾個(gè)高性能的計(jì)算機(jī)視覺(jué)庫(kù),如OpenCV——而不必首先了解位深度、文件格式、顏色空間、緩沖區(qū)管理、特征值以及矩陣與位圖存儲(chǔ)。計(jì)算機(jī)視覺(jué)讓項(xiàng)目變得更容易上手。

 

 

· Tesseract OCR: 你是否曾使用過(guò)一些有創(chuàng)意的應(yīng)用程序,可以使用智能手機(jī)的攝像頭掃描文件或購(gòu)物賬單,或者只需拍張支票就可以將錢存入銀行賬戶?所有這些應(yīng)用程序使用的都是OCR,即光學(xué)字符識(shí)別軟件。Tesseract就是這樣的OCR引擎,可以識(shí)別100多種語(yǔ)言,也可以加以訓(xùn)練識(shí)別其他語(yǔ)言。

· Detectron: Detectron是Facebook旗下人工智能研究公司的軟件系統(tǒng),它采用了包括Mask R-CNN在內(nèi)最先進(jìn)的目標(biāo)檢測(cè)算法。Detectron由Python語(yǔ)言編寫(xiě)完成,由Caffe2深度學(xué)習(xí)框架提供支持。

 

 

· StanfordNLP: StanfordNLP是Python的自然語(yǔ)言分析包。它的閃光點(diǎn)在于其支持70多種人類語(yǔ)言!StanfordNLP還包含可以在以下程序步驟中使用的工具:

—將包含人類語(yǔ)言文本的字符串轉(zhuǎn)換為句子和單詞列表

—生成單詞的基本形式、詞類和形態(tài)特征

—邏輯句法結(jié)構(gòu)依賴分析

 

 

· BERT as a Service: 所有的自然語(yǔ)言處理愛(ài)好者都應(yīng)該聽(tīng)說(shuō)過(guò)谷歌的開(kāi)創(chuàng)性自然語(yǔ)言處理架構(gòu)——BERT,但可能還沒(méi)有用過(guò)。Bert-as-a-service將BERT作為句子編碼器,并通過(guò)ZeroMQ將其作為服務(wù)器,從而使用戶能夠僅用兩行代碼將句子映射為固定長(zhǎng)度的表示形式。

· Google Magenta: Google Magenta提供了處理源數(shù)據(jù)(主要是音樂(lè)和圖像)的實(shí)用程序,該數(shù)據(jù)庫(kù)使用這些源數(shù)據(jù)處理機(jī)器學(xué)習(xí)模型,并最終從這些模型中生成新內(nèi)容。

· LibROSA: LibROSA是用于音樂(lè)和音頻分析的Python語(yǔ)言包。它提供了構(gòu)建音樂(lè)信息檢索系統(tǒng)所必需的構(gòu)建塊。當(dāng)用戶在處理諸如語(yǔ)音到文本深度學(xué)習(xí)等的應(yīng)用時(shí), LibROSA廣泛應(yīng)用于在音頻信號(hào)預(yù)處理程序環(huán)節(jié)。

5. 旨在進(jìn)行強(qiáng)化學(xué)習(xí)的開(kāi)源工具

強(qiáng)化學(xué)習(xí)(RL) 是機(jī)器學(xué)習(xí)的新話題,其目標(biāo)是培養(yǎng)能夠與環(huán)境互動(dòng)并解決復(fù)雜任務(wù)的智能經(jīng)紀(jì)人,實(shí)現(xiàn)機(jī)器人、自動(dòng)駕駛汽車等的實(shí)際應(yīng)用。

強(qiáng)化學(xué)習(xí)領(lǐng)域的快速發(fā)展得益于讓智能經(jīng)紀(jì)人玩一些游戲,如經(jīng)典的Atari console games、傳統(tǒng)的圍棋游戲,或者讓智能經(jīng)紀(jì)人玩電子游戲,如Dota 2 或 Starcraft 2,所有這些游戲都為智能經(jīng)紀(jì)人提供了具有挑戰(zhàn)性的環(huán)境。在這個(gè)環(huán)境中,新的算法可以安全、可重復(fù)的方式測(cè)試想法。以下列舉了4個(gè)最有利于強(qiáng)化學(xué)習(xí)的培養(yǎng)環(huán)境:

· Google Research Football: Google Research Football Environment是一個(gè)全新的強(qiáng)化學(xué)習(xí)環(huán)境,其中,智能經(jīng)紀(jì)人旨在掌握世界上最流行的足球運(yùn)動(dòng)。這種環(huán)境能讓用戶更好地訓(xùn)練強(qiáng)化學(xué)習(xí)智能經(jīng)紀(jì)人。觀看以下視頻了解更多信息:

· OpenAI Gym: Gym是開(kāi)發(fā)和比較強(qiáng)化學(xué)習(xí)算法的工具包,可支持教學(xué)經(jīng)紀(jì)人從走路到玩乒乓球或彈球之類的游戲。從以下動(dòng)圖中可以看到一個(gè)正在學(xué)習(xí)走路的教學(xué)經(jīng)紀(jì)人。

 

 

· Unity ML Agents: The Unity Machine Learning Agents Toolkit(ML-Agents)是開(kāi)源設(shè)備的插件,使游戲和模擬游戲能為智能經(jīng)紀(jì)人訓(xùn)練提供有效環(huán)境。通過(guò)簡(jiǎn)單易用的Python API,用戶可以使用強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)、神經(jīng)進(jìn)化或其他機(jī)器學(xué)習(xí)方法來(lái)訓(xùn)練智能經(jīng)紀(jì)人。

 

 

· Project Malmo: Malmo平臺(tái)是一個(gè)建立在Minecraft之上的復(fù)雜人工智能實(shí)驗(yàn)平臺(tái),旨在支持人工智能領(lǐng)域的基礎(chǔ)研究,由微軟開(kāi)發(fā)。

當(dāng)用戶進(jìn)行數(shù)據(jù)科學(xué)和人工智能相關(guān)項(xiàng)目時(shí),開(kāi)放源碼是一種可行的方法。本文只是介紹了冰山一角,仍有許多工具可用于處理各種各樣的任務(wù),使數(shù)據(jù)科學(xué)家的項(xiàng)目生活更為簡(jiǎn)便。數(shù)據(jù)科學(xué)家只需知道何處尋找開(kāi)放源碼即可。

標(biāo)簽: 機(jī)器學(xué)習(xí) 數(shù)據(jù) 蒲Ъ

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:想留住人才?先要管理好數(shù)據(jù)科學(xué)團(tuán)隊(duì)

下一篇:PageRank、最小生成樹(shù):ML開(kāi)發(fā)者應(yīng)該了解的五種圖算法