中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

從全方位為你比較3種數(shù)據(jù)科學(xué)工具的比較:Python、R和SAS(附鏈接)

2019-04-29    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

關(guān)于三種數(shù)據(jù)科學(xué)工具Python、R和SAS,本文從8個(gè)角度進(jìn)行比較分析并在文末提供記分卡,以便你隨時(shí)調(diào)整權(quán)重,快速做出選擇。

簡(jiǎn)介

我們喜歡比較!

從比較三星、蘋果、HTC的智能手機(jī),iOS、Android、Windows的移動(dòng)操作系統(tǒng)到比較即將選舉的選舉候選人,或者選擇世界杯隊(duì)長(zhǎng),比較和討論豐富了我們的生活。如果你喜歡討論,你所要的就是在一個(gè)充滿激情的群體中拋出一個(gè)相關(guān)問題,然后看著它爆炸式地發(fā)展!這個(gè)過程的美妙之處在于,社區(qū)里的每個(gè)人都是一個(gè)知識(shí)淵博的人。

我在這里也引發(fā)類似的討論,比較SAS、R和Python。SAS和R孰好孰壞可能是數(shù)據(jù)科學(xué)領(lǐng)域的最大爭(zhēng)論,而Python是目前發(fā)展最快的語(yǔ)言之一,自其誕生以來,已經(jīng)走過很長(zhǎng)的路。我開始這個(gè)討論的原因并不是想看它爆炸(不過那也很有趣),而是知道我們都會(huì)從討論中受益。

這也是我在這個(gè)博客上最常見的問題之一,所以我會(huì)和所有的讀者、訪客一起討論這個(gè)問題。

SAS

https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-business-analyst-sas/

R

https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-r-data-science/

數(shù)據(jù)科學(xué)領(lǐng)域

https://courses.analyticsvidhya.com/courses/introduction-to-data-science-2?utm_source=blog&utm_medium=PythonvRvSASarticle

Python

https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-data-science-Python/

 

 

關(guān)于這個(gè)話題不是已經(jīng)說了很多了嗎?

可能是的,但我仍然覺得有必要談?wù)摚蛉缦拢?/p>

數(shù)據(jù)科學(xué)行業(yè)是一個(gè)充滿活力的行業(yè),兩年前進(jìn)行的任何比較都有可能和數(shù)據(jù)科學(xué)不再相關(guān)。

傳統(tǒng)上,Python不在比較范圍內(nèi),但現(xiàn)在我認(rèn)為這不僅僅是一個(gè)值得考慮的問題。

在我即將討論語(yǔ)言全球趨勢(shì)的同時(shí),我將添加有關(guān)印度分析行業(yè)(處于不同發(fā)展水平)的特定信息。

所以,不要再拖延了,讓討論開始吧!

背景

以下是對(duì)3種數(shù)據(jù)科學(xué)工具的簡(jiǎn)要描述:

SAS:毋庸置疑,SAS一直是商業(yè)分析領(lǐng)域的市場(chǎng)領(lǐng)導(dǎo)者。該軟件提供了大量的統(tǒng)計(jì)功能,具有良好的圖形用戶界面(Enterprise Guide&Miner),便于人們快速學(xué)習(xí),并提供出色的技術(shù)支持。然而,最終它成為最昂貴的選擇,還不具備豐富的最新統(tǒng)計(jì)功能。

R:R是SAS的開源版本,傳統(tǒng)上用于學(xué)術(shù)和研究。由于其開源特性,最新的統(tǒng)計(jì)功能很快就會(huì)發(fā)布,而且互聯(lián)網(wǎng)上有很多學(xué)習(xí)文檔,R是一個(gè)非常劃算的選擇。

Python:Python作為一種開源語(yǔ)言,它的使用與日俱增。如今,它的擴(kuò)展程序庫(kù)(numpy、scipy和matplotlib)和功能幾乎可以用于您可能想要進(jìn)行的任何統(tǒng)計(jì)操作/模型構(gòu)建。自從引入panda后,它在結(jié)構(gòu)化數(shù)據(jù)操作方面變得非常強(qiáng)大。

比較屬性(比較角度)

我將在以下8個(gè)屬性上比較這些語(yǔ)言:

1. 可用性/成本
2. 易學(xué)性
3. 數(shù)據(jù)處理能力
4. 圖形功能
5. 工具進(jìn)展
6. 工作情形
7. 深度學(xué)習(xí)支持
8. 客戶服務(wù)支持和社區(qū)

我從分析師的角度比較這些,所以,如果你想為公司購(gòu)買一個(gè)工具,你可能無法在這里得到完整的答案,但下面的信息仍然有用。對(duì)這三種工具,我就每個(gè)比較屬性進(jìn)行評(píng)分(1–低;5–高)。

這些比較屬性的權(quán)重取決于你從事的職業(yè)和抱負(fù)。

1.可用性/成本

SAS是一種商業(yè)軟件,很昂貴,對(duì)于大多數(shù)專業(yè)人員(以個(gè)人身份)來說仍然遙不可及。然而,它在私營(yíng)機(jī)構(gòu)中占有最高的市場(chǎng)份額。因此,除非您所在的組織購(gòu)買了SAS,否則可能很難接觸它。雖然,SAS提供了一個(gè)免費(fèi)的大學(xué)版本,可以使用Jupyter筆記本,但它仍有一些限制!

另一方面,R&Python是完全免費(fèi)的。以下是我在這個(gè)參數(shù)上的評(píng)分:

SAS – 3
R – 5
Python – 5

2.易學(xué)性

SAS很容易學(xué)習(xí),并且為已經(jīng)了解SQL的人提供了簡(jiǎn)單的選項(xiàng)(PROC

-SPL)。即使不這樣,它的知識(shí)庫(kù)中也有一個(gè)很好的、穩(wěn)定的圖形用戶界面。在資源方面,各個(gè)大學(xué)的網(wǎng)站上都有教程,SAS有一個(gè)全面的文檔。有來自SAS培訓(xùn)機(jī)構(gòu)的認(rèn)證,但需要花錢才能獲得。

在這里列出的3種工具中,R的學(xué)習(xí)曲線最陡,因?yàn)樾枰銓W(xué)習(xí)和理解編碼。R是一種低級(jí)編程語(yǔ)言,因此簡(jiǎn)單的過程可能需要較長(zhǎng)的代碼。

SQL

https://www.analyticsvidhya.com/blog/2015/03/basics-sql-rdbms/

proc-sql

https://www.analyticsvidhya.com/blog/2015/04/data-exploration-sas-data-step-proc-sql/

Python在編程領(lǐng)域以其簡(jiǎn)單性而聞名,這對(duì)于數(shù)據(jù)分析也是如此。雖然到目前為止還沒有廣泛使用的圖形界面,但我希望Python notebooks會(huì)越來越成為主流,這會(huì)為文檔和共享提供了很棒的功能。

SAS – 4.5
R – 2.5
Python – 3.5

3.數(shù)據(jù)處理能力

在過去,這一直是SAS的優(yōu)勢(shì)。R在內(nèi)存(RAM)中進(jìn)行所有的計(jì)算,因此計(jì)算受到32位機(jī)器上RAM數(shù)量的限制,但情況不再是這樣了。這三種工具都具有良好的數(shù)據(jù)處理能力和并行計(jì)算選項(xiàng),我覺得這不再是一個(gè)很大的區(qū)別。他們都可以集成Hadoop和Spark集成,同時(shí)也支持Cloudera和ApachePig。

SAS – 4
R – 4
Python – 4

4.圖形功能

SAS具有良好的功能圖形功能,然而,只是功能性的。任何對(duì)繪圖的自定義都是困難的,需要你理解復(fù)雜的SAS圖形(程序擴(kuò)展)包。

R和Python都具有非常高級(jí)的圖形功能,有許多軟件(程序擴(kuò)展)包將為您提供高級(jí)圖形功能。

現(xiàn)在,隨著這兩種工具都引入plotly并且Python引入了Seaborn,自定義繪圖變得前所未有的簡(jiǎn)單。

SAS – 3
R – 4.5
Python – 4.5

5.工具進(jìn)展

這3個(gè)工具都具有最基本基本和最需要的所有功能,只有在研究最新的技術(shù)和算法時(shí),這個(gè)特性才重要。

由于其開放性,R&Python可以快速獲得最新特性,而SAS在新版本的推出中更新了其功能。由于R在學(xué)術(shù)界廣泛應(yīng)用,因此新功能的發(fā)展很快。

盡管如此,SAS在受控環(huán)境中發(fā)布更新,因此它們經(jīng)過了很好的測(cè)試。另一方面,R&Python是開放的,在最新功能的開發(fā)中有出錯(cuò)的可能。

SAS – 4
R – 4.5
Python – 4.5

6.工作情形

在全球范圍內(nèi),SAS仍然是市場(chǎng)領(lǐng)導(dǎo)者,大多數(shù)大型組織仍然在SAS上工作。另一方面,R/Python對(duì)于初創(chuàng)企業(yè)和尋求成本效益的公司來說是更好的選擇。此外,據(jù)報(bào)告,在過去幾年里,R/Python相關(guān)的工作數(shù)量有所增加。這是一個(gè)在互聯(lián)網(wǎng)上廣泛發(fā)布的趨勢(shì),顯示了R和SAS工作數(shù)量的趨勢(shì)。用于數(shù)據(jù)分析的Python工作與R工作具有類似或更高的趨勢(shì):

在下圖中,藍(lán)色代表R,橙色代表SAS

 

 

在下圖中,藍(lán)色代表R,橙色代表Python。

 

 

數(shù)據(jù)科學(xué)工作中使用的工具分布情況如下:

 

 

SAS – 4
R – 4.5
Python – 4.5

7.客戶服務(wù)支持與社區(qū)

R和Python擁有最大的在線社區(qū),但沒有客戶服務(wù)支持。所以,如果你有麻煩,你就靠自己了。不過,你會(huì)得到很多幫助的。

SAS提供了專門的客戶服務(wù)社區(qū)。因此,如果你在安裝方面遇到問題或任何其他技術(shù)挑戰(zhàn),你可以聯(lián)系他們。

SAS – 4
R – 3.5
Python – 3.5

8.深度學(xué)習(xí)支持

SAS的深度學(xué)習(xí)仍處于起步階段,還有很多工作要做。

Python在該領(lǐng)域有著巨大的進(jìn)步,它有許多(程序擴(kuò)展)包,如tensorflow和keras。

R最近增加了對(duì)這些包以及一些基本包的支持。R中的kerasR和keras包充當(dāng)Python包keras的接口。

SAS – 2
Python – 4.5
R – 3

其他因素:

以下是一些值得注意的要點(diǎn):

Python廣泛應(yīng)用在Web開發(fā)中,如果你從事在線業(yè)務(wù),使用Python可以同時(shí)進(jìn)行Web開發(fā)和分析。

SAS過去在部署端到端基礎(chǔ)架構(gòu)(可視化分析、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)質(zhì)量、報(bào)告和分析)方面具有很大優(yōu)勢(shì),但現(xiàn)在可以通過在SAP HANA和Tableau等平臺(tái)上集成/支持R,這種優(yōu)勢(shì)已不再明顯。盡管它距離SAS這樣的無縫集成還有很遠(yuǎn)的距離,但這段旅程已經(jīng)開始。

結(jié)論

在今天的情況下,我們看到市場(chǎng)對(duì)Python略有傾斜。考慮到行業(yè)的動(dòng)態(tài)性,押注什么即將占據(jù)上風(fēng),時(shí)機(jī)尚未成熟。根據(jù)你的情況(職業(yè)階段、財(cái)務(wù)狀況等),你可以增加你自己的權(quán)重,并想出可能適合你的方案。以下是一些特定的場(chǎng)景:

如果你是一個(gè)剛進(jìn)入分析行業(yè)的人(特別是在印度),我建議你學(xué)習(xí)SAS作為你的第一語(yǔ)言。學(xué)習(xí)容易,就業(yè)市場(chǎng)占有率最高。

如果你是一個(gè)已經(jīng)在這個(gè)行業(yè)中一段時(shí)間的人,你應(yīng)該嘗試學(xué)習(xí)一個(gè)新工具來多樣化你的專業(yè)知識(shí)。

對(duì)于業(yè)內(nèi)的專家和專業(yè)人士,人們至少應(yīng)該知道其中的兩個(gè),這將為未來增加許多靈活性,并打開新的機(jī)會(huì)。

如果您是初創(chuàng)企業(yè)/自由職業(yè)者,R/Python更有用。

從戰(zhàn)略上講,具備更多實(shí)際操作幫助和培訓(xùn)的企業(yè)機(jī)構(gòu)可以選擇SAS作為選項(xiàng)。

研究人員和統(tǒng)計(jì)學(xué)家選擇R作為替代方案,因?yàn)樗兄谶M(jìn)行大量的計(jì)算。正如他們所說,R是為了完成工作,而不是為了讓你的電腦更輕松。

由于其輕量級(jí)的特性和不斷增長(zhǎng)的社區(qū),Python明顯已經(jīng)成為當(dāng)今初創(chuàng)企業(yè)的選擇,這也是深度學(xué)習(xí)的最佳選擇。

下面是最后的記分卡:

 

 

以上是我對(duì)這一比較的看法,F(xiàn)在輪到你通過下面的評(píng)論來分享你的觀點(diǎn)了。

原文標(biāo)題:Python vs. R (vs. SAS) – which tool should I learn?

原文鏈接:https://www.analyticsvidhya.com/blog/2017/09/sas-vs-vs-Python-tool-learn/

標(biāo)簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:帝國(guó)理工:如何用AI解決80%專科醫(yī)生擔(dān)憂的心律裝置移植手術(shù)難題

下一篇:大規(guī)模數(shù)據(jù)處理初體驗(yàn):怎樣實(shí)現(xiàn)大型電商熱銷榜?