中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數據分析的發(fā)展和演變經過哪幾個階段

2018-11-16    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

作者: Deepesh Nair

編譯: Mika

 

 

近年來,我們在信息技術領域取得了巨大進步,在技術生態(tài)領域中取得的一系列革命性成果也確實值得稱贊。在過去的十年到二十年里,數據和分析一直是非常熱門的詞匯。因此我們需要明確它們是如何相互關聯(lián)的,市場中扮演什么角色,以及將如何重塑商業(yè)業(yè)務。

對于那些已經意識到其潛力的人群來說,科技是一種福音,然而對于那些無法跟上其快速發(fā)展的人群來說,這也是一種考驗。如今,幾乎每個行業(yè)都離不開數據分析。

在本文中將總結近年來數據分析的發(fā)展和演變,簡化各種術語,對一些常見應用場景進行解釋。讓我們開始吧!

數據分析1.0 → 商業(yè)智能需求

這是數據倉庫的興起時期,客戶(業(yè)務)和生產過程(交易)被集中到巨大的存儲庫中,如eCDW(企業(yè)整合數據倉庫)。在對商業(yè)現象的客觀理解方面取得了真正的進展, 從而讓管理者在做出決策時能夠基于對事實的理解,而不是僅憑直覺。

 

 

這個階段中數據通過ETL和BI工具收集、轉換和查詢。分析類型主要分為描述性(發(fā)生了什么)和診斷性(為什么會發(fā)生)。

然而,這個階段的局限在于數據僅在公司企業(yè)內部使用,即商業(yè)智能活動只能處理過去發(fā)生的事情,而不能對未來趨勢進行預測。

數據分析 2.0 →大數據

隨著各大企業(yè)都紛紛走出舒適區(qū),試圖用更廣泛的方法進行更復雜的分析時,前一階段的數據分析局限性變得更加突出。

 

 

企業(yè)都開始通過外部資源獲取信息,比如點擊流、社交媒體、互聯(lián)網等,與此同時對新工具的需求也越發(fā)明顯。不可避免地,“大數據”一詞出現了,為了區(qū)分那些純粹來自公司內部系統(tǒng)的小數據。

在這個階段,公司希望員工能夠通過快速處理引擎幫助處理大量數據。他們沒預想到的是,因此應運而生的新興的群體,即如今所稱的“開源社區(qū)”將產生巨大的影響力,這也是數據分析 2.0時代的標志。

在社區(qū)前所未有的支持下,大數據工程師,Hadoop管理員等角色在就業(yè)領域發(fā)展壯大,并且對每個IT企業(yè)都至關重要?萍脊炯庇陂_發(fā)新的框架,這些框架不僅能夠收集、轉化處理大數據,而且還能在集成預測性分析。而且,進一步通過描述性和診斷分析的結果檢測趨勢、聚類和異常,并預測未來趨勢,這也使其成為重要的預測工具。

在今天的技術生態(tài)系統(tǒng)中,我個人認為“大數據”這個術語已經被大量使用,甚至濫用。從技術上講,如今“大數據”指的是所有數據,或者只是指數據。

數據分析 3.0→ 功能強大的數據產品

開創(chuàng)性的大數據公司開始投資數據分析,從而支持面向客戶的產品,服務和功能。它們通過更好的搜索算法、購買建議以及針對性廣告吸引用戶訪問其網站,所有這些都是由數據分析所驅動的。大數據現象迅速蔓延,如今不僅是科技公司在通過數據分析開發(fā)產品和服務,幾乎每個行業(yè)的公司都是如此。

 

 

另一方面,大數據技術的普及帶來了好壞參半的影響。在科技巨頭收獲大量利潤取得成功的同時,大多數企業(yè)和非科技公司卻因為忽略數據而失敗慘重。因此,數據科學領域應運而生,旨在使用科學方法、探索過程、算法等從各種形式的數據中獲得知識和分析見解。

實際上,數據科學領域是跨學科的,它被定義為“結合統(tǒng)計、數據分析、機器學習等相關方法的概念”,從而用數據“理解和分析實際現象”。換句話說,良好的數據加上出色的訓練模型能夠產生更好的預測結果。新一代的量化分析師被稱為數據科學家,他們擁有計算和數據分析技能。

科技行業(yè)在數據科學的幫助下迅速發(fā)展,并充分利用預測性和規(guī)范性對未來趨勢進行預測。企業(yè)間也開啟了數據分析的競爭,公司不僅通過改善內部決策等傳統(tǒng)方式,而且還在不斷開發(fā)更有價值的產品和服務。這是數據分析 3.0時期的精髓。

如今數據分析產生了巨大轉變。公司正以超乎想象的速度發(fā)展,在內部設立更多的研發(fā)部門,比如數據科學家、數據工程師、解決方案架構師、首席分析師等人員構成的數據分析團隊。

數據分析 4.0 → 自動化功能

主要有四種分析類型:描述,闡述過去; 診斷,利用過去的數據研究現在; 預測,通過基于過去數據的見解來預測未來; 規(guī)范,通過模型指導最佳行為。

雖然數據分析3.0包含了上述所有類型,但它強調的是最后一種,并且引入了小規(guī)模自動化分析的概念。

 

 

通過機器學習創(chuàng)建更多模型,從而讓預測變得更加細化和精確。但是,部署這類定制模型的成本和時間是十分昂貴的。最終,通過智能系統(tǒng)實現自動化的數據分析4.0時代到來了。

毫無疑問,人工智能、機器學習、深度學習將帶來深刻的影響。機器翻譯、智能回復、聊天機器人、會議助理等功能將在未來幾年內得到廣泛應用。數據挖掘技術、機器學習算法都已取得了大量成果,自動化分析將成為數據分析的新階段。

數據分析 5.0 → 接下來會是什么

我們可以將自動化理解為,人與智能機器的強強聯(lián)合,從而實現更好的成果。

 

 

與其思考“人類的哪些工作將被機器取代?”我寧愿樂觀地考慮,在機器的幫助下,企業(yè)能取得哪些新成就?我們該如何在災難易發(fā)地區(qū),通過人工智能程序減少傷亡人數;或者如何在貧困地區(qū)建立人工智能驅動的電子學校等。

總而言之,我對數據分析的發(fā)展充滿自信,關鍵在于我們能否積極地接受和應對其帶來的影響。

原文鏈接:

https://towardsdatascience.com/the-evolution-of-analytics-with-data-8b9908deadd7

標簽: 處理大數據 大數據 大數據公司 大數據技術 互聯(lián)網 媒體 數據分析 搜索 信息技術

版權申明:本站文章部分自網絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:如何選擇大數據的編程語言

下一篇:十分鐘了解大數據處理的五大關鍵技術及其應用