中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

大數(shù)據(jù)部署五步走 踏上正確之路

2019-02-26    來源:多智時(shí)代

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

企業(yè)網(wǎng)D1Net導(dǎo)語:前幾天突然有感慨,誰最懂你?搜索引擎。這源于在搜索引擎上剛搜索了幾個(gè)關(guān)鍵詞,稍后登陸某網(wǎng)站時(shí),其中有一個(gè)版塊呈現(xiàn)的廣告都是和剛才那幾個(gè)關(guān)鍵詞相關(guān)的,這只是搜索引擎對(duì)一個(gè)人的上網(wǎng)蹤跡做了記錄并分析,如果根據(jù)所有上網(wǎng)人的數(shù)據(jù)及其搜索的關(guān)鍵字,在某種意義上說,搜索引擎就成為最大的調(diào)研公司了。這只是大數(shù)據(jù)的其中一個(gè)應(yīng)用,其實(shí)大數(shù)據(jù)應(yīng)用遠(yuǎn)不止于此,它有無限潛力,但是在部署之前,你需要了解五個(gè)問題,以便踏上正確之路。

大數(shù)據(jù)是一個(gè)含糊的術(shù)語。因此,企業(yè)用戶應(yīng)該了解其含義,必須理解大數(shù)據(jù)實(shí)際上能做什么及其局限性是什么。在繪制大數(shù)據(jù)戰(zhàn)略藍(lán)圖的時(shí)候,提出一些恰當(dāng)?shù)膯栴}保證企業(yè)能夠得到有用的信息是非常重要的。

企業(yè)擔(dān)心落在競(jìng)爭(zhēng)對(duì)手的后面和利用大數(shù)據(jù)實(shí)現(xiàn)各種業(yè)務(wù)目標(biāo)的同行的后面。但是,在被大浪卷走之前,你要后退一步并且考慮五個(gè)問題以保證你走上正確的道路。

1、你的問題是什么?

這似乎是一個(gè)顯而易見的問題。但是,感受到壓力要成為數(shù)據(jù)驅(qū)動(dòng)的企業(yè)的那些公司也許會(huì)冒進(jìn),不首先恰當(dāng)?shù)囟x問題(或者機(jī)會(huì))。你是不能把你需要的數(shù)據(jù)放入Excel表格的商務(wù)分析師嗎?你首先不能訪問你的公司的大數(shù)據(jù)嗎?你是負(fù)責(zé)減少查詢返回的等待時(shí)間的首席信息官嗎?你是對(duì)查詢結(jié)果需要等待數(shù)天或者數(shù)星期感到厭煩的非技術(shù)用戶嗎?你的數(shù)據(jù)是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的?還是擁有上述所有問題?

當(dāng)然,你可能面對(duì)的問題之一是預(yù)算,特別是在創(chuàng)業(yè)企業(yè)和中小企業(yè)中。數(shù)據(jù)倉庫和專用硬件的價(jià)格讓他們望而卻步。如果可承受性是一個(gè)問題,你要根據(jù)在商品化硬件上運(yùn)行的軟件制定一個(gè)戰(zhàn)略,不需要數(shù)據(jù)倉庫。

2、你為免費(fèi)(開源)軟件支付的價(jià)格是什么?

圍繞Hadoop一直有許多爭(zhēng)論。雖然Hadoop對(duì)于某些企業(yè)需求來說是一個(gè)非常好的開源軟件解決方案,但是,免費(fèi)并不意味著不支付任何費(fèi)用。Hadoop在商品化硬件上運(yùn)行。由于它需要電源和網(wǎng)絡(luò)連接,這就需要投資。

核心的Hadoop發(fā)布版是免費(fèi)的開源軟件。但是,有些廠商有專有的Hadoop發(fā)布版。即使開源軟件發(fā)布版也有專有的插件管理工具。除非你從Apache軟件基金會(huì)下載Hadoop組件,否則,你會(huì)像使用商業(yè)軟件一樣遇到同樣的軟件許可證和廠商鎖定等令人擔(dān)心的問題。

我們不要忘記部署和管理這個(gè)技術(shù)所需要的數(shù)據(jù)科學(xué)家的工資。如果你有足夠的資金支付IT和硬件費(fèi)用,Hadoop也許對(duì)你非常合適。但是,Hadoop并非適用于一切需求。這就引出了下一個(gè)問題。

3、規(guī)模重要嗎?(你的企業(yè)規(guī)模和你的數(shù)據(jù)的規(guī)模)

圍繞大數(shù)據(jù)的談話主要是PB級(jí)的數(shù)據(jù)。然而,大多數(shù)企業(yè)使用的數(shù)據(jù)僅達(dá)到TB級(jí)。當(dāng)在TB級(jí)的范圍內(nèi)工作的時(shí)候,大型機(jī)器集群的開銷也許不能得到投資回報(bào)。你會(huì)發(fā)現(xiàn)那個(gè)遺留的解決方案對(duì)于你的企業(yè)需求也許規(guī)模太大,是不必要的。

如果是在TB級(jí)范圍內(nèi),你就是在使用一臺(tái)服務(wù)器的范圍之內(nèi)。你可以使用一臺(tái)服務(wù)的解決方案,從而降低成本和簡(jiǎn)化。僅僅在10年前,一臺(tái)服務(wù)器只能處理GB級(jí)的數(shù)據(jù)。但是,現(xiàn)在的商品化硬件已經(jīng)能夠處理TB級(jí)的數(shù)據(jù),從而提供了以前不能提供的選擇范圍。

4、你的數(shù)據(jù)在哪里?

你的大多數(shù)數(shù)據(jù)是在企業(yè)內(nèi)部的,你的策略與大多數(shù)數(shù)據(jù)在云中的企業(yè)有所不同。例如,如果你的數(shù)據(jù)在亞馬遜或者Rackspace的云服務(wù)中,那么,在那個(gè)框架中運(yùn)行大數(shù)據(jù)解決方案是有意義的,因?yàn)閿?shù)據(jù)很容易在那個(gè)環(huán)境中遷移。然而,如果你的大多數(shù)數(shù)據(jù)在企業(yè)內(nèi)部并且你正在考慮在云中運(yùn)行你的大數(shù)據(jù)查詢,你要三思。大數(shù)據(jù)是很難遷移并且保持同步的。當(dāng)上載到云的時(shí)候會(huì)有許多挑戰(zhàn)。在這種情況下,大數(shù)據(jù)最好保持在企業(yè)內(nèi)部的環(huán)境中。

5、各種技術(shù)有什么區(qū)別?

目前有三種類型的技術(shù)用于大數(shù)據(jù)分析:軟件數(shù)據(jù)庫設(shè)備、硬件數(shù)據(jù)庫設(shè)備和分布式數(shù)據(jù)庫。

軟件數(shù)據(jù)庫設(shè)備部署在商品化硬件上,一般部署在一臺(tái)計(jì)算機(jī)上,因此,價(jià)格便宜,結(jié)構(gòu)簡(jiǎn)單。這種設(shè)備的例子包括SQL服務(wù)器或者M(jìn)ySQL等關(guān)系數(shù)據(jù)庫以及SiSense的ElastiCube技術(shù)。

硬件數(shù)據(jù)庫設(shè)備包括與專有硬件(也就是價(jià)格昂貴的硬件)捆綁銷售的專有軟件。專有硬件的技術(shù)規(guī)格比商品化硬件更強(qiáng)大,因此價(jià)格可以高50倍。

分布式數(shù)據(jù)庫是指部署在計(jì)算機(jī)集群中的軟件,可以平行運(yùn)行資源密集型的處理操作。這包括復(fù)雜的架構(gòu)。

你可能遇到的其它技術(shù)都是不能直接處理大數(shù)據(jù)的規(guī)模較小的技術(shù),如內(nèi)存處理或者聯(lián)機(jī)分析處理(OLAP,On Line Analytical Processing)。上載到這些數(shù)據(jù)中心技術(shù)的數(shù)據(jù)在上載之前要顯著刪減,一般采用上述的一種大數(shù)據(jù)技術(shù)。

在不久的將來,云計(jì)算一定會(huì)徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏云計(jì)算,及時(shí)獲取人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的前沿資訊和基礎(chǔ)知識(shí),讓我們一起攜手,引領(lǐng)人工智能的未來!

標(biāo)簽: Mysql 處理大數(shù)據(jù) 大數(shù)據(jù) 大數(shù)據(jù)查詢 大數(shù)據(jù)分析 大數(shù)據(jù)技術(shù) 大數(shù)據(jù)應(yīng)用 服務(wù)器 數(shù)據(jù)分析 數(shù)據(jù)庫 搜索 搜索引擎 網(wǎng)絡(luò) 云服務(wù) 云計(jì)算

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:企業(yè)成功部署云計(jì)算五步走

下一篇:特殊的云計(jì)算環(huán)境下 如何保證存儲(chǔ)在云上數(shù)據(jù)的安全