中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

大數(shù)據(jù)使用的5種主要數(shù)據(jù)挖掘技術(shù)

2018-08-31    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

數(shù)據(jù)挖掘涉及“處理數(shù)據(jù)和識(shí)別信息中的模式和趨勢(shì)”,根據(jù)IBM所說,“數(shù)據(jù)挖掘原理已經(jīng)存在了許多年,但是隨著大數(shù)據(jù)的出現(xiàn),它更為流行了。”

IBM估計(jì),僅過去的兩年就產(chǎn)生了世界上百分之九十的數(shù)據(jù)。每天人們產(chǎn)生2.5兆字節(jié)的數(shù)據(jù),足以填滿1000萬個(gè)藍(lán)光光盤。

數(shù)據(jù)挖掘技術(shù)幫助專業(yè)人員了解可用數(shù)據(jù)集。這些技術(shù)可以為企業(yè)和其他組織提供描述性和預(yù)測(cè)性的能力。

5個(gè)數(shù)據(jù)挖掘技術(shù)

1. 關(guān)聯(lián)規(guī)則

關(guān)聯(lián)規(guī)則使兩個(gè)或多個(gè)項(xiàng)之間的關(guān)聯(lián)以確定它們之間的模式。例如,超市可以確定顧客在買草莓時(shí)也常買鮮奶油,反之亦然。關(guān)聯(lián)通常用于銷售點(diǎn)系統(tǒng),以確定產(chǎn)品之間的共同趨勢(shì)。

“這是一個(gè)非常簡單的方法,但你會(huì)驚訝與其中有多少智慧和洞察,它可以提供許多企業(yè)的日常使用的信息,來提高效率和增加收入,根據(jù)科技公司Galvanize的說法。應(yīng)用領(lǐng)域包括物品的實(shí)物擺放組織、市場(chǎng)營銷和產(chǎn)品的交叉銷售和上銷。

2. 分類

我們可以使用多個(gè)屬性來標(biāo)記特定類別的項(xiàng)。分類將項(xiàng)目分配到目標(biāo)類別或類中,以便準(zhǔn)確地預(yù)測(cè)該類內(nèi)部會(huì)發(fā)生什么。

某些行業(yè)會(huì)將客戶進(jìn)行分類。例如,一家信貸公司可以使用分類模型來確定貸款申請(qǐng)人的低、中或高信用風(fēng)險(xiǎn)。其他組織將當(dāng)前和目標(biāo)受眾分為不同年齡和社會(huì)團(tuán)體進(jìn)行營銷活動(dòng)。

3. 聚類

“聚類是將數(shù)據(jù)記錄組合在一起的方法”根據(jù)Alex Berson、Stephen Smith和Kurt Thearling在Building Data Mining Applications for CRM這本書中所說。“通常這樣做是為了讓最終用戶對(duì)數(shù)據(jù)庫中發(fā)生的事情有一個(gè)高層次的認(rèn)識(shí)。”

查看對(duì)象分組情況可以幫助市場(chǎng)細(xì)分領(lǐng)域的企業(yè)。在這個(gè)例子中可以使用聚類將市場(chǎng)細(xì)分為客戶子集。然后,每個(gè)子集可以根據(jù)簇的屬性來制定特定的營銷策略,例如在一個(gè)簇中與另一個(gè)簇中的客戶的購買模式的對(duì)比。

4. 決策樹

決策樹用于分類或預(yù)測(cè)數(shù)據(jù)。決策樹從一個(gè)簡單的問題開始,它有兩個(gè)或多個(gè)的答案。每個(gè)答案將會(huì)引出進(jìn)一步的問題,該問題又可被用于分類或識(shí)別可被進(jìn)一步分類的數(shù)據(jù),或者可以基于每個(gè)答案進(jìn)行預(yù)測(cè)。

應(yīng)用決策樹圖分析手機(jī)供應(yīng)商如何分類流失的客戶,或不更新手機(jī)的客戶。Building Data Mining Applications for CRM的作者為決策樹圖的構(gòu)建提供了一些有趣的值得借鑒的東西。

將數(shù)據(jù)分成多個(gè)葉結(jié)點(diǎn),所有葉結(jié)點(diǎn)的數(shù)據(jù)記錄數(shù)的加和等于輸入數(shù)據(jù)的記錄總數(shù)。例如,父結(jié)點(diǎn)中的數(shù)據(jù)記錄總數(shù)等于其兩個(gè)子結(jié)點(diǎn)中包含的記錄總和。

當(dāng)在決策樹上上下移動(dòng)時(shí),流失前和流失后的客戶數(shù)量是需要存儲(chǔ)的。

能夠很容易的理解模型的構(gòu)建。

如果你需要針對(duì)可能流失的客戶提供一份市場(chǎng)營銷方案,則該模型非常易于使用。

公司可以發(fā)展對(duì)其客戶群的直覺;例如,可以得出這樣的結(jié)論,那些多年一直在供應(yīng)商身邊客戶和擁有手機(jī)的客戶往往是忠誠的。

5. 序列模式

序列模式識(shí)別相似事件的趨勢(shì)或通常情況發(fā)生的可能。這種數(shù)據(jù)挖掘技術(shù)經(jīng)常被用來助于理解用戶購買行為。許多零售商通過數(shù)據(jù)和序列模式來決定他們用于展示的產(chǎn)品。

“根據(jù)客戶數(shù)據(jù),您可以識(shí)別客戶在一年中不同時(shí)間購買的特定的商品集合,”根據(jù)IBM所說,“在購物籃應(yīng)用中,你可以使用這些信息自動(dòng)地根據(jù)瀏覽頻率和過去的購買歷史記錄來預(yù)測(cè)某些商品會(huì)被添加到購物籃中。”

大數(shù)據(jù)時(shí)代的工作機(jī)遇

在數(shù)據(jù)挖掘和分析領(lǐng)域中,大數(shù)據(jù)的增長創(chuàng)造了許多新興的職業(yè)崗位,如數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家,其中應(yīng)用到多種數(shù)據(jù)挖掘技術(shù)和原則。

英文原文:https://datafloq.com/read/5-major-data-mining-techniques-being-used-big-data/3352

標(biāo)簽: 大數(shù)據(jù) 大數(shù)據(jù)時(shí)代 數(shù)據(jù)分析 數(shù)據(jù)庫

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:哈佛和谷歌的科學(xué)家們正通過AI來預(yù)測(cè)余震

下一篇:GPU是個(gè)謎?揭秘GPU