中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

數(shù)據(jù)挖掘?qū)崙?zhàn):帶你做客戶(hù)價(jià)值分析(附代碼)

2018-08-10    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線(xiàn)!快速搭建集群,上萬(wàn)Linux鏡像隨意使用
背景與挖掘目標(biāo)

1. 背景

航空公司業(yè)務(wù)競(jìng)爭(zhēng)激烈,從產(chǎn)品中心轉(zhuǎn)化為客戶(hù)中心

針對(duì)不同類(lèi)型客戶(hù),進(jìn)行精準(zhǔn)營(yíng)銷(xiāo),實(shí)現(xiàn)利潤(rùn)最大化

建立客戶(hù)價(jià)值評(píng)估模型,進(jìn)行客戶(hù)分類(lèi),是解決問(wèn)題的辦法

2. 挖掘目標(biāo)

借助航空公司客戶(hù)數(shù)據(jù),對(duì)客戶(hù)進(jìn)行分類(lèi)

對(duì)不同的客戶(hù)類(lèi)別進(jìn)行特征分析,比較不同類(lèi)客戶(hù)的客戶(hù)價(jià)值

對(duì)不同價(jià)值的客戶(hù)類(lèi)別提供個(gè)性化服務(wù),制定相應(yīng)的營(yíng)銷(xiāo)策略

詳情數(shù)據(jù)見(jiàn)數(shù)據(jù)集內(nèi)容中的air_data.csv和客戶(hù)信息屬性說(shuō)明。

分析方法與過(guò)程

1. 分析方法

首先,明確目標(biāo)是客戶(hù)價(jià)值識(shí)別

識(shí)別客戶(hù)價(jià)值,應(yīng)用最廣泛的模型是三個(gè)指標(biāo)(消費(fèi)時(shí)間間隔(Recency),消費(fèi)頻率(Frequency),消費(fèi)金額(Monetary))

以上指標(biāo)簡(jiǎn)稱(chēng)RFM模型,作用是識(shí)別高價(jià)值的客戶(hù)

消費(fèi)金額,一般表示一段時(shí)間內(nèi),消費(fèi)的總額。但是,因?yàn)楹娇掌眱r(jià)收到距離和艙位等級(jí)的影響,同樣金額對(duì)航空公司價(jià)值不同

因此,需要修改指標(biāo)。選定變量,艙位因素=艙位所對(duì)應(yīng)的折扣系數(shù)的平均值=C,距離因素=一定時(shí)間內(nèi)積累的飛行里程=M

再考慮到,航空公司的會(huì)員系統(tǒng),用戶(hù)的入會(huì)時(shí)間長(zhǎng)短能在一定程度上影響客戶(hù)價(jià)值,所以增加指標(biāo)L=入會(huì)時(shí)間長(zhǎng)度=客戶(hù)關(guān)系長(zhǎng)度

總共確定了五個(gè)指標(biāo),消費(fèi)時(shí)間間隔R,客戶(hù)關(guān)系長(zhǎng)度L,消費(fèi)頻率F,飛行里程M和折扣系數(shù)的平均值C

以上指標(biāo),作為航空公司識(shí)別客戶(hù)價(jià)值指標(biāo),記為L(zhǎng)RFMC模型

如果采用傳統(tǒng)的RFM模型,如下圖。它是依據(jù),各個(gè)屬性的平均值進(jìn)行劃分,但是,細(xì)分的客戶(hù)群太多,精準(zhǔn)營(yíng)銷(xiāo)的成本太高。

 

 

綜上,這次案例,采用聚類(lèi)的辦法進(jìn)行識(shí)別客戶(hù)價(jià)值,以LRFMC模型為基礎(chǔ)

本案例,總體流程如下圖

 

 

2.挖掘步驟

從航空公司,選擇性抽取與新增數(shù)據(jù)抽取,形成歷史數(shù)據(jù)和增量數(shù)據(jù)

對(duì)步驟一的兩個(gè)數(shù)據(jù),進(jìn)行數(shù)據(jù)探索性分析和預(yù)處理,主要有缺失值與異常值的分析處理,屬性規(guī)約、清洗和變換

利用步驟2中的已處理數(shù)據(jù)作為建模數(shù)據(jù),基于旅客價(jià)值的LRFMC模型進(jìn)行客戶(hù)分群,對(duì)各個(gè)客戶(hù)群再進(jìn)行特征分析,識(shí)別有價(jià)值客戶(hù)

針對(duì)模型結(jié)果得到不同價(jià)值的客戶(hù),采用不同的營(yíng)銷(xiāo)手段,指定定制化的營(yíng)銷(xiāo)服務(wù),或者針對(duì)性的優(yōu)惠與關(guān)懷。(重點(diǎn)維護(hù)老客戶(hù))

3. 數(shù)據(jù)抽取

選取,2014-03-31為結(jié)束時(shí)間,選取寬度為兩年的時(shí)間段,作為觀測(cè)窗口,抽取觀測(cè)窗口內(nèi)所有客戶(hù)的詳細(xì)數(shù)據(jù),形成歷史數(shù)據(jù)

對(duì)于后續(xù)新增的客戶(hù)信息,采用目前的時(shí)間作為重點(diǎn),形成新增數(shù)據(jù)

4. 探索性分析

本案例的探索分析,主要對(duì)數(shù)據(jù)進(jìn)行缺失值和異常值分析

發(fā)現(xiàn),存在票價(jià)為控制,折扣率為0,飛行公里數(shù)為0。票價(jià)為空值,可能是不存在飛行記錄,其他空值可能是,飛機(jī)票來(lái)自于積分兌換等渠道

查找每列屬性觀測(cè)值中空值的個(gè)數(shù)、最大值、最小值的代碼如下

 

 

 

 

--

 

5. 數(shù)據(jù)預(yù)處理

數(shù)據(jù)清洗

丟棄票價(jià)為空記錄

丟棄票價(jià)為0、平均折扣率不為0、總飛行公里數(shù)大于0的記錄

 

 

 

 

6. 屬性規(guī)約

原始數(shù)據(jù)中屬性太多,根據(jù)航空公司客戶(hù)價(jià)值LRFMC模型,選擇與模型相關(guān)的六個(gè)屬性

刪除其他無(wú)用屬性,如會(huì)員卡號(hào)等等

 

 

 

 

7. 數(shù)據(jù)變換

意思是,將原始數(shù)據(jù)轉(zhuǎn)換成“適當(dāng)”的格式,用來(lái)適應(yīng)算法和分析等等的需要

本案例,主要采用數(shù)據(jù)變換的方式為屬性構(gòu)造和數(shù)據(jù)標(biāo)準(zhǔn)化 3.需要構(gòu)造LRFMC的五個(gè)指標(biāo)

L=LOAD_TIME-FFP_DATE(會(huì)員入會(huì)時(shí)間距觀測(cè)窗口結(jié)束的月數(shù)=觀測(cè)窗口的結(jié)束時(shí)間-入會(huì)時(shí)間(單位:月))

R=LAST_TO_END(客戶(hù)最近一次乘坐公司距觀測(cè)窗口結(jié)束的月數(shù)=最后一次。。。)

F=FLIGHT_COUNT(觀測(cè)窗口內(nèi)的飛行次數(shù))

M=SEG_KM_SUM(觀測(cè)窗口的總飛行里程)

C=AVG_DISCOUNT(平均折扣率)

 

 

模型構(gòu)建

1. 客戶(hù)聚類(lèi)

利用K-Means聚類(lèi)算法對(duì)客戶(hù)數(shù)據(jù)進(jìn)行客戶(hù)分群,聚成五類(lèi)(根據(jù)業(yè)務(wù)理解和需要,分析與討論后,確定客戶(hù)類(lèi)別數(shù)量)。

代碼如下:

 

 

 

 

就剩下最后一步,畫(huà)圖:

 

 

 

 

 

 

客戶(hù)群1:red,

客戶(hù)群2:green,

客戶(hù)群3:yellow,

客戶(hù)群4:blue,

客戶(hù)群5:black

 

 

客戶(hù)關(guān)系長(zhǎng)度L,消費(fèi)時(shí)間間隔R,消費(fèi)頻率F,飛行里程M,折扣系數(shù)的平均值C。

橫坐標(biāo)上,總共有五個(gè)節(jié)點(diǎn),按順序?qū)?yīng)LRFMC。

對(duì)應(yīng)節(jié)點(diǎn)上的客戶(hù)群的屬性值,代表該客戶(hù)群的該屬性的程度。

2. 客戶(hù)價(jià)值分析

我們重點(diǎn)關(guān)注的是L,F(xiàn),M,從圖中可以看到:

客戶(hù)群4[blue] 的F,M很高,L也不低,可以看做是重要保持的客戶(hù);

客戶(hù)群3[yellow] 重要發(fā)展客戶(hù)

客戶(hù)群1[red] 重要挽留客戶(hù),原因:入會(huì)時(shí)間長(zhǎng),但是F,M較低

客戶(hù)群2[green] 一般客戶(hù)

客戶(hù)群5[black] 低價(jià)值客戶(hù)

重要保持客戶(hù):R(最近乘坐航班)低,F(xiàn)(乘坐次數(shù))、C(平均折扣率高,艙位較高)、M(里程數(shù))高。最優(yōu)先的目標(biāo),進(jìn)行差異化管理,提高滿(mǎn)意度。

重要發(fā)展客戶(hù):R低,C高,F(xiàn)或M較低,潛在價(jià)值客戶(hù)。雖然說(shuō),當(dāng)前價(jià)值不高,但是卻有很大的發(fā)展?jié)摿,促使這類(lèi)客戶(hù)在本公司消費(fèi)和合作伙伴處消費(fèi)。

重要挽留客戶(hù):C、F、M較高,但是較長(zhǎng)時(shí)間沒(méi)有乘坐(R)小。增加與這類(lèi)客戶(hù)的互動(dòng),了解情況,采取一定手段,延長(zhǎng)客戶(hù)生命周期。

一般與低價(jià)值客戶(hù):C、F、M、L低,R高。他們可能是在公司打折促銷(xiāo)時(shí)才會(huì)乘坐本公司航班。

 

 

3. 模型應(yīng)用

會(huì)員的升級(jí)與保級(jí)(積分兌換原理相同)

會(huì)員可以分為,鉆石,白金,金卡,銀卡…

部分客戶(hù)會(huì)因?yàn)椴涣私庾陨矸e分情況,錯(cuò)失升級(jí)機(jī)會(huì),客戶(hù)和航空公司都會(huì)有損失

在會(huì)員接近升級(jí)前,對(duì)高價(jià)值客戶(hù)進(jìn)行促銷(xiāo)活動(dòng),刺激他們消費(fèi)達(dá)到標(biāo)準(zhǔn),雙方獲利

4. 交叉銷(xiāo)售

通過(guò)發(fā)行聯(lián)名卡與非航空公司各做,使得企業(yè)在其他企業(yè)消費(fèi)過(guò)程中獲得本公司的積分,增強(qiáng)與本公司聯(lián)系,提高忠誠(chéng)度。

5. 管理模式

企業(yè)要獲得長(zhǎng)期的豐厚利潤(rùn),必須需要大量穩(wěn)定的、高質(zhì)量的客戶(hù)

維持老客戶(hù)的成本遠(yuǎn)遠(yuǎn)低于新客戶(hù),保持優(yōu)質(zhì)客戶(hù)是十分重要的

精準(zhǔn)營(yíng)銷(xiāo)中,也有成本因素,所以按照客戶(hù)價(jià)值排名,進(jìn)行優(yōu)先的,特別的營(yíng)銷(xiāo)策略,是維持客戶(hù)的關(guān)鍵。

6.小結(jié)

本文,結(jié)合航空公司客戶(hù)價(jià)值案例的分析,重點(diǎn)介紹了數(shù)據(jù)挖掘算法中K-Means聚類(lèi)算法的應(yīng)用。 針對(duì),傳統(tǒng)RFM模型的不足,結(jié)合案例進(jìn)行改造,設(shè)定了五個(gè)指標(biāo)的LRFMC模型。最后通過(guò)聚類(lèi)的結(jié)果,選出客戶(hù)價(jià)值排行,并且制定相應(yīng)策略。

標(biāo)簽: 代碼 排名 優(yōu)惠

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:從數(shù)據(jù)治理看醫(yī)療大數(shù)據(jù)的發(fā)展

下一篇:國(guó)內(nèi)傳統(tǒng)企業(yè)對(duì)Hadoop到底什么態(tài)度?