中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

2018-12-31    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

簡述

數(shù)據(jù)可視化-通過圖表形式展現(xiàn)數(shù)據(jù),幫助用戶快速、準(zhǔn)確理解信息。準(zhǔn)確、快速是可視化的關(guān)鍵,好的可視化會“講故事”,能向我們揭示數(shù)據(jù)背后的規(guī)律。對于可視化,有一個常見誤區(qū):分析師追求過于復(fù)雜的圖表,反而使得業(yè)務(wù)人員難以理解。其實越簡單的圖表,越容易被理解,而快速易懂地理解數(shù)據(jù),正是可視化最重要的目標(biāo)。

大多數(shù)人對于基礎(chǔ)的數(shù)據(jù)圖表都有一定的認(rèn)知,但卻未必清楚,在哪一種場景使用何種圖表,本文主要給大家介紹基礎(chǔ)圖表的特性,讓大家知道在何種場景使用該類型圖表。

圖表的基本組成元素

一張圖表至少包含:標(biāo)題、橫縱坐標(biāo)軸、數(shù)據(jù)系列、數(shù)據(jù)標(biāo)簽、圖例等部分,每一部分都在圖表中扮演特定的角色表達特定的信息。當(dāng)然這些元素并不是必須具備的,當(dāng)信息足夠清晰時,你可以精簡部分元素,使得圖表更加簡潔。

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

正確理解維度與指標(biāo)

維度(Dimension)

♦ 類別型字段、一般是離散的、不可進行四則運算
♦ 常常是觀察數(shù)據(jù)的角度,往往是橫坐標(biāo)

度量/指標(biāo)(Measure)

♦ 數(shù)值型字段、一般是連續(xù)的、可進行四則運算
♦ 一般都是數(shù)據(jù)的數(shù)值化衡量,往往是縱坐標(biāo)

下面是4種常見、常用基礎(chǔ)圖表

1. 折線圖“家族”

折線圖的核心思想是 趨勢變化。

作為信息最明了的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:

基礎(chǔ)折線圖

技巧1:添加關(guān)鍵運營事件標(biāo)記
技巧2:添加趨勢線,當(dāng)R²>0.6時可采納該趨勢線,R²越接近1,趨勢越可靠

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

堆積面積圖

面積大小對應(yīng)該類別數(shù)值大小,反映不同類別占比關(guān)系及其時間趨勢變化。以下圖為例,你可看出AppStore和360下載量Top1、2的渠道。

缺點:由色塊面積來表示數(shù)值大小有時候不直觀。以下圖為例,需仔細看圖才能知道AppStore和360手機助手是有做過投放的

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

折線圖小結(jié)

♦ 折線圖是點、線連在一起的圖表,可反映事物的發(fā)展趨勢和分布情況;
♦ 適合在單個數(shù)據(jù)點不那么重要的情況下表現(xiàn)變化趨勢、增長幅度。

2. 柱形圖“家族”

柱形圖的核心思想是 對比

累加柱形圖

適合少量類別的對比,且對比信息特別清晰

與堆積面積圖相比,堆積面積圖比累加柱形圖多一時間維度,它可表達時間維度上的趨勢變化。

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

多指標(biāo)柱形圖

主要運用于多個指標(biāo)進行對比分析的場景,但類別對象不宜過多,當(dāng)超過5個,不適合使用此圖表

技巧:當(dāng)各對比指標(biāo)大小相差10倍甚至更大時,可采用標(biāo)準(zhǔn)化,如:對數(shù)值取自然對數(shù),既能有效縮小指標(biāo)量度差距,也能保留同指標(biāo)的大小關(guān)系

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

條形圖

當(dāng)對比對象類別>5時,將多指標(biāo)柱形圖更改為單指標(biāo)的條形圖,能有效提高數(shù)據(jù)對比清晰度

條形圖,必須按照數(shù)值大小降序排列,這是提升條形圖閱讀體驗的重要手段

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

瀑布圖

核心是按維度/指標(biāo)下鉆分解,如:公司收入各用途分解、公司年利潤按分公司分解、業(yè)績按銷售團隊分解;

對比餅圖的優(yōu)勢在于,拆解項較多時,瀑布圖通過數(shù)字的標(biāo)記仍可清洗辨別,而餅圖在分解項>5時就不易辨別。

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

柱形圖結(jié)合折線圖

對比多個指標(biāo),尤其是對比指標(biāo)與指標(biāo)的增長率上非常適用,使得一個圖表可以表現(xiàn)兩個層次的信息。(當(dāng)然要盡可能避免信息的重復(fù)。如下圖,折線圖含義如果換成團隊簽約數(shù)占公司總簽約數(shù)比例,則意義不大)

使用雙坐標(biāo)軸,要表明清晰

 

直方圖

當(dāng)橫坐標(biāo)變成連續(xù)的分組,就可以制作直方圖(與柱形圖主要差別在于,直方圖一般不同數(shù)據(jù)系列沒有間距)

當(dāng)組別劃分無限細化,我們就可以繪制概率分布曲線或者稱為密度曲線,最常見的就是正態(tài)分布,這里不舉例。

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

柱形圖小結(jié)

♦ 核心是對比,柱形圖的目的是將對比信息放大,直觀呈現(xiàn)出來;
♦ 由于直觀,柱形圖適合做結(jié)論的表達;
♦ 柱形圖一般不用在時間維度的變化;
♦ 柱形圖的數(shù)據(jù)系列和點不宜過多,否則建議改變圖表形式;
♦ 柱形之間的寬度盡量小于柱形本身的寬度。

3. 散點圖“家族”

散點圖的核心思想是 研究

研究型圖表,適合用于發(fā)現(xiàn)變量間的關(guān)系與規(guī)律,不適合用于清晰表達信息的場景

基礎(chǔ)散點圖

基礎(chǔ)散點圖觀察兩個指標(biāo)的關(guān)系

 

氣泡圖

在基礎(chǔ)散點圖上添加一個維度:用氣泡大小表示新的一個維度

下圖中,氣泡大小表示配送費用

 

基于散點圖的分類矩陣

分類運營,精準(zhǔn)運營是現(xiàn)代化運營的一個重要課題,通過分類矩陣進行分類是一個有效手段

難點1: 構(gòu)建指標(biāo)可用于分類的橫縱坐標(biāo)軸指標(biāo),這需要很強的業(yè)務(wù)認(rèn)識
難點2: 確定指標(biāo)的分界點,同樣需要足夠的業(yè)務(wù)判斷能力

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

散點圖小結(jié)

♦ 散點圖作為研究型圖表,經(jīng)常在數(shù)據(jù)分析前期被使用,在報告中很少見;
♦ 散點圖不夠直觀,大多時候不能直接表達結(jié)論;
♦ 散點圖對于業(yè)務(wù)敏感度和數(shù)據(jù)意識要求較高;
♦ 散點圖只是入門的鑰匙,發(fā)現(xiàn)規(guī)律只是分析的切入口。

4. 餅圖“家族”

餅圖的核心思想是 分解

基礎(chǔ)餅圖

技巧:將需要突出顯示的部分,置于左上角,順時針方向

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

旭日圖

旭日圖在基礎(chǔ)餅圖上可表達更多層次的分解關(guān)系,如下圖:有季度分解、月度分解、再到每周,且每個維度之間可兼容包含

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

餅圖小結(jié)

♦ 一般來說,數(shù)值最大的部分排在最前面,也就是12點鐘方向順時針;

♦ 餅圖的細分項不宜過多,一般不超過8項;

♦ 不要制作三維的餅圖,不直觀;

♦ 切忌將餅圖拉得過開,若要突出某一塊,可單獨將其拉開。

其實,個人覺得餅圖在實際場景中應(yīng)當(dāng)盡可能少的使用(因人眼對面積大小不敏感),而且對指標(biāo)的分解柱形圖同樣能勝任,且遠遠清晰于餅圖。

當(dāng)且僅當(dāng),用于反應(yīng)單個模塊占整體比重時,適合用餅圖,如下圖:

 

如何成為數(shù)據(jù)分析師系列(一):可視化圖表初階

 

作者:月下柳人松 來源:知乎

標(biāo)簽: 數(shù)據(jù)分析

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:2018 年最受歡迎的 Python 庫,你都用過嗎?

下一篇:12年后,人工智能和人類會是什么樣?這是900位專家的看法|報告