數據分析師該如何定義標準，判斷分類？

從經驗里提煉出標準，是數據分析師的一項重要能力！標準關乎好壞的判斷，也是後續所有分析的基礎，標準錯，分析方向就會錯，進而導致分析結論錯，一錯到底。因此，如何定義標準，判斷分類，也是數據分析師的一項重要能力。

不妨先回憶一下我們在工作中經常碰見的一種場景，業務人員匆匆的來和你說：***模塊的***率好低啊，你分析一下原因出在哪兒了？只有單純的判斷/觀點，或者只有單純的數據，我們無法對業務問題作出準確的判斷。我們還需要一個標準，一個判斷情況好壞的標準。具體到任何一件事情，凡是有關好壞、高低、分類判斷的，都涉及標準。

標準無處不在，只是很多時候我們都忽視了他的存在。生活中我們常說「這家外賣好貴啊。」、「這條街道也太長了吧。」、「這棟樓也太高了吧」，那到底什麼算「貴」？什麼算「長」？什麼算「高」呢？我們大多時候並沒有去深究，因為：

1. 人們習慣性的講觀點，不講事實，忽視標準；

2. 人們習慣性的把自己的標準當成別人的標準，沒有確認；

3. 人們習慣性的默認一些約定成俗的標準，而不去考慮合理性；

但是作為一名與數據打交道的一線從業人員，面對各種各樣的數據，我們心中必須得有自己的標準。因為他是後續分析的基礎，也是數據分析師必須掌握的一項重要能力。

一

怎麼樣才算一個好的標準呢？

李笑來說過一句話：審美常常並不需要知道原理，但創造美的人必須有方法論，否則不可能持續創造。領導們可能並不關心標準，可以主觀的進行判斷，然後交給分析師去驗證，但是作為與業務打交道的一線數據分析師，必須得有一套定義標準的方法論，根據標準去監控各類業務指標，從而能夠迅速的判斷出業務現狀的大體情況。

要想找到一個好的標準，首先得明確一個標準包含三樣基本特徵：評價指標、切分線、分類定義，從這三個基本特徵出發可以得到一個好的標準需要同時滿足以下三個條件：

1. 指標與問題高度相關：能夠切實反應當下業務的真正情況；

2. 切分線簡單具體：簡單、具體、易執行，如果不具體則形同虛設；

3. 切分後的類型之間差異明顯：如果切分後無顯著差異，則又回到最初的問題上，怎麼準確判斷業務情況？

二

確認標準的一般步驟

1、梳理問題流程，尋找關鍵指標

首先得明白你做這個判斷標準是為了什麼？從目的出發，尋找能夠直接反應業務問題的指標。比如說：「產品質量好」，最直接想到的就是「退貨率」這個指標，退貨率低，說明客戶認可我們的產品，質量當然就好了。當然有時候可能需要多個指標來共同反應同一件事情，比如「產品賣得好」，光看銷售件數還不夠，還得結合產品毛利以及庫存，來做綜合評價。

2、找簡單、易識別的指標制定切分線

切分線的制定直接決定後面的判斷分類，切分線如何選擇在下文將會詳細描述。

3、進行結果對比，調整切分方式

根據選擇的指標與切分線，即可對業務現狀進行判斷，倘若判斷結果無法反應業務的真實情況，則需要不斷的疊代優化切分方式。

三

如何設立標準

1、一維分類

一維的結果類指標是最容易找標準的，因為一維指標的業務含義很明確，簡單、清晰、直觀，無需深究複雜的業務流程，難點在於結合實際業務劃分切分線，以下列舉常見的幾種切分方法：

1.1 算數值

1.1.1、平均法

比如一組銷售員的業績從10w到100w不等，如何判斷誰好誰壞呢？平均法則去這一組數的算術平均數作為切分線，低於平均數則「差」，高於平均數則「好」。簡單粗暴，但公平、易操作、可解釋性強。平均法所反應的業務含義很清晰：

01. 可以直接找到拖後腿的人，低於平均水準！

02. 可以推算出接下來的目標或者所需人數。如:每人每月平均能做50w，十人下月的業績目標是500w；每人每月平均能做50w，所以下個月300w的業績需要6個人。但是平均法也有他的缺點，即：受極值影響大，因此不適合極值很大的數據，可採用中位數代替。

1.1.2、分攤法

比如本月銷售目標1000w，銷售隊伍10人，所以每人分100w，能達到100w的則「好」，達不到100w的則差。乍一看和平均法很像，但是有一個本質區別，平均法是基於已經發生的現狀，而分攤法則是基於任務要求。

1.2 算排序

1.2.1、二八法

二八法則在大部分行業里都通用，被大多數人所接受，因此可按照二八法則，排序後，選擇前20%的最小值作為切分線，簡單、清晰、可解釋性強。高於該值「好」，低於該值「不好」。

1.2.2、十分位法

根據數值大小進行排序，將其均勻切分為十段，這樣可以看出從高到低各階層的水平，在結合具體的業務場景選擇切分線。

注意：直接用「算排序」的方法來確定切分線一定好嗎？不一定！還要結合具體的數值來看，如果數值全都明顯都特別低，即使你設20%的劃分線，仍然是一個不合格的低標準。

1.3 找標杆

1.3.1、競品對標法

尋找競品的相關指標進行對比，超過則「好」，不足就「不好」

1.3.2、自然周期法

主要看同比數據，假設每年都有一個正常走勢，則符合正常走勢，且比去年表現好則算「好」，比去年表現差則算「不好」。

2、二維指標分類——象限法

2.1、何為象限法

很多業務場景一個指標並不能全面的反應業務的情況，因此二維指標也很常見。成對出現的指標，在邏輯上往往存在一定的聯繫：

01. 串行關係：訂單/回款，點擊/轉化，活躍/付費

02. 並行關係：數量/質量，投入/產出

所謂象限法，就是在一個二維坐標系上畫散點圖，然後在分別給x軸和y軸畫切分線（x軸和y軸的切分線怎麼劃分可以參考一維分類中提到的方法），將散點劃分為到四個模塊，最後根據業務場景定義模塊所代表的業務含義。著名的波士頓矩陣就是利用象限法，通過銷售增長率和市場占有率將不同的產品劃分為四個不同的類別。

2.2、注意

1. 當兩個指標之間關聯度越小時，業務含義越容易解讀，適合用象限法進行分類的指標：

(1)、兩個完全相反的指標：比如投入/產出

(2)、遞進指標：點擊/轉化

(3)、一個問題的兩個側面：活躍/付費，市場增長率/市場份額

2. 並不是任何兩個指標都適合用象限法進行分類：

(1)、如果兩個指標高度相關，散點圖幾乎在同一條直線上的話，則畫出來的象限圖便失去了解讀意義；此種情況可直接用其中一個指標進行分類即可

(2)、若兩個指標分類後無法結合業務場景解讀分類後的意義，做出來的象限圖也是無用的；

3、三維指標分類

三維指標有兩種常見形態：並列指標與串行指標，不同類型的指標處理費方法如下：

3.1、並列指標：比如考核銷售好壞的：銷量、銷售額、利潤

方法一、在給每個指標劃好切分線之後，若各指標重要性差異不大時，可直接規定達標次數越多越好。比如：A-F團隊，在銷量(量)、銷售額(收)、利潤(利)，三個指標上的達標情況如下表所示，可直接根據達標次數進行排名。

方法二、若每個指標重要性差異巨大的時候，要與業務部門商量，對指標進行重要性排序，不達標的一票否決。

3.2、串行指標：比如考核運營好壞的：註冊、活躍、轉化

串行指標可採用漏斗分析法，通過計算各個層級之間的轉化率，可將三維問題壓縮為二維問題，進而採用象限法就進行分類。

3.3、RFM模型

但是一說到三維指標分類，大家一定會想到RFM模型，沒錯，RFM模型就是通過最近一次消費時間、消費頻率、消費金額三個指標通過象限法將客戶分為8類，針對不同類別的客戶開展不同的營運方式。

但三維很少用矩陣法，因為拆的太細，業務部門可能無法執行推進，這樣就失去分類的意義。

四

總結

儘管設立標準有一套獨特的方法論，但是最重要的還是要多於業務部門溝通，分類結果首先要獲得業務部門的認可，因為數據是為業務服務的，脫離了業務，就算你的標準在怎麼好，也無法落地，就失去了分類的意義。

咱們常說的要培養自己的數據敏感度，也需要從設立標準做起，心中沒有一桿秤，都不知道什麼算好，什麼算不好，何談數據敏感度呢？