通過產品數據的剖析,我們能夠洞察用戶行為、習慣以及他們對產品的使用反饋,並策划出優化後的產品策略。所以掌握數據挖掘與分析思維顯得格外重要,那麼如何掌握這一思維方式呢?
立志要在互聯網闖盪的運營新人們抓耳撓腮地在電腦面前看著運營課程,用戶量下滑,留存營收莫名其妙地下降,老闆指著一個月比一個月難看的數據說你不適合這個崗位。
對於運營來說,這個崗位可以像地球一樣分三個層面:
- 地核:用戶
- 地幔:用戶在產品中的行為
- 地殼:行為在產品中產出的數據
地殼部分的數據瞬息萬變,各個新運營人們在產品的新大陸上總是在措不及防之時,就被身旁名為“次留”或者“流失”的活火山給弄得焦頭爛額。
這些變化似乎難以把控,“用戶”的本質地核深藏在地殼下方,新人們只能在發現數據異常的時候趕緊收集,卻很難預知未來可能會發生的事情。
但一切數據的產生都是有其原因的。用戶是產品調性固定住的東西,產生出數據的用戶行為便是運營應該牢牢抓住的東西。
抓住用戶行為的過程,便是我想要傳達給大家的思維——數據分析&挖掘。
下麵我會通過概述和三個案例來闡述這種思維的方式:
- 案例1:關鍵詞數據抓取優化
- 案例2:漏斗-對比優化
- 案例3:數據預測計算思路
01 數據分析&挖掘
數據分析並非信手拈來的,數據分析是有其一定的框架可遵循的。
數據分析的框架可以分為3個主要步驟:
- 理解行業業務
- 將數字轉化為結論
- 結論的驗證與實踐
1. 理解行業業務
對任何問題的優化,其前提都是對行業業務及崗位需求有著基本的理解。
數據只有依附在實際業務上,才能從概念轉化成具有實體意義的內容。
2. 將數字轉化為結論
數據分析是一個分析+探索的過程。我們有時是帶著問題和假設去分析、驗證,有時是純粹地在數據中探索,但無論怎樣的形式,我們都需要數據將我們導向一個理性的結論。
獲得理性結論是一個非常關鍵的環節。當我們跟一些同行交流下來,大家在做數據分析的時候經常得出一些看上去很正確的結果,但這些結果其實對業務指導的價值卻很小。
這樣的結果是因為分析還不夠深入,並且沒有把握住業務核心,才會導致看上去很正確的觀點,在實際的指導中卻沒有很好的效果。
3. 結論的驗證與實踐
獲取結論後,我們可以嘗試將理論投入實踐:
- 演繹論證已有結論
- 利用結論去優化業務
對結論進行演繹和論證,是從多維度證明我們的結論的可操作性。
通常我們可以用其他產品的已有數據去佐證這個結論,我們也可以在無數據的情況下,開展產品的版本AB測試來收集數據,去實驗、驗證結論的可行性。
無論是用什麼樣的方法,都是為了證明數據獲得的理性結論,是能夠實際且有效地指導業務完成優化。
02 數據分析三個通用思路
在梳理完數據分析框架後,我們轉向數據分析思路。數據分析思路並沒有優劣之分,不同的分析場景需要不同的思路去應對,這裡我列舉了三個通用的基本思路:
- AARRR
- RFM
- 5W2H
1. AARRR——海盜模型
一個產品自上線開始,AARRR模型便從用戶獲取、留存激活,再到營收傳播等流程,貫穿了產品&用戶聯繫的全鏈過程,整體用戶進入產品後產生的每一板塊的數據都是分析點。
AARRR的思路比較適合分析產品的整體情況。特別是產品還處於早期測試階段的時候,我們就可以用這個思路去做產品的場景分析,從每一步的場景模擬去找到產品優化改進的點。
2. RFM——用戶價值分析體系
RFM是用戶價值的分層、評估體系。
我們在傳統的用戶分群模式中,將用戶直接分為:大R、中R、小R,按照累計的充值金額去粗暴地做用戶劃分,很難在這個基礎上做到更加精細化的策略應對。
RFM就給出了比較全面、有規範的分層模式,可以把用戶分群為,例如高價值、中等價值、潛在價值等等層次。依據RFM給出不同層次的用戶需求,我們可以為不同的用戶策划出更為精細化的運營策略。
3. 5W2H——分析的基層框架
5W2H是最為常見的事件分析思路。
我們在做數據分析的時候,其實大部分處理方式的底層思路,均可歸屬到5W2H的思路。
我們會去梳理:
- 發生了事件?
- 事件發生在哪裡?
- 什麼時候發生的事情?
- 事件的關聯群體?
- 事情是發生的理由?
然後根據5W獲得事件處理方案:
- 我們該如何處理?
- 我們的事件處理程度?
這是一個比較寬泛,同時也是經常用到的分析思路。
03 實際案例分析
1. 寶箱優化——如何利用簡單、顯眼的數據
這個棋牌產品正準備第二次開寶箱的活動,主要目的是希望通過寶箱活動去實現玩家在線時間及ARPU的提升。
經過第一次寶箱活動後,該產品目前的數據是這樣的:
第一次活動策劃的時候我們是沒有可對比的活動數據作為參考的,我們選擇了“大於10局的用戶數占比45%”的結論去策劃活動。
到了第二次活動策劃,我們制定了活動的策劃思路:
- 進一步增加活動參與度
- 控制游戲成本輸出(用戶金幣均獲取量)
根據這兩個思路,我們制定了第二期活動的改進方案。
這次改進中,我們改進了兩個活動點:
(1)降低參與門檻——提升活動參與度
此次活動最大的變動,便是從10局一次開寶箱的機會,改成了7次。這個調整的數據依據就是“大於7局的用戶數占比為50%”。
這個改進依據是最容易發現的,同時也是最關鍵的。
(2)上調服務費——控製成本
為了吸引更多用戶參與活動,我們降低了抽獎門檻,並提升了獎勵金額。但是為了控製成本輸出,我們上調了服務場的服務費用,導致儘管玩家錶面上更容易獲取資源,且資源數量不少,但實際獲取的金幣數量是低於第一次活動的。
改動之後,活動的參與人數的數據變化如下圖:
從抽獎次數來看,參活用戶平均抽獎次數從3.8提升到了4.6。
這個數據說明,門檻的降低促使更多的用戶參與抽獎,且抽獎頻率相較一期有了較為明顯的提升。
另外,活動的最終目的是為了提升游戲留存,兩期活動前後留存的情況是這樣的:
數據顯示,第一期活動將產品留存率是從48%提升到了50%,提升了2個百分點。第二期的用戶留存從47%提升到了53%,提升了6個點。
這個數據結果就是非常好、有效的活動效果。
而從整體用戶的次日留存提升來看,留存數值從0.3%提升到了1.2%。如果我們能夠將產品的留存提升1%的話,這個活動對產品產生的價值是非常高的,留存數據也會進一步影響到整個用戶的LTV。
通過這個活動的分析,我們可以看到活動策劃的一個源頭:關鍵的數據。
二期活動利用一個非常簡單的變量——10局到7局的改良,使得活動效果獲得了大幅度的改進。
很多時候我們會把數據分析想得過於複雜,但其實我們可以利用最簡單且明顯的數據就能做到非常顯著的優化效果,並且這樣的數據其實非常多。
這是我想通過這個例子向大家呈現的一個概念:抓住簡單而又關鍵的數據。
2. MMORPG召回活動
我們再來看看一款MMORPG產品的召回活動。
和許多處於中後期運營階段的產品一樣,這款MMORPG的流失用戶會在這個階段去開展召迴流失玩家的活動,並策劃相應的召回活動去提升這些玩家的留存。
玩家的召回方式有很多,常見的有短信、郵件、客服等方法。短信信息召回是性價比最高的方法之一,這款案例產品的活動也是通過短信來實現的。
但因為召回人群的差異,短信內容也要發生變化。首先對流失可召回的玩家可以進行幾個分層,如圖示內容,核心用戶、高端用戶、次高端用戶、中端用戶、低端用戶123。
這是兩次召回活動的數據,數據包含了失敗、成功、目標召回以及召回率。
如果從活動召回率來說,第一次活動總的召回率是15%,第二次是20%。召回率反映出第二次的效果是明顯比第一次好的。
但如果我們再來仔細看整個數據的召回率比例,我們會發現第二次召回的用戶中,之所以會比第一次的召回率高,數據的提升更多體現在低端用戶的召回上。
因次第二次活動的召回效果是否真的好。我們需要看更多的數據和指標來佐證,到底哪一次的活動舉辦的比較成功。
因此,我們選擇以下幾個點進行分析:
- 回歸天數分佈
- 資源消耗對比
- 分類型用戶占比
- 回歸後30天內登陸不足20天的用戶
(1)回歸天數分佈
對於回歸用戶登錄天數分佈,就是回歸用戶在30天之內活躍了多少天。下圖是第一次活動和第二次活動的用戶活躍天數分佈。
第一次活動形式主要是發短信讓老玩家回來,利用每天簽到領獎提高留存,併在第十天的時候用大獎的形式提高用戶的長線留存能力。
第二次的時候,召回活動同樣也是每天都可以領獎,但是我們將大獎的領取時間拉長,讓用戶在第十八天的時候才可以領取。領獎時間的差異,導致數據上產生了差異。
根據這個表我們可以找出一些現象:
- 大部分回歸用戶領了大獎後就基本都流失了。30天為周期,用戶登陸數據基本都是在15天左右開始下去。
- 回歸的用戶在第八天的時候出現了一個流失的高峰。這是一個需要關註的點。因為在第一次活動的時候,第八天並沒有出現高流失的情況,因此,第八天的數據異常應該可以挖掘出一個對活動改進的點。
- 第二期活動留下來的用戶要比第一期留下的要多
二期活動迴流用戶要比一期多25%左右,證明用戶雖然領了獎品大多會流失。但是通過延長活動獎品的領取時間,可以讓玩家有更多的時間去瞭解游戲的內容。
很多MMORPG是通過社區互動的方式,例如師徒系統、組隊副本等方式,提高了召回玩家的留存。
所以我們可以得到一個改進結論:
就是針對第二期活動,召回玩家在第八天左右出現流失高風現象,下一次召回活動應當在第7第8天來適當地提升獎品獎勵,來提高用戶期望,從而促使玩家繼續留在游戲當中。當然,這個結論也需要從更多的維度去佐證是否成立。
我們對召回的玩家不僅要關註他們的召回率,我們還應當去關註他們的活躍度。
(2)資源消耗對比
召回的本質還是想讓玩家留下來,留下來之後開始消費的行為。
由圖可知,第二次召回的用戶的資源消耗(付費能力)要高於第一期的用戶,由日均1.8提升到1.9,提升了6%。同時,結合游戲的付費數據,同期游戲日均首日分別為300和240,可以看到第二期活動從營收上的確是要高於第一期活動的。
我們剛剛看到召回活躍度的對比,召回玩家的活躍度是第二期更好的,從充值和資源消耗來說,也是第二期更好一些。分析到這裡的時候,我們其實基本可以下結論,第二期的召回活動效果是優於第二期召回活動的。
分析到這裡,其實我們還沒有得到更多建議,去優化第三期的召回活動。因次我們還需要去深挖用戶行為路徑,去發掘用戶的價值。
(3)分類型用戶占比
首先,是分類型用戶消耗占比的分析,我們本身在召回的時候把用戶分了不同的層級,高端、次高端之類的概念。這些用戶回歸游戲後,我們針對他們在游戲內分別消耗了多少資源做了一個對比的分佈圖,這個時候我們可以明顯地發現一些特別有價值的結論:
回歸玩家消耗明顯集中在高端用戶和低端用戶1中。
在兩期的活動中,低端用戶1分別占據了消耗占比的44%和36%,均遠高於其他類別的玩家的。
其實一期活動策劃的時候,我們的活動大部分都是希望去把高端+次高端用戶作為我們的活動導向核心,因為這些都是大玩家的貢獻價值更大。
但實際上,這兩期活動對低端用戶1和次高端用戶的影響最大,後面如果我們要再策劃類似活動的話,我們就應當需要對低端用戶1做一個更為全面的分析,讓活動可以進一步挖掘這部分人群的消費能力和體驗導向。
同樣的,其他的用戶行為需求我們也需要進一步的分析,對整個活動進行改良,以提高活動對其他用戶的吸引力。
綜上所述,活動對我們的核心用戶群——高端用戶&次高端用戶,其實吸引力是不大的。
這裡就可以獲得兩個結論:
- 回歸玩家的消耗主要來⾃於次⾼端⽤戶和低端⽤戶1,尤其是低端⽤戶1,此類玩家在兩期活動的消耗中分別占到了44%和36%。作為召回活動主要召回對象的核⼼⽤戶和高端⽤戶反⽽沒有表現出較強的付費能⼒。
- 低端⽤戶3類型消耗占⽐第⼆期有較⼤幅度提升,由3%提升到了12.7%,說明雖然此類⽤戶中有⼤量的⼩號、倉庫號,但其中真實⽤戶仍然能夠給游戲帶來⼀定價值。
由上述結論便可以導出對第三期活動的改進建議:
適當提升次⾼端⽤戶和低端⽤戶1的獎勵價值,因為這兩類玩傢具有更強的消費能⼒和傾向,適當提升獎勵價值可以達到提升其消費意願的作⽤。
這是對用戶進行分類的對比,我們還可以看回歸之後30天之內,登陸不足20天的用戶,從中再去發掘更多數據信息。
(4)回歸後30天內登陸不足20天的用戶
這個用戶就是召回之後再次流失,他們回來之後為什麼又走了,這裡其實是需要結合整個游戲的玩法去分析了。
比如說低端用戶3的等級分佈,它的流失點分別為65級及70級,這裡要結合游戲的玩法去分析這兩個點存在什麼樣的問題導致玩家流失。
對於這個游戲來說,65級和70級的時候有一個要求較高的飛升系統。前期在召回玩家回來之後,我們會獎勵玩家一些經驗值和獎勵的禮包,但到了飛升的時候會卡在這裡,這個點也會成為未來活動優化的方向。對於低端用戶2也可以同樣使用這樣的思路去分析優化。
使用這種分析,我們可以得到一些結論。就是我們在做活動結果的數據分析的時候,我們很容易只停留在活動的數據錶面,並沒有對下層行為做一個深鑽,如果我們從不同的角度去深挖數據,我們就可以得到很多有價值的點。
04 數據挖掘
數據除了數據分析的價值,另一層價值就是數據挖掘的價值。
數據分析是依賴於人的經驗及人對業務的理解,依賴人的邏輯思維能力去找到整個業務相關的信息,去找到理性且可以指導我們產品優化的點。
數據挖掘就是從另外一個維度去發掘數據的價值。
我們這裡用一個比較簡單常見的案例:產品的DAU預測。通過這個案例,我們可以看到數據挖掘的一個思路。
這裡有三條曲線,分別代表了三個產品的DAU,三個DAU走勢波動比較厲害,而有一些的周期性比較明顯,沒有太多規律可言。
我們就需要一些比較科學的方法去預測DAU、分析產品的DAU、分析具體的場景去對我們的一些產品決策進行輔助。
比如說這個場景:
現在有一個產品公測沒多久,公司給的KPI指標是產品投放後能夠達到50萬的收益。事實上,在產品上線的兩周,產品的數據已經很接近50萬,但是一直徘徊在45-47萬。
這個產品本身沒有達到50萬DAU的KPI,這個時候整個項目組還有一筆預算,需要去衡量這筆預算如果全部拿去買量的話,能不能達成這樣的一個KPI。
這個時候我們需要找到一個可以科學決策的依據,我們要分析整個DAU跟新增用戶的關係,去分析多少錢可以獲得大概多少的市場新增。
新增和DAU並不是一個直接的關係,中間通過留存做了一個橋接,所以我們需要分析新增和DAU之間的關係是什麼,如果我們能夠得到一個公式去計算出來的話,就能夠倒推我們需要花多少錢才能夠滿足50萬的KPI。
為了預測這個DAU,首先我們需要對流程做一個拆解,我們首先需要定義它。每日登錄用戶,就是DAU的定義,只要用戶做了登陸操作,我們就認為他是一個活躍用戶,每天DAU的曲線波動非常大。
造成DAU波動的因素由這幾個點構成,通常我們把整個日活的用戶比喻成用戶池,每天都有流入的用戶,每天都有出去的用戶。所以一個流入一個流出形成了數據的波動,對於流入的部分我們可以分為三個部分:昨日留存用戶+日迴流用戶+日新進用戶。
分解之後,我們就可以完成一張新進用戶的留存表。
表格一共列舉了5天內有多少人留下來,在後續20天每天又有多少人留下來了。我們會發現裡面的留存率,是根據下方示意圖的趨勢發展的,呈現的是衰減的趨勢。
然後我們找來兩個產品的留存曲線來擬合這個衰減現象。
大家可以看到這兩個曲線還是挺有規律的,相對來說也是較為平滑的,這個時候我們需要選擇一個留存模型——冪率分佈對它進行預測。
其中:
- a為常數(可簡化)
- b為新進留存繫數
- x為產品運行天數
如果b的值越大,留存情況就會越好,因為b這個值決定了曲線的傾斜程度,比如A產品第一條綠線的b值就要大於紅線。
所以b值就可以反映出產品的用戶留存特征,我們就可以把b定義為新進的留存繫數,留存繫數可以通過三個點決定:
- 產品的品質
- 用戶的質量
- 運營的活動
在結合上述理論後,我們就可以從已經運營一段時間的產品中抓取我們產品的b值,畫一個走勢圖。
這該產品b值一年來的走勢圖。從大的層面來看,b值的波動不是非常的大,但是波峰和波谷都有相關運營活動或者版本迭代的干預,導致了這個值的改變。
圖上顯示,我們為了完成某些KPI去提高DAU值做的拉小號的活動,反而導致了b值的下降,就證明拉小號的活動促進了DAU的值上升,但用戶質量卻下降了。產品本身的質量其實是比較穩定的,你可以衡量它的用戶質量,用戶質量其實就與運營活動質量有關。
有了這樣的模型之後,我們就可以計算出把DAU的公式列舉出來了。
大家可以把這個概念不停拆分下去,累加之後就可以形成DAU公式。我們可以把總的日活數據不停地拆,從第一天到第N天留存用戶數,就可以得到今日的日活。然後我們再利用這個公式,去做出我們產品的走勢圖。
根據這樣的情況,我們就可以很好地去預測DAU的走勢,去對比實際日活和預測日活的一個匹配程度。雖然存在一些偏差,但是偏差值也是因為受到活動的影響才發生的。
獲取預測趨勢圖之後,我們再投入實際的應用中去評估。
我們回到評估DAU50萬的目標上。
從上圖可以看到上面這張圖是日活躍與日新進的走勢關係,這些都是不限號之前的走勢,不限號之前是比較穩定的,核心玩家一直都是比較穩定的,沒有什麼比較大的變化。中間拐點開始是不限號當天出現的,日新增註冊用戶自拐點之後一直往下走。
我們代入那個日活公式後,下方圖的紫色部分就代表我們的預計的日活曲線。最後推算出來是,我們需要連續兩周每天都要有8萬的新進,才能夠完成50萬DAU的指標。
這個數值所需要的費用跟我們實際的預算相比差距太大,因此我們放棄了用50萬去投放買量的計劃。如果差距不大的話,我們才會選擇投放獲客。
這次的數據挖掘就給了我們此次決策的數據支撐,告訴了我們這個決策是不具備可行性的。後來為了完成目標,我們改用了拉小號的活動,將數據快速地推上去。
總結下來,數據挖掘可以分為三步:
- 利用歷史數據
- 建立概念模型
- 預測發展趨勢
本文由 @小莫@數數科技 原創發佈於人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基於CC0協議