"解密微信視頻號推薦機制(一)"

微信最近最新推出了視頻號,視頻號和公眾號不同是一個非中心化的產品,視頻號的核心在於推薦,華仔連續刷了兩周視頻號,500+的視頻量,發現了微信推薦機制的蛛絲馬跡,寫了兩篇有關微信視頻號推薦機制的原創文章,這是第一篇,產品經理、內容創作者都可以讀一下。

微信視頻號定位

首先我們要看一下視頻號的定位,視頻號與公眾號不同。

對於內容創作者來說,公眾號是一個中心化的產品,好像一個封閉的魚塘,池塘好不好要看魚有多少。而視頻號是去中心化的一個產品,視頻號好像一個廣場,只要你的內容夠好,就能吸引更多的人來觀看你的內容。

這個多怎麼定義呢?

有可能是全國的11億微信用戶,所以視頻號的核心在於推薦機制。現在視頻號還在內測階段,就如同初期的抖音一樣處於紅利期。

給大家看一組數據,公眾號的打開率在3%左右,也就是說如果你有10000個粉絲,每篇文章的閱讀量也就是300人。

而截止到2020/4/14日華仔的視頻號粉絲只有51人,但是單個視頻最高觀看量已經達到1000+,華仔視頻號總觀看量已經達到5000+。

這組數據也就是華仔不得不做視頻號的原因,絕對是一波紅利。

上文已經講過視頻號的核心是微信團隊設計的推薦機制,華仔花了2周時間每天都刷視頻號,察覺到一些視頻號推薦機制的蛛絲馬跡,通過接下來的這兩篇文章分享給你。

推薦系統入門

我們先對推薦系統入個門,如下圖所示推薦分為三個階段:召回、過濾、排序。

什麼是召回呢?就是通過一個一個的推薦引擎(推薦算法),計算你喜歡的商品。簡單介紹一下兩個召回算法:比如基於用戶的協同過濾算法(推薦引擎),就是你朋友喜歡的東西你也有可能喜歡,物以類聚,人以群分的算法。

第二個是基於物品的協同過濾算法(推薦引擎),我們都知道啤酒與尿不濕的案例,假如你在超市買了啤酒就很有可能買尿不濕。這個算法認為如果大多數人買了商品A,又買了商品B,那麼A和B就是比較相似的。假如你買了A,我就可以給你推薦B。

再來看下什麼是過濾,比如在視頻號你剛刷了某個明星的短視頻,接下來是不需要再給你推薦某個明星的這個視頻,還有比如在電商網站你買過的東西,近期就沒必要再推薦給你,這就是過濾。

最後看一下什麼是排序,比如基於用戶的協同過濾算法推薦出來了商品A,你喜歡的概率是0.98,基於物品協同過濾算法推薦出了商品B,你喜歡的概率也是0.98。

那我應該把A優先推薦給你還是把B優先推薦給你呢?兩套算法都相互不服,就好像兩個武林高手誰都不服誰,那麼我只能這樣做,請一個裁判再給兩套算法比個武,誰贏優先推薦誰。這就是排序算法。

視頻號用到的召回算法

本文主要講視頻號的召回算法,通過華仔觀察到的結果反推視頻號的推薦機制,微信視頻號團隊都用了哪些召回算法。

華仔連續下拉了13次視頻號的首頁,記錄了每次刷新的第一的視頻,為什麼記錄第一個?因為第一個放在最前面大概是因為視頻號認為它是華仔目前來說最可能喜歡的視頻。測試的結果如下:

我們來分析一下為什麼推薦給我這些視頻,要想搞明白為什麼是這些視頻,首先要搞明白微信都有華仔的那些數據。我們拿華仔的個人微信號舉個例子:

華仔的微信號有1300+的好友、關註了384的公眾號,平時沒事打打王者和聯盟、開了個產品經理公眾號、寫寫文章、是一個非典型90後男同胞。

(1)基於用戶協同過濾的視頻號推薦算法

首先對於社交產品最重要的一定是華仔的好友數據,華仔的好友都看了那些視頻,那個視頻華仔的好友看的最多,那麼就可以優先把這個視頻推薦給華仔看,說不定華仔也喜歡看。所以華仔的朋友千萬不要看不良內容,說不定華仔就刷到了。這就可以用到基於用戶的協同過濾算法。

當刷到第九個時,後面連續都是 提示 “多位朋友看過”,說明視頻號用到了基於用戶的協同過濾,而且推薦結果在排序算法中權重很高。

(2)基於用戶標簽的視頻號推薦算法

其次騰訊知道華仔關註了384個公眾號,公眾號在創建時是需要選擇類別的,另外公眾號發文章時時也要選擇類別,華仔平時會看什麼類型的公眾號、看那些類型的文章,騰訊都知道,就可以給華仔打上各種各樣的標簽。

比如華仔經常看產品經理、汽車、美食相關的公眾號和文章,那麼騰訊就會給我打上產品經理、汽車美食等等標簽。有了這些標簽就可以給華仔推薦相關的視頻,於是華仔的推薦列表裡出現了“1.YYP顏宇鵬車言論”、“7.產品經理看世界 ”、3.迪哥愛吃 這些視頻。

這裡又產生了一個問題,微信視頻號是怎麼找到產品經理、汽車、美食相關的視頻呢?一定要給這些視頻打上產品經理、汽車、美食相關的標簽,這裡發現了視頻號給視頻打標簽的三種方式:

第一是通過視頻的標題關鍵字,這個是最直接的,因為“1.XXX說車”、“7.產品經理看世界 ”這兩個視頻的標題就包含了車和產品經理,微信可以通過視頻的標題給視頻打上 汽車和產品經理的標簽。然後可以基於華仔個人愛車、產品經理、美食的標簽匹配視頻的標簽,這樣就完成了推薦。

第二個是利用用戶填的話題,當用戶用視頻號創建一個視頻時,用戶可以針對視頻選擇一個話題,其實用戶輸入的話題就間接的給視頻打上了標簽。如下圖#微信讀書#這個標簽,點擊標簽是可以看到標簽下的視頻的。

第三種方式比較高級,試用了一下微信的視頻號搜索功能,比如華仔搜索“說車”二字,搜索結果分為上下兩塊:

  • 第一種是視頻號主,出現了“貓叔說車”等幾個結果。
  • 第二個是說車相關的視頻,這裡發現微信視頻號已經能識別視頻的內容包括視頻里的文字和圖片,這裡用到了深度學習等算法,在視頻上傳後可以基於視頻的內容打上相應的標簽,一旦有了標簽就可以和用戶標簽做匹配。

通過以上兩個召回算法除了2.鈦鉑新媒體 、5.粥左羅 這兩個視頻,其他視頻都能解釋清楚了,要麼是基於我的好友推薦 要麼還是基於標簽推薦。

其他視頻推薦召回算法

那騰訊為什麼會推薦:2.鈦鉑新媒體 、5.粥左羅 給我呢?

這裡有兩種可能:

第一種是因為在推薦系統中有個概念叫“信息繭房”,就是如果你觀看的視頻都是你喜歡的視頻,就很有可能進入死循環,沒有其他新的視頻。推薦系統為瞭解決信息繭房的問題會給推薦系統增加一些隨機性,推薦一些你從未看過的視頻而這些視頻,滿足你的好奇心。現實中人也是這樣的如果長時間只看某些東西,就會產生厭煩情緒,突然看到一個新的東西,會感覺很新奇。

第二種可能就是微信加入了視頻熱度的召回算法比如5.粥左羅這個視頻點贊量1997、評論量480,熱度一般是一些綜合的指標的權重計算如觀看量、點贊量、評論量、播放完成率等指標計算視頻的熱度,熱度高的視頻,用戶喜歡的概率相對來說就會高一點。

下一篇系列文章會講微信視頻號視頻用到了實時推薦機制以及視頻號的冷啟動策略,歡迎持續關註。

#專欄作家#

Wilton華仔,微信公眾號:改變世界的產品經理,人人都是產品經理專欄作家。產品經理能力咨詢,教你從0到1搭建數據中台。

本文原創發佈於人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash, 基於CC0協議。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *