"千萬級內容類產品中台應該有哪些模塊?"

文章結合牛肉加工的案例,形象地梳理了內容中台的運作機制,並對各個模塊展開了分析介紹,與大家分享。

說到內容,可以把它想象為一塊牛肉。它首先是一頭牛,然後這頭牛被送進了加工廠,在一系列加工之後,通過物流送到超市,最後,你通過消費獲得這塊牛肉。內容也是一樣,需要經過生產、加工、審核、分發等工序最後展示在用戶面前。本文說的內容中台便是如此。

一頭牛(內容原料/內容生產)

和通常說的UGC/PGC的分類不一樣,此處的說的中台將內容來源分為外部創作和內部創作。

外部創作

外部創作指的是爬蟲採集、人工摘錄、渠道合作以及用戶創作內容(UGC)。

(1)爬蟲採集:是指對特定信息源進行機器爬蟲採集、內容入庫。此處說的特定的信息來源通常是公開信息網站,比如gov類的。爬蟲採集要求全、快、準、穩。全,爬取的內容要全,不能把信息源的文章少爬了幾篇。

  • 快,採集要快、入庫要快,最好是能在幾秒鐘內就出現在內部文章池,然而現在一般是在五分鐘左右。
  • ,內容要素要準、內容定位準確,比如說不能把作者當成媒體來源。
  • 穩,採集程序穩定,而且要有及時的監控報警機制。

(2)人工摘錄:主要是針對那些及時性要求比較高的內容,比如突發性重大新聞。這也側面反映出爬蟲採集存在一定缺陷,比如時效性低,很難做到秒級反應。此外部分來源也設有反爬蟲機制,會使得內容有所缺失。這時候就需要人工摘錄進行補充。

(3)渠道合作:是指由合作商提供接口,除了常規的內容要素,還應該包含增刪改信息,最好是有合適的日誌以及信息同步機制。

內部創作

內部創作說的是企業原創,這類又分為兩種:一種是純人工創作,另一種是智能寫稿。

  1. 純人工創作:也就是原創內容,由強大的編輯團隊一手創作
  2. 智能寫稿:這個有點像文字填充。產品經理在經過一系列的分析以後篩選出能夠滿足用戶需求並且能被技術支持的文章類型,再對每一類文章編寫模板並規定由機器填寫的字段。此後機器就能自動產出符合要求的內容了。

加工廠(內容加工)

加工廠主要有兩種“機器”,一類是標簽體系(內容分類),一類是內容加工。

標簽體系主要服務於構建文章池並以此作為個性化推薦的基礎。比如說某篇文章的標簽是{A,B},某用戶的標簽也是{A,B},那麼這篇文章便可能有很大的概率被推送到這個用戶面前。而此處的標簽體系便是通過對內容的分析給它們打上各種標簽以便於後續的分發和推送。值得註意的是,標簽並不是越多越好,而是要遵循一定的規則,這樣才能盡可能地提高匹配程度,從而提高文章的消費率。

內容加工主要有以下幾步:

  1. 首先是格式的優化,對於採集過來的文章我們需要把不合適的內容去掉,比如說超鏈、廣告等。
  2. 然後是內容轉存,將文章的圖片和視頻轉到自己的服務器上(這需要取得對方許可)。
  3. 其次還有一些附加模塊,這塊主要作用於各前臺的特色功能或者個性化需求,比如在文章中添加圖片、表格、投票、附件、運營模塊(主要是banner)等。
  4. 最後是蓋戳環節,就像加工廠給牛肉蓋戳一樣,我們需要對內容的合規性、與原文的一致性等進行覆核,主要是違規詞屏蔽(也就是你們在王者農藥里顯示不出來的芬芳)、關鍵詞替換、原文比對等。

物流分發(內容分發)

物流分發輸出的就是成品牛肉——文章池,它最重要的元素有:標題、摘要、正文、時間、排序、內容標簽、個性化模塊。分發的邏輯比較複雜,而且也需要配合前臺具體需求,這裡就不展開論述了。

最後附上邏輯圖:

本次此結束~

作者:宇觴醉月;公眾號:ZZ的產品筆記

本文由 @宇觴醉月 原創發佈於人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基於CC0協議。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *