你真的懂用戶畫像嗎?
在移動互聯網時代,精細化運營成為企業重要的競爭力,此時,「用戶畫像」的概念也應運而生。用戶畫像是指,在大數據時代,我們通過對海量數字信息進行清洗、聚類、分析,從而將數據抽象成標籤,利用這些標籤將用戶形象具體化,從而為用戶提供有針對性的服務。在下文中,我們將以個推用戶畫像產品為例,為你詳解「用戶畫像」的技術特點和使用價值。
個推用戶畫像產品依託個推多年積累的海量數據及強大的數據分析能力,可為 APP 開發者提供豐富的用戶畫像數據以及實時的場景識別能力,進而幫助客戶了解用戶信息,從而助力移動 APP 目標用戶精準篩選、個性化推送消息和應用更新下載等。
用戶畫像的形成需要經歷四個過程,主要包括數據收集、數據清洗、數據建模分析、數據產出。其中,數據清洗和數據建模統稱數據處理,在經過數據處理之後,個推憑藉多年積累的大數據能力,以獨特的冷、熱、溫數據維度分析進行數據產出形成用戶畫像。
一、用戶畫像用了哪些技術?
在數據處理階段,個推用戶畫像產品的大數據計算架構採用了 Kafka 分散式發布訂閱消息系統,這一系統具有高吞吐量、高穩定性的特點。數據清洗可利用 HADOOP、SPARK 實現設備唯一性識別、行為數據的清洗等,從而去除冗餘數據。這一過程支持交互計算和多種複雜演算法,同時,它還支持數據實時 / 離線計算。
在數據建模的過程中,主要用了機器學習中的聚類(無監督學習) 和深度學習技術,這能讓模型對用戶行為數據主動學習,進行行為判斷,由此產出用戶標籤。
之後,數據的產出會形成冷數據畫像、溫數據回溯、熱數據場景和定製化標籤四種畫像。
冷數據畫像,是指基於大數據分析出用戶的屬性,改變概率較小的數據,如用戶的年齡段、性別等。
「溫數據」則可以回溯用戶近期活躍的線上和線下場景,具有一定的時效性。
「熱數據」是指用戶當下的場景及實時的用戶特徵,幫助 APP 運營者抓住稍縱即逝的營銷機會。
定製化標籤是將個推數據與第三方數據結合起來,共同建模得出具有價值的特徵標籤。總的來說,個推用戶畫像產品不僅能產出通用的標籤維度,也有定製化標籤的輸出能力。
二、如何構建用戶畫像?
「用戶畫像」的構建需要技術和業務人員的共同參與,以避免形式化的用戶畫像,具體做法可參考個推構建用戶畫像的流程:
(1)標籤體系設計。開發者需要先了解自身的數據,確定需要設計的標籤形式。
(2)基礎數據收集、多數據源數據融合。在建設用戶畫像時,個推用戶畫像產品會整合個推以及該 APP 自身的數據。
(3)實現用戶統一標識。多數情況下,APP 的眾多用戶分布於不同的賬號體系中,個推會將其統一標識,幫助 APP 打通賬號,實現信息快速共享。
(4)用戶畫像特徵層構建,即將每一個數據進行特徵化。
(5)畫像標籤規則 演算法建模,兩者缺一不可。在實際的應用中,演算法難以解決的問題,利用簡單的規則也可以達到很好的效果。
(6)利用演算法對所有用戶打標籤。
(7)畫像質量監控。在實際的應用中,用戶畫像會產生一定的波動,為了解決這個問題,個推建設了相應的監控系統,對畫像的質量進行監控。
總之,個推用戶畫像構建的整體流程,可以概況為三個部分:
第一,基礎數據處理。基礎數據包括用戶設備信息、用戶的線上 APP 偏好以及線下場景數據等。
第二,畫像中間數據處理。處理結果包括線上 APP 偏好特徵和線下場景特徵等。
第三,畫像信息表。表中應有四種信息:設備基礎屬性;用戶基礎畫像,包括用戶的性別、年齡段、相關消費水平等;用戶興趣畫像,即用戶更有興趣的方向,比如用戶更偏好拼團還是海淘;用戶其它畫像等。
在個推用戶畫像構建的過程中,機器學習佔據了較為重要的位置。機器學習主要應用在海量設備數據採集、數據清洗、數據存儲的過程。
三、用戶畫像能做什麼?
用戶畫像常用在電商、新聞資訊等 APP,幫助 APP 打造內容精準推薦系統,實現千人千面運營。
基於用戶特徵的個性化推薦
APP 的運營者通過個推用戶畫像提供的性別、年齡段、興趣愛好等標籤,分別展示不同的內容給用戶, 以達到精準化運營。
基於用戶特徵指導內容推薦
基於用戶特徵指導內容的推薦是指找到與目標相似的用戶群,利用該用戶群的行為特徵對目標用戶進行內容推薦,具體過程如下圖:
在這裡,我們需要解釋一下其中所涉及到的相似性建模技術。相似性建模可類比於聚類建模,它是無監督學習中的一種,它指的是尋找數據中的特徵,把具有相同特徵的數據聚集在一組,賦予這些聚集在一起的數據相同的特徵標籤,從而給這些具有這些特性的用戶推送相同的內容。
這種推薦方式的優點是,它的自有特徵是經過 APP 長期積澱而來,顆粒度更細,適用性更強,對用戶的認識更全面,效果能持續提升,而且它還能針對 APP 所處行業與自身需求,量身定製匹配演算法,讓推薦更精準。
此外,如上文所言,個推用戶畫像能夠結合第三方數據做定製化建模,通過雙方共同建模得出顯著價值和特徵標籤,依據不同標籤向用戶推送不同的內容。這樣不僅能保證推送的內容更精準,覆蓋面也更廣泛,而且標籤增補的方式,也可以很大程度上提升流量價值。
四、開發者如何接入?
個推用戶畫像 SDK 的接入主要有兩個方式:
SDK 集成:客戶端集成個推用戶畫像 SDK,進行初始化 SDK 後,返回給客戶一個 ID 即 GIUID(唯一身份標識), 此 ID 需要由客戶端提交到客戶伺服器,然後伺服器通過 API 介面傳入 GIUID 進行查詢用戶畫像標籤數據。
API 介面調用:客戶將應用名稱、包名及服務端出口 IP 提供後,返回 APP ID 等相關信息。客戶根據《個推用戶畫像數據服務介面文檔》及《用戶畫像編碼表》集成測試後方可調用 API 介面查詢畫像信息。
具體的集成文檔參見以下鏈接:
Android:http://docs.getui.com/gexiang/start/android/
iOS:http://docs.getui.com/gexiang/start/ios/
服務端:http://docs.getui.com/gexiang/start/server/
TAG:InfoQ |