淺談大家都看得懂的推薦系統
最近,我司的O2O營銷系統考慮做推薦系統,雖然不是我的功能,但是趁著放假,也了解了一下。
什麼是推薦系統?
隨著信息技術和互聯網的發展,人們逐漸從信息匱乏的時代走入了信息過載的時代。在這個時代,無論是信息消費者還是信息生產者都遇到很大的挑戰;對於消費者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對於信息生產者,讓自己的信息脫穎而出,受到廣大用戶的關注,也是一件非常困難的事情。推薦系統就是解決這一矛盾的重要工具。推薦系統的任務就是聯繫用戶和信息,一方面幫助用戶發現對自己有價值的信息,另一方面讓信息能夠展現在對它感興趣的用戶面前,從而實現信息消費在和信息生產者的雙贏。
這是我摘抄過來的一段話,對於推薦系統給出了比較簡單易懂的解釋。推薦的精髓在於,我想要的你都有,你給我的都是我想要的,其中,我就是用戶,你就是信息提供方。這樣完美的推薦的實現,還需要一些時日,但是終歸要到來,現在想來還是挺可怕的,因為可能機器比我更了解我自己。
推薦系統的冷啟動
本篇文章是寫給產品經理看的,所以說,我們不討論演算法,只說方法。
冷啟動在整個推薦系統中,是一個非常重要而又非常難的一件事情,推薦系統一般都需要在大量的數據基礎過後才能比較準確的進行推薦,而一個新用戶剛使用APP的冷啟動可能直接決定著這個用戶還會不會使用下去,所以冷啟動是一件至關重要的事情。
冷啟動在互聯網行業有著很多的通用的方法和經驗,可以讓用戶更快更優質的去冷啟動。那麼冷啟動主要關注的兩個方面是,推薦的內容是否全面和內容是否可靠有用。
總結一下方法如下。
第一、儘可能用用戶給你的信息,比如app music會選擇讓用戶主動選擇一些流派或歌手,根據選擇結果進行冷啟動,這樣會比較準確。這種方法在很多APP第一次打開時都會用到。推薦關注人或者主題,都是這種原因。
第二、用戶的社交信息比較重要,比如今日頭條13-14年的時候做過引導用戶微博登陸,登陸後會去爬取用戶在微博上的一些信息,比如發的動態、圖片、文章,贊過、轉發過的的內容等數據,通過這些數據進行分析,比如在微博上轉發了某個女歌手的新聞,就會知道用戶喜歡這個女歌手,這種數據比較真實也有延續性,也符合用戶最近的思維,這種數據質量比較好。
第三、有可能會涉及一些用戶隱私。某些應用會上報其他app的信息,可以了解用戶安裝了哪些app、app中傳遞了哪些信息,可以了解到用戶喜歡哪些東西,是喜歡遊戲、美食甚至是喜歡的內容風格,可以了解到用戶的喜好,用這些數據去服務冷啟動會更好。所以說手機信息這塊還是很有用的,手機廠商其實已經掌握了用戶的各種行為,但是有個缺點就是很多手機系統不會提供讀取用戶app安裝信息的服務。
最後、可以提供有獎徵集的方法,去收集用戶的年齡和性別,或者其他的社會信息,這是一種短平快的方法,但是這種方法需要提供什麼樣的誘惑,需要嘗試中去摸索可行性。
評論推薦
除了產品的推薦,在O2O中,用戶評論也是比較重要的,用戶去下線消費與否很可能會因為一條好的評論或者壞的評論而改變想法。對於評論,我們有兩點需要關注。
1、怎麼樣去識別一個優質的評論
怎樣從海量的評論中找到好的、優質的評論,我們可以從以下兩個方面來嘗試。
1)通過評論內容去直接分析。字數較多的、使用高級冷僻辭彙的一些評論質量相對較好,這部分可以通過演算法去識別出來。其中,需要去過濾掉有過多重複詞、違禁詞的評論。那通過這種方法可以去簡單去提取出一些相對有用的評論。
2)從一個評論的用戶屬性去出發。一般來說,哪些用戶會發表的評論比較高質量呢?
a.一種可能是學歷,我覺得學歷是一個相當重要一個點。因為學歷高的話你所使用的辭彙可能也會比較好,包括你的思考相對說完整性較好,而不會出現像小學生那種好好好、贊贊贊等這種相對來說比較水的一些評論互動。再來經過編輯篩選就更加方便了。
b.第二種就是我們可以通過一些歷史統計,比如說我發現他之前發表過一個評論可能得到點贊數都特別多,也可以幫助我們識別出來他現在發的一些最新評論是不是也是優質做一個參考。
c.第三種可以通過一個用戶他平時在我們平台上面的一些行為來確定。比如說一個用戶,如果真的很懂美食,那可能在我們這邊是相對活躍的。我們可以通過一些統計歷史性過於發現他活躍的一些特徵。提高一定的權重。
d.第四種,這種用戶本身等級都較高,在我們的平台,等級較高的用戶不管是文化程度還是收入都比較高,這類用戶的評論應該更加受到重視。
2、假如識別出來之後要怎麼給他們設置前置規則
確實很多評論系統會有這個問題,假如一個優質評論比較早發布的話,那他一直被置頂的幾率越來越高。
1)其實如果我們在演算法上面做一個衰減因子。當隨著時間衰退,這個因子變得越越大的時候。在打分上面,我們把熱度再乘以這個因子,那就會把這個分數拉低。這樣子一些剛剛上線了一些質量比較好的評論,在短時間獲得大量贊的評論,可能會超過之前的評論,從而排序會出現在更靠前。
2)另外,可以嘗試在評論區裡面開闢一個熱門評論區。由編輯精選的一些優質的評論,去不停地滾動,去嘗試推薦這些評論。比如說達到曝光量一萬的時候,或者達到一定的數值,這個數值可以是點贊數,也可以是其他的關鍵行為。如果他達到了我們的一個預期值。那他可以繼續留在這裡,再把一些不滿足的評論給踢掉,換其他一些優質評論上來。這樣子就可以保證有比較多的新增評論可以在評論區裡面不斷被曝光。而且如果他真的寫得好的話,其實可以他曝光之後可以得到持續置頂。這樣子也有助於整個熱門評論區評論的更新,以及內容質量的相對保證。
推薦系統的方面還有很多,小編還在持續學習中。
TAG:互聯網產品分析體驗 |