當前位置:
首頁 > 探索 > 為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

下面的情景我們都經歷過:你剛剛在某寶瀏覽了某品牌的奶粉,轉眼就能在另一個資訊APP和它來一次驚喜的偶遇;你剛在微信里和人談起你要去泰國旅遊,馬上就能在朋友圈裡看到機票廣告;你剛給家裡打個電話說要給老爸買一個代步車,馬上四處的廣告位都會蹦出來某某代步車的靚照。這些廣告都是怎麼出現的?為什麼這些APP知道你心裡在想什麼?面對這疑神疑鬼的數字生活,有必要做出揭秘。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

在這個大數據的社會裡,大數據比你媽更懂你,然而卻不如你媽愛你。平台當然不會去竊取你的個人隱私,更不會監聽電話,只是你的行為讓大數據引擎意識到了你想要嬰幼兒奶粉。像這樣的數據痕迹你每天都會貢獻,只要你上網,只要你瀏覽,你就在貢獻數據,大數據就能發現你的所思&所想。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

到底是不是這麼恐怖呢?我們一起來看看平台是如何「扒竊」你的心思的。不管是什麼APP,在使用之前都要進行註冊。填完姓名、手機號碼或者所在地、性別等一大堆基礎數據之後,再同意一個《隱私條款》,點擊註冊,然後這些信息就被乖乖交給別人了。當然,這些數據只能是基礎到不能再基礎了。如果把你的所有信息比作文件夾,這些註冊所填信息只能算是文件名,可以叫做。而同意《隱私條款》則相當於訪問權。接下來,平台就可以「為所欲為」了!

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

互聯網之所以強大有用,就在於它的互聯互通性,在互聯的網路里你的行為會組成一個行為標籤矩陣,這些是要處理的數據源頭。包括你的消費記錄,消費習慣,瀏覽時長,打車習慣,關注的網站和媒體號,購買或者下載的遊戲,是否購買過保險,甚至是發過的紅包......這些行為都會被記錄成為幾千個事實標籤,假設暫且儲存在你的隱私文件夾之中:可以稱作是。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

搜集事實標籤並不是難事,關鍵是在這堆雜亂的數據中建立數學模型,也就是實現大數據分析。這一個步驟很像是數學建模比賽中的建模階段,需要通過一個合理的建模過程以及合適的演算法來對數據進行處理。對於需要估計出個人偏好的事實標籤來說,這個過程就叫做偏好估計。從這些雜亂無章的標籤中找到你感興趣的,最後構建用戶畫像。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

而演算法模型的建立更像是一個Excel數據處理文件,我們就把它叫做。而這些演算法有很多種,而且很多都是機密性質的,我們暫且用開源的基礎演算法稍作說明。

舉個例子,你在網上衝浪時,點開了一篇和美女標籤有關的文章或者圖集,但點開不意味著喜歡,也有可能是誤點,所以接下來就要通過多個行為角度來判斷你是否喜歡美女。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

比如下面這個非常初級的內容喜好權重演算法:


興趣標籤( 美女 )權重 = 行為權重 x 訪問時長 x 衰減因子

行為權重:什麼都不幹 1 分,評論 + 0.5,點贊 + 0.5,轉發 + 2,收藏 + 1

時長權重:10S 以內權重為 0.5,10S-60S 為 1,60S 以上為 2

衰減因子:0 - 3 天內權重為 1,3 - 7 天權重為 0.85,7 - 15 天權重為 0.7,15 - 30 天權重為 0.5,30 天以上權重為 0.1

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

行為權重是指你在瀏覽這篇文章的時候有沒有點贊、轉發、收藏和評論等行為,這些行為會對於一個分值,累加形成行為權重;時長權重用來量化你的瀏覽時間,在一定的時間區間內會對應相應的分值,點進來就退出那意味著時間權重趨於零,因此標籤權重也會為零,演算法判斷出誤點;最後,短期的閱讀無法代表長期閱讀,如果只是瀏覽一次,也會有衰減因子來進行模擬。對於上邊這個演算法,還要進行進一步的處理——將多中興趣權重標準化。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

具體的,在你每次瀏覽美女標籤的內容都會經過上述演算法生成一個興趣權重,把一段時間的興趣權重累加得到標籤變數,然後再用BP神經網路中的log-Sigmoid函數進行標準化,可以得到一個有意義的興趣標籤值,這裡取[0~10]區間。數值越高,意味著你對美女越感興趣。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

至於S型函數是什麼,大家有興趣可以自己學習一下,這個函數的目的就是用來求出多組相同數據(BP神經網路中叫神經元)的總和、目標值以及誤差,相當於提取價值數據。再回到興趣標籤,除了內容興趣,這種處理演算法思路還可以處理消費興趣,社交興趣等等,計算出各自權重之後,在多維度建立起模型,進而表示出你的偏好。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

再進一步,這些代表你偏好的偏好標籤權重行還能夠進行用戶分類。假設你的美女興趣標籤的權重值是8,社交權重是2,消費能力是5,我們就可以建立起空間向量坐標,表示為R(8,5,2)。向量可以理解成一個空間固定指向的線段,非原點端對應一個坐標,就相當於是你的用戶定位。一般的處理辦法是,以此算出餘弦值和空間兩點點距離公式,把用戶向量坐標帶進球面坐標,就能夠找出和你相似的人,然後進行用戶分類。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

而對於性別和學歷等個人數據的估計則要通過對比法處理。把已知學歷和性別的用戶作為樣本,一部分來測試準確度,另一部分用來訓練模型,得到一個預測準確率高達90%的演算法模型,但具體的操作演算法就比較複雜了。總之,完成這些數據處理之後,平台就能得到一個用戶畫像,我們假設存在文件夾之中,可以叫做。這樣,一個可以查到消費興趣的消費者便被提供給各大廣告主了。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

在騰訊廣告開放平台的後台,我們就可以看到這一「盛況」。用戶的行為數據被處理到了出神入化的地步,而廣告主甚至可以自己選擇標籤進行精準投放,價格低到1.5元每千次投放。還人性化提供消費者數據篩選,可以精確到用戶去了幾次機場,打了幾次車。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

最後,當你有過奶粉的消費記錄之後,在某APP上即將瀏覽到廣告位的時候,平台後台就會發起一次廣告位「競標招租」,那些出價高的會在廣告位顯示出來。於是,也就有了文章開頭的那一幕。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

值得一提的是,現在還有一種偏向於同類用戶推薦的機制。通過行為推薦商品的效果往往會出現偏差,不如同類型用戶推薦來的準確。具體做法是,先把你歸類,找到和你興趣偏好一樣或者接近的人,把人家的瀏覽記錄或者商品清單複製給你,這樣的效果可能會好一點,但也不排除審美差異導致的「凌亂」。

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

需要再補充的是,平台追蹤你的瀏覽痕迹並不是只對應你的手機號碼,不信你試一試,即便你不登錄某寶瀏覽奶粉商品,在你刷到抖音的時候也會出現奶粉廣告。這是因為平台不止是對你的手機號碼進行對應,還與你的手機唯一識別碼綁定。這個唯一識別碼,安卓機叫做IMEI而蘋果機叫做IDFA。平台就是通過這個識別碼來完成精準投放的,畢竟精準投放需要一個唯一能夠代表你的東西。換句話說,你在廣告平台那裡就是一堆亂碼!

為什麼你的APP知道你想買什麼?數字生活讓人疑神疑鬼

不過,你也不用太過緊張,這些數據搜集並不會影響到你的隱私安全,更不會進行監聽監視。根據我國的《個人信息安全規範》規定,商業廣告商搜集個人興趣標籤應該嚴格依照相關條例,避免標籤精確到個人,以保護隱私安全。而蘋果用戶還可以自己設置IDFA識別碼許可權,哪個APP能夠訪問你的數據痕迹,你說了算!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技對角線 的精彩文章:

7nm華為鯤鵬920發布,伺服器性能到底提升多少?
驍龍845實現逆轉,反超麒麟980,華為無奈「認輸」

TAG:科技對角線 |