當前位置:
首頁 > 科技 > 用 t-SNE 演算法和聚類辦法來做市場劃分剖析

用 t-SNE 演算法和聚類辦法來做市場劃分剖析

無論你得基礎數據是來自電子商店客戶,您的客戶,小企業還是大型利潤和非營利組織,市場劃分分析總是會給你幫助你能夠洞察更多隱藏的寶貴信息,並給你帶來幫助,比如可以讓你銷售的更好。因此,使用高效的分析方式就非常重要。選擇好高效的分析方式,不僅僅能幫助你更好的了解你的客戶群,而且能夠在你定製你的優惠,廣告,促銷或策略時為您提供更深入的服務。讓我們先行用分類技術(即聚類,投影追蹤和 t-SNE )做一個簡單的效率改進實例。

由於您的目標可能是通過與特定的客戶建立聯繫來改善您的銷售,所以首先您需要把相似的人群歸屬到一類。由於不同的客戶群體的行為和反應不同,所以以自然不同的方式對待不同類的客戶。思路就是對每一個細分領域使用不同的策略來獲得更大的利潤。因此,我們需要完成兩個基本任務:

1. 確定細分的市場領域(即哪些人群應該分在哪一類)

2. 確定重要特徵(即哪些因素決定了客戶的行為)

在這篇文章中,我從技術的角度來關注第一個問題,使用一些較為前沿的分析方法。為了簡單展示,我將使用簡單的數據集,描述批發經銷商代理在不同產品類別的年度支出。如下圖所示,一眼看上去我們很難區分不同種類的代理商。

用 t-SNE 演算法和聚類辦法來做市場劃分剖析

這個困難的部分原因在於,我們的數據是多維的,但是從兩個維度觀察很難找到合適的數據結構。 在分析潛在的二維或甚至三維散點圖的所有組合時,我們很容易浪費精力。幸運的是,我們有一些機器學習方法,通過無監督學習來處理這個特殊的問題。

一方面,我會想到一些成熟的方法,如聚類或投影追蹤。另一方面,我們也應該嘗試下像 t-SNE 這樣的頂尖可視化技術。所有這些方法都可能有助於進行有效的市場劃分帶來利潤增長。

在我們的數據集中,我們使用二進位變數來標記銷售渠道(酒店/餐廳/咖啡館與零售)。設想我們沒有設定這個目標參數。那麼,我們仍然希望將客戶分為兩大部分,因為這些渠道明顯代表著和這些支出類別的一些因果聯繫。讓我們簡單地比較這三個選出方法,觀察哪種方法能夠發現更多所涉及的渠道中的隱藏信息。

首先,我們嘗試進行主成分分析( PCA )來減少多維特徵空間的維數。下圖顯示了使用 PCA 對我們的數據在兩個主要成分(即具有最高方差)的投影。 然而,這並不是很有用,因為我們仍然無法發現很好區分開的主要結構。如果我們沒有加入任何標註渠道的信息(在中間),我們將無法畫出綠點和藍點的分割線(左側)。然而, PCA 為我們提供了最大方差分量(使信息最大化),這就是為什麼這種維數降低技術一般可能是有用的。結果如下:(我們也進行了縮放)

用 t-SNE 演算法和聚類辦法來做市場劃分剖析

其次,我們將非常簡單的k均值聚類演算法應用於我們的多維數據,試圖發現一個隱藏的信息(在右邊)。 我們可以看到它做了一個很好的工作,因為我們手動設置搜索到兩個群集的數量。每個簇的質心大致對應於每個渠道的。 然而,只有約77%的代理商被正確的分配到它們所屬的渠道。(當然,我們無法在實踐中用未知的渠道標籤來衡量)。這可能看起來是一個很好的基準,但要常記在心,分割越有效,來自細分策略的潛在收益越高,因為你的目標更加明確。那麼我們如何提高我們的聚類效率呢?

我們利用現代非常流行的被稱為t分布隨機鄰域嵌入( t-SNE )的可視化方法。 它具有在高維數據之間找到合適數據結構和相關連接的極高能力,並且將數據集映射到二維平面中,讓數據可視化的工作變的非常方便。在最終生成的2維圖像上,t-SNE演算法將(在特徵空間上)相似的代理商靠在一起。儘管我們無法根據最終生成二維圖像對特徵做出結論,但我們絕對可以觀察到局部結構,即代理商劃分。為什麼不創建一個通道把多個聚類演算法和降維技術聯繫在一起呢? 在下圖中,您將看到應用於二維t-SNE圖的k均值聚類的結果。 匹配有效性增加了10%,所以我們有大約90%的客戶正確分配到了真正的渠道。所有過程中,沒有使用任何調整方法!

用 t-SNE 演算法和聚類辦法來做市場劃分剖析

t-SNE具有非凸目標函數,通過隨機初始化使梯度下降最小化。因此,我們需要多次運行t-SNE,並選擇合適的映射,來獲得在低維嵌入與高維數據的聯合概率之間的Kullback-Leibler發散的最小值。 在聚類方面,這可能會給我們帶來最有效的分割。我們通過運行整條管道幾百次,簡要地驗證了這種趨勢和一致性最大有效程度在90%:

用 t-SNE 演算法和聚類辦法來做市場劃分剖析

總而言之,用不同的聚類方法來進行市場劃分絕對是有價值的。 更重要的是,我們向您展示了如何通過把更多方法構造到一個管道中來提高聚類的有效性。請記住,我們這樣做是為了對目標市場進行更細緻的劃分,而每個細分都會帶來更高的利潤! 本文翻譯自:http://t.cn/RSjksgp

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 花火日報 的精彩文章:

如何選擇適合自己的電腦?大一新生組裝電腦指南
共享寶馬怎麼用 共享寶馬汽車使用方法
共享寶馬押金怎麼退?共享寶馬押金退款什麼時候到賬
齒輪邏輯難題91~100關攻略 齒輪邏輯難題第91~100關通關技巧
微軟收購雲計算公司Cycle Computing 強化Azure競爭力

TAG:花火日報 |

您可能感興趣

iOS 12 出現BUG:iPhone目前無法充電的解決辦法
十月更新版Win10安裝NVIDIA驅動報錯:2種辦法可以解決
iPhone XS 無法訪問 App Store 的解決辦法
LOL-FNC中單談對陣RNG:我們需要找個辦法阻止Uzi
Windows 10 系統內 IE 11 無法使用的解決辦法
癌症CAR-T免疫療法副作用大,現在有解決的辦法嗎?
MSI半決賽RNG豪取小組第一!FNC談話RNG:我們要想個辦法阻止Uzi!
Python數據分析與挖掘實戰5-1代碼錯誤解決辦法
iPhonex閃退黑屏解決辦法
FNC中單談對陣RNG:我們需要找個辦法阻止Uzi
Session共享的解決辦法
Win10安裝NVIDIA驅動報錯:可試試這兩個辦法
iOS11越獄後cydia無法聯網完美解決辦法
Dota2 DAC專訪S4:已經找到了擊敗VP的辦法 隊伍會有變化
電腦無法自動獲得ip解決辦法(dhcp服務無法啟動)
Electra工具總是跳出安全模式?有解決辦法!
iPhone 相機故障的解決辦法!
Skr,無線通訊干擾源分析及解決辦法
【翻譯組】NBA球員應對失眠問題新的解決辦法:Som飲料
7代CPU無法安裝win7?您可以試試這個辦法!