論文詳解：滴滴大數據預測用戶目的地，準確率超90％

新聞 08-14

雷鋒網 AI科技評論按：在KDD 2017中滴滴研究院副院長葉傑平所帶的滴滴團隊關於計程車組合優化分單模型和目的地預測的論文《A Taxi Order Dispatch Model based On Combinatorial Optimization》被收錄。雷鋒網將對這篇論文進行詳細解讀。

論文解讀

相比於在搜索引擎中找到一個想要的網頁，在茫茫車潮中匹配到一輛載你去目的地的車輛會更加複雜。因為網頁可以持續呈現一整天，甚至半個月；但車輛是高速移動的，乘客和司機的相對位置一直在實時變動。匹配的過程和方式也極其重要，在一個既定區域，乘客有很多，車輛也有很多，系統需要全局考慮區域內的需求、供給，以毫秒級的速度進行計算，實時地進行最合理的分單，最大化用戶的出行效率和出行體驗。

這篇論文中介紹在滴滴計程車中使用的基於組合優化的分單模型，該模型相較於別的分單模型，整體成交率得到了提升。此外為了進一步提高用戶叫車時的體驗，滴滴還開發了一個目的地預測模型，能在用戶打開軟體時，2毫秒為用戶推薦出他最可能前往的地點。目前這一功能的預測準確率已經超過90%。

1、分單時優化整體成交率

早期，計程車打車軟體的訂單分配主要聚焦在每個訂單與每個計程車司機的相關性演算法上。當一個乘客發起一單需求，系統會盡量匹配調度最近距離的司機，力圖讓接駕時間最短。然而此時往往會忽略到這些司機是否更適合其他訂單。

此前業界曾提出過一個基於多代理體系結構的新模型NTuCab，它的目的是最小化乘客的等待時間和接駕距離。這一模型會將每個代理視為一個計算單元，它會同時計算處理N個訂單和司機的匹配，但一個訂單只會匹配一個計程車司機。如果一個計程車司機拒絕該訂單，系統才會轉發給下一司機。

然而這些方法的調度時間往往偏長，成功率較低。對此，滴滴出行提出了新的組合優化方法。在這個模型中，一個訂單會播報給幾個計程車司機，當多個計程車司機收到相同的訂單時，最先搶單的人會獲得訂單。如果訂單未被應答，則進入下一輪播單，直到它被計程車司機應答或被乘客取消。而模型的目標則是最大化訂單成交率，從而確保司機和乘客的出行體驗。實驗數據也顯示，這一模型下打車的全局成功率比同類模型高出了4%。

在滴滴的模型中一個主要的改進是使用「整體」的概念，即會整體考慮當前時刻所有待分配司機和訂單群體的多對多的匹配問題。以成交率為優化目標，通過整體分配司機與乘客，提升乘客訂單的整體成交率。

模型的數學形式即：

其中，max(E) 為整個模型的優化目標，即成交率；g(a)≤0 為模型必須要滿足的約束條件，在這裡可能是一些業務規則，比如一個司機同一時刻只能分配一個訂單等；a 為模型的解，即如何對整體的訂單和整體的司機進行分配。

假設當前有n個待分配訂單，m 個待分配計程車司機，那麼整體的待分配訂單與待分配司機的匹配結果可以定義為一個m*n的矩陣A_m*n，其元素a_ij的含義如下：

其中，下標i代表訂單，j代表司機。考慮到每個計程車司機同一時刻只能播送1個訂單，那麼對每個司機，也就是每個j而言，其至多只能播送n個訂單中的一個，表現在矩陣中，就是對每個j的一列，至多只能出現1個「1」，其餘必須全部為「0」。即：

2、Logistics Regression模型計算司機接受概率

雖然對模型的目標和求解進行了定義，但這其中，還存在一個關鍵因素，需要考慮司機對訂單的接受意願。司機接受訂單的概率往往取決於諸多因素，如訂單的價值、接駕距離、方向夾角、行駛方向等。這些信息可以編碼成特徵向量x_ij。

作者用p_ij表示司機dj對訂單oi的接受概率，關於這個概率的計算，作者借鑒了計算廣告學中CTR預估的方法，採用logistics regression模型來進行計算。

作者採用日誌中的數據對logistics regression進行訓練，以司機是否接受為y，其餘特徵為向量x，訓練得到sigmod函數 y = 1/(1+exp(-w*x)) 中的權重向量w。將司機對訂單的接受概率與模型關聯起來，第i個訂單的成交概率即為：

這樣整個組合優化模型即為：

研究人員在北京進行了嚴格的AB測試，將該模型與另外兩種行業普遍運用的模型進行了比較，把成交率、平均接駕時長、訂單應答時長、取消率等業務關鍵指標作為核心評價指標。實驗結果顯示，該模型有更好的表現效果，訂單整體的成交率提高了4%。

3、預測目的地：循環正態分布下的概率計算

在寒風凜冽的冬天，讓用戶哆哆嗦嗦地輸入目的地，這個體驗並不算好。如果能夠在用戶發出訂單前，率先為用戶推薦他最可能前往的地點，往往可以大幅減少他自行操作軟體時間。

基於滴滴平台海量的歷史數據，研究人員發現，人們的出行往往存在一定的規律，用戶往往傾向在類似的時間到達相同的目的地；而對訂單的位置進行分析，也有助於精準推薦用戶的實時目的地。

基於這一觀察，研究人員使用了貝葉斯公式建立用戶目標的概率分布模型：

其中，T代表當前時間，D表示日期，（lat, lng）表示經緯度，表示目的地的可能性，X表示出發地的時間和經緯度。那麼剩下的問題是估計出發時間和地點 (經度和緯度)的概率分布：

而歷史數據分析顯示，用戶目的地的出發時刻的頻率直方圖往往呈現如下正態分布，於是研究人員採用正態分布對出發時刻T的條件分布進行估計。但如何估計這個分布的期望和標準差，這就成為一個需要思考的問題。

考慮到時間和經緯度的分布具有周期循環性，均值和方差不能用傳統方法來估計。因此研究人員使用了循環正態分布，建成一個優化模型，通過求解，得到了期望的平均值和方差。

這樣整個演算法的流程變為：首先根據用戶的歷史訂單，依次計算每個目的地對應的發單時刻的期望和方差；然後根據當前時間計算每個目的地概率的中間數據；第三步用貝葉斯框架計算每個目的地的概率；最後確定閾值，滿足閾值的就是研究人員要的計算結果：

Step1：根據用戶訂單歷史，估計每個目的地的發單時刻集合的平均值和方差；

Step2：根據當前時間，計算每個目的地的P(T|X_i)和頻率P(X_i)；

Setp3：計算每個目的地的概率P(X_i | T )

Step4：確定支持度閾值s和概率閾值p，對滿足閾值的予以首屏展示。

實驗數據顯示，這一預測模型明顯優於基線模型，這一模型下的預估準確率達93%，較基線模型高出了4個百分點。

雷鋒網註：

論文下載地址：http://www.kdd.org/kdd2017/papers/view/a-taxi-order-dispatch-model-based-on-combinatorial-optimization

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※如何管教AI的行為舉止？OpenAI早已開始研究，而這只是整個AI安全領域的前哨
※Waymo 再出奇葩專利，用「可變軟車身」減輕事故傷害
※無人零售已經不新鮮了，他準備用無人值守升級改造傳統洗車行業
※AI別笑，1v1的DotA比賽其實比圍棋簡單

TAG:雷鋒網 |

您可能感興趣

※極光大數據：滴滴日活超1300萬女性用戶佔比超40%
※核心晶元佔有率16個指標有9個是0，詳解背後數據仍看出希望
※【道聽圖說】2018數博會，大數據應用成果薈萃
※詳細解讀！2018大數據趨勢一文看懂
※時隔半個月小扎終於露面：數據泄露事件影響用戶數可能達8700萬
※吃雞大數據來了：《絕地求生》總銷量超2600萬套！
※將大數據收益回歸用戶，MDT項目用戶已達500萬
※2018年數據中心預測：智能工作負載和混合應用的興起
※FB泄露數據量超8700萬用戶數據或在俄羅斯
※2018年一季度中成藥產量數據分析及預測：產量累計增長9％
※絕地求生新版本大數據分析：M16輸的最慘，M4地位難撼動
※全球最大地標識別數據集問世：包含200萬張圖片和3萬處地標
※基於312個以太坊DApp的應用數據分析：區塊鏈距真正落地還有多遠？
※甲午大數據：你或許不知道的15個數字
※通脹數據符合預期穩定市場情緒標普500指數突破2800點
※價格倒掛1.26萬/㎡，四大行利率上浮10％，還另有3個數據正在測試你的買房意志力！
※萬達信息旗下項目入選「十佳大數據案例」
※人類行為預測：居住數據的分析和預測
※英偉達：業績再超預期，但預期打滿；強調數據中心算力革命，維持目標價280美元和「買入」評級
※印度特色？5000公里射程就算洲際導彈：僅憑雷達數據證明打中目標