當前位置:
首頁 > 科技 > 拼多多 CTO 陳磊:「分散式 AI」給了我們一個超前的想法〡IF19

拼多多 CTO 陳磊:「分散式 AI」給了我們一個超前的想法〡IF19



作為一家零售企業,拼多多也在探索如何利用新技術,布局後流量時代,服務消費者。


2018 年以來,「技術落地」成為人工智慧領域討論的熱詞。


在諸多應用場景中,電商平台擁有不同人群、地域、維度的消費數據,是 AI 天然可以發揮作用的主流場景之一。從搜索式購物、效率型購物再到逛街式購物,用戶的消費習慣在改變,基於社交的應用場景變得更加重要。新消費時代,電商平台該如何利用 AI,有效實現技術賦能?


在 2019 極客公園創新大會上,拼多多 CTO 陳磊提及了「分散式 AI」。傳統互聯網平台更多採用「集中式 AI」,即把所有數據匯聚,通過演算法從數據里找到一定的模式,為單體消費者服務。這種方式卻面臨著一些困境,比如用戶對數據缺乏控制能力,數據所有權問題不夠明晰等。


通過分散式 AI 技術,能夠實現公有數據對所有用戶開放,演算法變得更加開源,可供所有用戶監督。這就相當於每個個體用戶擁有了專屬的智能代理。整個數據的決策控制邏輯將會重構。陳磊說,未來雲計算將成為像水電煤一樣的公共事業部,這就使得用戶重新獲得了對決策的主導權。

作為技術驅動的電商平台,拼多多利用 AI 技術分析用戶習慣,提高消費者與商品的匹配效率,實現「貨找人」的 AI 電商應用場景。對於拼多多的發展,陳磊表示,未來要花更多精力優化技術細節,更大層面依靠分散式 AI 策略。



以下是拼多多 CTO 陳磊在 2019 極客公園創新大會上的演講內容:


感謝極客公園,很高興有機會能夠和來自全國各地的創業者探討新技術和新理念。


大的創業場景每隔五年就會出現一次。從 2000 年以來,線上商業場景一直聚焦在搜索之上,有人會說搜索場景就是「人找貨」(人通過搜索的方式,去尋找自己想要的商品)。


電商行業本質上就是「流量×轉化率=銷售額 GMV」,在這個公式下,人被簡單的抽象成數字和流量,平台如果需要更多的流量,就要盤更多的貨,鋪更多的線上線下渠道。


自從 2004 年和 2011 年,Facebook 和微信先後誕生以來,互聯網的整體思維方式產生了非常明顯的變化,基於社交的商業場景不斷崛起,依賴搜索進行的交易比重不斷下降,本質上是因為移動互聯網和社交網路的興起。


當消費者的時間以碎片化的形勢呈現,興趣就變得更加隨機了。從原本帶有很強的目的性去參與搜索、進行購物,變成了興趣使然,在碎片化的時間,在逛的過程引發了興趣,產生了購物行為,這是一種新的使用場景。


在這種場景下,傳播模式發生改變,整個行業會朝著後流量時代過渡。在這個轉變過程中,技術作為第一生產力會發生根本性的革命,拼多多作為一家零售企業,也在不停的探索,尋找如何利用最新的技術服務消費者,提供更加匹配的服務模式,找到新的增長點。


今天的大數據流量平台是由五個部分組成的。第一部分:場景。即有一個使用場景,這個場景裡面有用戶,用戶在場景裡面進行活動,然後產生數據。因為有海量的數據聚集起來,就在平台里形成了大數據的數據倉庫。通過定型的計算能力和 AI 演算法,我們可以在數據中尋找規律。


在這裡場景驅動服務,服務帶來了用戶,用戶帶來了數據,數據經過 AI 和計算能力的處理,優化用戶體驗,而體驗又帶來了新的用戶增長。


比如說一個創業者忽然發現一個場景不錯(打車、外賣、電商),消費人群非常明確,有非常具體的需求,然後他就去搭建一個平台,提供一個服務,用戶進來享受服務的同時,留下來了數據軌跡,產生了數據,平台收集到這些數據就會建立幾套演算法,來優化產品體驗。


所以,重要的是用戶的數量越多,使用的時間越長,數據的積累就越豐富,後台的演算法在不同的數量級上,演算法的複雜程度、能力有本質的區別,所以演算法也在不斷提升,消費者的體驗也會更好。


換句話說,在這種模式下,大家拼的就是數據手機能力和規模,效率越高、規模越大,企業的競爭力就越強。


在龐大的數據驅動下,很多公司是試圖創造一個無所不能的 AI,記錄每一個用戶的行為模式,然後圈定模型,進行演算法分析,再把分析結果返回給每個消費者,大量用戶的多維度數據記錄下來以後,能夠對過往的生活軌跡、消費軌跡、出行軌跡、衣食住行等全場景的喜好進行全面分析,能為整個零售體系提供底層的數據支持。


對於企業來說,用戶已經不是單一個體,而是由多個表現組成的畫像,或者是一個高維的向量。對用戶來說,企業提供的服務,比用戶自我了解更精準。最經典的就是 Google CEO 說過的一句話:通過大數據的 AI,我們不僅知道你在哪裡,我們不僅知道你去哪兒,我們還要知道你想要幹什麼。


這句話聽起來很美好,但我們也看到這兩年大數據的平台都會遇到一系列的問題,我們來分析一下。


第一,場景。智能設備的數據搜集能力在不停增長,同時也意味著可能暴露更多的隱私,你開發一個 APP,你在搜集這個數據的同時,你所要承擔的責任就會越來越大。用戶要求這個不僅僅能夠有服務,但是又不能暴露我的隱私。


過去,說雲計算是 2B 的業務,是提供給企業來使用的,但如果去看過去 20 年或 30 年,整個計算框架,最早是主機,然後是小型機、伺服器,伺服器就進一步的抽象成了虛擬機,到現在的容器服務。


現在最流行的趨勢是,技術本身不需要配置伺服器、存儲、網路,純粹就是一個邏輯。你把邏輯上傳到雲端它就能實時計算,意味著未來雲計算不是一個 2B 的業務,而是一個 2C 的業務,就是每一個個體,都可以去抓一段開源的代碼,然後在網上為自己搭建一套個性化的服務。


這與剛剛前面說的,通過把大家的數據收集在一起,中央進行計算就有很大的區別。我們再看用戶,現在就知道服務很了解他們,但是我不知道它為什麼是這樣的,而且我也不知道,這種了解是應用在了正確的場合,還是用在了不正確的地方。


當用戶感覺對數據缺乏自主權,數據的所有權不明細,那麼數據到底是歸誰所有?是歸用戶還是互聯網企業?大家會在歐洲和美國看到,越來越多的法律在試圖做這方面的界定,對互聯網企業有越來越多的限制。


雖然我們做演算法,大家都知道深度學習很強大,在人臉識別、語音識別方面甚至可以超越人的性能,大家也知道有很多的問題,深度學習為什麼是這樣,是一個端到端的方案,中間的邏輯為什麼是這樣,裡面是不是存在著一些不合理的因素,很難分析出來。


面對一些消費者,多樣性的消費需求,你用一個固定的模型,及即使是一個深度模型去做,也很難判斷到底是不是合理的。我們的未來預期是什麼呢?我們想到了所謂的分散式 AI,在未來每一個用戶個體,配備有專署的 AI 演算法、計算資源,將會成為一個趨勢。



你可以利用現成的演算法、開源的也好、商業的也好,去搭建一套自己服務的體系,我們稱之為「AI 的代理」,當我們輸出自己的數據給這個代理以後,就會自動匹配私有數據和公有數據,集成到一個 AI 演算法裡面,並通過調用雲資源技術計算,去產生一個滿足消費者需求的結果。


在處理的過程中,保證完全封閉和隱私,並不需要和大家進行交互的過程。未來所有的演算法、數據和 AI 都能獨立地展現給每個消費者,每個人都可以利用自己私有的數據,自己希望的方式來獲得自己希望的結果。這也就意味著,整個數據和決策的控制邏輯會有一個根本性的改變,消費者在場景裡面可以更多的支配場景數據,深度優化決策。

所以就像剛才所說的,雲計算未來不是 2B 的業務,會是 2C 的業務,每一個個體都可以去調用雲資源,做一些優化我個體體驗的計算,就像水電煤一樣的,未來我可以輸出我這個月用了多少的雲計算做了什麼什麼事情,會有一個賬單,這是我們的未來。


用戶重新獲得了對自身服務行為的決策權利,就是相當於他有權利去決策我做的各種推薦、搜索結果,是不是真的滿足我的需求,而不是像現在這樣被動的接受。


我們數據本身會有一個明顯的分割,就是說公有數據和私有數據會有一個切割,公有數據意味著所有人都可以訪問,是公開透明的,私有數據是每個人自己保存,會有一個非常嚴密的容器保存這些數據。


從 AI 演算法方面來說,將來演算法需要給個體調用,我預期未來越來越多的 AI 演算法會是開源的,然後公眾可審核,將會更加的安全和公平。現在大數據強大的原因是它需要整合數億人的數據,去看溝通的模式,最後再去演算。如果每個人的數據自己保存,互相之間不透露,那麼有一個問題,比如我們看深度學習的前提條件就是要有足夠的樣本,那怎麼解決這個問題?每一個人都有自己的數據,他並不知道自己數據的個性和共性之間的差異,那麼怎麼辦?


我們有一個超前的想法,想像一下未來有一個智能代理程序,它為你做智能決策,保護你的私有數據,但是同時也會和其它智能代理程序溝通,就和人一樣。


比如我們去買東西,會問朋友什麼東西好,最近什麼東西比較流行,什麼衣服比較適合我。這是人和人之間的溝通,這種溝通的效率非常低,因為人的語言比特率非常低。那麼未來能不能有這樣的一個智能演算法程序呢?程序和程序之間可以進行通信,就好像今天的互聯網,手機、電腦之間其實也是在通信,只是通信的並不是模型,而是存的數據。



我們理解未來這種智能代理人可以通過信息的交換,擴展自己的能力,通過和別的代理進行溝通,擴展自己的能力以及決策的能力。比如說你看到一款商品上面寫著好友多次購買、好友好評的標籤時,就會提升你的信任感和判斷準確性。


所以這種分散式 AI 能夠幫助人以群分的消費群,以更加方便的方式互相學習,降低決策成本提高交易的效率,更進一步的是,當有這種分散式代理的時候,我們不僅能夠優化個體的體驗,我們甚至能夠反向去優化、製造,就相當於 C2M 這種優化的目標。


舉個例子,冬天到了,我們要買羽絨服,可能會有 50 個工廠會生產羽絨服,他們可能會準備半年的時間生產服裝投入到市場,有一些好賣有一些不好賣。最後就實現了優勝劣汰,但是也就意味著 50 家裡面有 1 個成功了,有了利潤,有 49 家有大量的積壓、資源的浪費。

但是,這種浪費其實就是市場競爭的代價,如果有了分散式智能,衣服到底生產什麼樣的款式、類型,能不能通過智能代理所築成的網路來完成,就像今天的股票市場一樣,股票的漲跌、價格的高低,就是通過買方和賣方瞬時產生大量的交易來完成的。


這就好像做一個模擬遊戲一樣,我們把不同的衣服款式,不同的花紋、式樣的數據都輸入到巨大的代理網路裡面去進行模擬,它能不能告訴我們到底需要什麼樣的產品,這樣我們就可以避免傳統的市場競爭帶來的極大的浪費。就是你要先生產然後去市場檢驗,當需求能被精確預測了以後,生產的廠家就可以提前安排生產周期進行備貨,庫存的剩餘也會有了很大的解決,不用再擔心賣不出去的問題。


從根本上來說,可以將理想化的消費需求聚集到同一個時間、同一個品類,為工廠提供更穩定的訂單,從而降低生產成本,實現了便宜有好貨。


最後我覺得分散式 AI 還能根據用戶本地的行為數據不斷地演,就是這個網路本身是在不斷演進的,每一個節點其實都是在不斷地優化自身的同時,也在提升整個網路的效率,通過高效、安全的方式,和其他的代理通信,為不同的消費群打造符合其自身喜好的定製化產品。


我們覺得,從未來的趨勢來看,我們的判斷是,AI 的演算法、框架將會是分散式的,將會是去強化個體的,而不是提供一樣東西去服務所有人。


而且,在零售變革之前,技術永遠是第一位的,所以說我們現在要做的事情,就是要不斷地優化演算法,不斷地增強對這種數據演算法的理解,從而為消費者提供多實惠、多樂趣的消費體驗,謝謝大家!


圖片來源:VPhoto



重磅嘉賓雲集的 2019 極客公園創新大會正在進行,



點擊下方小程序卡片,了解 IF19 現場的更多信息。



喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客公園 的精彩文章:

音樂公益,讓山區兒童重享缺失的精神關愛
雙屏、三攝、TOF,vivo NEX 系列創新背後的探索之路

TAG:極客公園 |