當前位置:
首頁 > 最新 > 車品覺:數據驅動的產品是什麼?

車品覺:數據驅動的產品是什麼?

引言

上個月 B4B 應用挑戰賽加速周在 TalkingData 舉行,開幕式上車品覺老師做了演講,分享了他對數據共享、數據隱私、以及數據驅動的產品的看法。

1. 數據共享的困境和機遇

現在有很多人都在講深度學習。然而放在幾年前,可能中國任意一個頂尖公司的老總,即使像馬雲,也難以回答所謂數據驅動的產品是什麼。

今天大家看大數據和人工智慧井噴式發展,好像我們一下有了很多數據,可以做很多事情。但實際上數據還是不夠用的,打個比方說,你用 Google Map 開車導航是可以的,但是如果你想在地圖上知道,購物中心有沒有可用的車位,這個數據一般是沒有的。這個時候你發現數據其實永遠是不夠用。

數據這個東西,從很多年前從記錄的使命,一直到最近,它成為一個決策的助力甚至根據。我們經常講數據驅動的流程。企業也更重視對數據的「擁有」這件事情,但在我看來其實是沒必要的,比起擁有數據,知道如何獲取數據更為重要。不是說我一個人要佔住多少大量的數據,而是說,誰能有更多的渠道獲取數據,能把數據盤活,流動起來,才是新的機遇所在。

於是這裡就牽扯到一個數據分享的問題,你有數據,他也有數據,我們可能還要從用戶手裡拿數據,這個要怎樣才能做到呢?

這裡首先有一個方法問題,所謂「簡單」和「有效」的方法是不同的——比如說我想知道今天大家開不開心。簡單的方法可能是我讓每個人填表問你們開不開心然後收集;但你細想其實不需要,我拍一張照片來檢測每個人的表情其實就可以了。填表的話,可能還有一些組群偏向性的干擾。這就是說你收集數據前就要想好怎麼做才是高效的。

打個比方我在阿里巴巴的數據科學家有時候會徵詢我的意見,問某一個數據集能不能徵用,我會很難做抉擇,因為第一我不知道他們之間的關係能不能找到,第二具體如何使用,怎麼使用也是沒有定義好的。

另外就是隱私的問題。「後隱私時代」數據共享可以說是既強健又脆弱。比如說現在有很多的渠道都能獲取數據,像是臉書可以拿到你很多的數據,但是即使你拿到這個數據並不知道該怎麼處理。而且還有很多隱私和授權問題都沒有界定,就會很難處理。

2. 數據驅動產品邏輯

接下里我們來看一個典型的數據驅動的產品它的邏輯的環路是什麼。首先,收集用戶的數據,包括行為和路徑,然後根據演算法給出一個推薦的路徑,然後系統根據這個用戶洞察,最後實現優化。

第一步驟是收集個人的足跡,這個數據是基礎——生成洞察的基礎,有了數據餵養,你才有之後所謂個人化的推薦。另外一個意義就是根據別人的推薦系統或者說足跡來給他做推薦,優化體驗。

另外重要的就是要讓用戶可以相互發現,舉個例子,Facebook 的圈出好友功能就是為了有更多的交互。而且通過用戶自己的貢獻數據會更加完整,這個功能的效果是非常好的。所以作為開發者,釐清這個數據收集集成的機制是很重要的。

最後總結一下,作為一個數據驅動的產品的開發者要注意:

自動化實現和是否穩定的問題。尤其是最後這一點,如何能實現自動化非常重要,在數據治理的過程中,要讓流程更加簡化以及可持續發展。另外穩定很重要,穩定的底層結構和合作方的穩定合作都是你能不能持續、穩定地獲得高效數據的關鍵。

3. AI Building Blocks

最後我們來說一個 AI Building Blocks 的方法論。很多時候,有數據還不夠,如何轉化為真正的價值,你需要考慮方方面面的問題。

首先你要知道你的演算法,並且有一個優化的過程;其次你的計算能力是什麼,再加上你的人力成本,這些都是支出的大頭,是一定要考慮的。然後就是你的數據從何而來,已有的模型的架構是什麼,這個可以說是每一個做 AI Building 的人需要考慮的框架。

所有的這些環節優化,都是為了降低錯誤率,就像是我們都知道在醫療領域,AI 的應用幫助醫生診斷,這個環節的容錯率是很低很低的,你只有準確判斷,才能說有真正應用的價值。包括現在很火的無人車、計算機視覺這個領域,出錯的成本太高了,你只有不停地訓練,不停地學習,才能到達一個可以應用的層面。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

幼兒奶瓶怎樣選
廚房收納每一寸空間都有用

TAG:全球大搜羅 |