當前位置:
首頁 > 最新 > 趙輝華:小米的億級大數據應用

趙輝華:小米的億級大數據應用

來源:至頂網安全頻道

2018年7月10日-12日,2018中國大數據應用大會在成都召開,大會以"大數據賦能數字中國"為主題。由成都市人民政府指導,中國大數據專家委員會、中國電子信息產業集團有限公司中國電子學會、四川省經濟和信息化委員會主辦,世界工程組織聯合會工程技術創新委員會(WFEO-CEIT)、成都市經濟和信息化委員會、成都市博覽局全力支持,中國電子器材有限公司、中國電子學會科技交流中心承辦,業內知名媒體至頂網與科技行者協辦。

大會現場,小米大數據產品總監趙輝華做了《億級大數據應用》的主題演講。他重點談到大數據在小米的典型應用場景,以及其在搜索推薦、新零售、消費金融和智慧家庭領域的眾多實踐。

小米大數據產品總監趙輝華

以下是趙輝華演講實錄:(內容根據現場速記整理,未經發言嘉賓確認,僅供參考,謝絕轉載)

各位領導,各位專家大家好!今天我分享的題目是小米的《億級大數據應用》。內容包含三個方面:是小米的業務和大數據積累,還有大數據在小米的典型的應用場景,最後是用戶都非常關心的隱私保護策略。

我們是從一個小的團隊慢慢成長起來,從一個小公司逐漸做大數據的一個歷程。在小米「鐵人三項」(硬體、新零售、互聯網)裡邊,每一個都有我們大數據的支持。

小米上市,資本市場在爭論小米到底是什麼類型的公司,小米應該跟哪個公司來對標,對它進行估值,它有一些互聯網的服務,有手機,有自己做的新零售的東西,還有硬體的一些產品,這對小米多元化的經營,對小米的公司定位來講會引起一些困惑。我們自己怎麼看,作為公司的技術部門,一個技術中樞我們是這樣定位,我們認為小米不僅僅是一個手機公司,雷總把小米描述成一個移動互聯網公司,我們也是一個智能設備的公司,我們還是一個新零售公司,它歸結到最後我們是一家數據公司。

對小米來講我們的三億的小米用戶,如果沒有小米的用戶那麼我們小米後續所有的業務來講都無從談起,所以對手機的硬體平台,具有入口具有流量的入口。在三億的用戶當中,我們有超過日活21個的千萬小米應用,這些都應用都沉澱在我們的雲服務中間,數據量的話,比如說像小米生態鏈,我們還有合併77家生態鏈的公司,當然現在這個數字要比這個大一些,具體數字是多少呢?我來之前跟我們公司的公關部門溝通過,他們的意見說最新的數字還是暫時先不要講。

對生態鏈來講有豐富的產品線,主要是圍繞家居產品來展開,我們知道有小米手環這個也是有千萬的級別。我們為了支持這些小米的業務和硬體業務,我們的雲服務在背後有了大量的成本和人力來建設雲服務。這裡邊給出的數字來講稍微陳舊一些,目前我們的總存儲量已經在兩百PP以上,遠遠超過兩百PP。

用戶產生的文件的數量大概有這麼多,對於小米的生態數據來講,有這麼多的生態鏈的數據,我們的多樣性的數據是一個特色,我們看到有來自手機端用戶使用的數據,還有圍繞智慧家居場景,日常生活彙集起來的數據,在我們看來是用戶通過小米的平台所產生的這些行為數據是我們後續在大數據建設的核心競爭力。這也是給我們大數據帶來的挑戰,怎麼把這些異構的數據,以及半結構化的數據整合起來一起來支持核心業務,這也是我們技術上面所面臨的挑戰。

為了支持公司的發展,我們大數據有這樣的規劃,現在的高級能力一般都成為AI,我們有一個高級AI層,B就是指大數據這一層,還有下面的基礎能力和基礎架構,是C,在雲計算這個層面,對於我們的這樣的技術團隊大多數的人力和資源都放在了基礎能力就是C這個層面。在大數據的業務中間,我們的工作來講主要是為了支持公司現有的業務,現有的核心業務,比如我們的銷售,我們的手機,我們的手機生產,還有剛才李傑老師提到一個觀點,如果雷總聽到的話他一定會非常支持,就是說品質革命。在過去的2017年,如果說整個小米只有一個核心關鍵詞的話,那就是品質,雷總對我們的要求也是說大數據在品質上面能夠為公司,為手機的生產,為手機的使用能夠做什麼貢獻,這也是我們團隊的一個主要的任務。

我在這裡介紹一下大數據在小米典型的應用場景,首先講一下大數據的全局搜索,我們現在已經有接入了16類的垂直內容,日均用戶量是1600萬,日均請求量是四千多萬,這也是在去年前年這兩年裡邊信息流裡邊發展非常快,小米的信息流的業務的增長速度也非常的快。

在新零售這個領域,在產品渠道方面我相信大家都會遇到一個共同的痛點就是在銷售渠道的串貨,在價格攻防戰裡邊是最頭疼的問題,小米剛剛進入的線下市場裡邊我們面對的挑戰也是這個方面,所以大數據我們會支持公司裡邊在對渠道管理,對渠道的串貨,亂價,刷機都做一些應對。除了這個之外我們還對用戶群進行深度的運營,對我們的品牌和售後體系的搭建來做支持。

在小米的大數據裡邊一個業務塊是現金貸,很多戶金做的是用戶來審核這樣一個體制,小米是因為手裡邊有大量的數據,我們預先會知道每個用戶風險,小米是通過邀請制,對他在信用方面狀況比較好的人的話,我們會給他推送邀請,所以小米在現金貸方面的逾期率和防欺詐方面是非常非常低的。在金融風控體系方面,就是在邀請方面,我們在還款的階段,催收這些方面我們都會對每一個環節來預控,我們會積累用戶的行為數據來判斷。

對金融業務來講,徵信數據是最重要的,對於小米來說我們是缺乏來自銀行的數據,我們也缺乏向淘寶的數據,我們的數據是來自低層,量非常大,它沒有那麼密集的基層的行為數據,所以我們大數據的任務就是把這些低價值的數據挖掘出來做金融業務,我們把海量的行為數據對它進行分析,對一個用戶來講他的行為模式裡邊有各種各樣的行為模式在手機平台能夠記錄下來,這些行為模式我們從中間通過機器學習的方式去尋找它與一個人的逾期風險,以及還款風險相關的特徵。

比如說我們所挖掘的數據,這個不是根據專家或者說是業務員發覺的數據,一個人手機裡邊的金融的數據,手機是30天不激活,同時手機裡邊他會在三個小時時間裡邊會幾台帳號上面有活躍,而且在排名前十名有包括三個的金融應用,我們就會看這三個特徵關聯性似乎是一個沒有意義的場景,但是我們的數據發現三個數據關聯起來的時候,就代表這個人的逾期和欺詐的風險特別的高,類似於這樣的發現我們做了很多。

接下來我們會跟金融團隊一起來配合,把我們的金融,所做的個人的應用,把金融服務整合到小米系統裡邊,包括像銷售,包括像它的智能設備的使用,包括與我們在,特別是與健康相關的智能設備,數據的採集和後續健康服務方面都可以關聯起來,來打造全生態的金融服務。

接下來就是大數據和AI,六千萬是比較保守的數字,我預計這個量應該是在八千萬或者是更高一些,這麼多的聯網設備在各個方面彙集了一個用戶全範圍的健康,跟他的行為方式相關的數據,在這些數據裡邊會構建千萬級的場景,我們對這些場景如何進行融合來建立用戶的行為模式,還有語音控制,交互等等這些都是具體的技術手段。比如在我們所做的智能助手的引擎是以語音控制作為切入點,你通過語音可以控制小米電視與各種智能家庭的設備,以及手機來做出互動。這個是由人主動操控的互動,在我們所理解的智能助理的生態裡邊我們更強調的是沉默交互,就是說對於用戶下一個動作,他下一個動作是做什麼,然後你事先我們的智能助理能夠預測到,預測到以後你就事先為他準備這個服務,這樣使人的體驗能夠大幅度得到提升。一個最典型的例子就是雷總剛剛發布的小米八,在這個裡邊我們根據用戶的使用習慣我們會預測他在接下來半個小時之內有可能會打開哪一個手機應用,我們就可以讓這個應用現啟動,同樣的邏輯我們也用在了智能設備的使用中間。

根據我剛才講的這些,大家會感受到新的能力的誕生,當然也會有人擔心隱私的泄露,小米是做系統的,不能像一些業界的互聯網公司一樣,他們的IP,有些互聯網是採集用戶的軌跡。對小米公司來說,如果讓用戶感知到我們在隱私方面有任何的漏洞,那麼大家可以理解這對小米來說這是災難,所以對小米的隱私控制來講是公司級別裡邊是最高級別的一件事情。個人的隱私來講是用戶不願意為人所知,對公司來講本身他的風險也非常大,在大數據的使用和隱私這樣的平衡中間我們的觀點是我們需要尋求一個平衡點,使用戶來得到數據分析,得到人工智慧對數據的好處,同時又不損害個人數據的保護,大數據的創新不能對隱私的擔憂得到停止。如何來實現這一點是今年在5月份剛剛發布的是歐盟的GDPR的這個政策,它與我們小米公司做的隱私保護的方面做的工作是一樣的,所以我們投入了大量的人力來做這個事情,GDPR是面向歐洲的,但是我們也逐漸地引入到中國來。

我們去年在評比中小米的隱私保護得到了業界的認可,排在了手機類的廠商第一位。小米在所有大數據的應用探索,目的只有一個,就是讓每一個人都能享受科技的樂趣。謝謝大家!

工業控制系統邁向開放 你想好如何進行安全防範了嗎?


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 金融界 的精彩文章:

恆大入股FF 新能源汽車再迎強勢玩家 巨頭紛紛加碼
姜超:貨基監管趨嚴 哪裡會是替代?

TAG:金融界 |