360 集團副總裁顏水成談學界與業界區別：就像熱戀和已婚

新聞 12-26

雷鋒網AI 科技評論按：2018 年 12 月 17 日，由鵬城實驗室、新一代人工智慧產業技術創新戰略聯盟共同舉辦的「新一代人工智慧院士高峰論壇」在深圳隆重開幕。本次論壇將持續兩天，由 17 日的主論壇和 18 日的醫療專題論壇組成。論壇以「『頭雁』穿雲，雲腦啟智」為主題，邀請了多位院士、國內頂級科技企業技術負責人參加論壇做報告，論壇的重頭戲是院士 panel，多位院士將針對人工智慧現狀與發展的一些疑難問題展開討論。此次論壇匯聚了國內人工智慧領域頂尖專家，共同探討行業變革與技術創新、探尋 AI 邊界，是 2018 年人工智慧領域最值得關注的盛會之一。

360 集團副總裁、360 人工智慧研究院院長顏水成博士是 17 日下午主論壇第三位出場的嘉賓，他的演講題目是《視覺智能：從攻堅到閉環》。

360 集團副總裁、360 人工智慧研究院院長顏水成

他說道，360 公司如今的研發不再局限在網路空間，進一步拓展到了物理空間，而人工智慧當前主要聚焦打造四大人工智慧引擎：運動引擎、交互引擎、視覺引擎以及決策引擎。緊接著，他也為大家介紹了360-NUS聯合實驗室在視覺智能領域的最新研究成果——Global Reasoning Unit，這個模塊可插入任意網路，在淺層網路就能使跨區域進行信息交換成為可能。

同時，顏水成博士也分享個人在業界做研究的心得，他強調，學術界的研究和業界的研究有很大的區別，業界的研發必須回歸商業本質，尤其要放在價值閉環與數據閉環的維度上進行思考。價值閉環方面，技術需要對閉環中的產品、客戶、企業和社會產生正向推動，不然就有失敗的可能。數據閉環方面，由於不存在完美的演算法，因此我們只能依賴特定場景的數據來不斷優化演算法，進而優化產品模型。

最後，顏水成博士用一組有趣的比喻結束了報告：在學術界做視覺智能研究就像戀愛中的男女，而在工業界做研發則更像結婚後的男女。

以下為他的演講內容，雷鋒網 AI 科技評論做了不改變原意的編輯整理。

非常高興今天有機會在這裡做一次很特別的分享。我的背景比較特殊，我在學術界待了大概 8 年，進入工業界也已經有 3 年了，今天的分享包括兩方面的內容：一方面我想跟大家分享一個比較有價值的深度學習模型結構；另一方面我想根據我在工業界的 3 年經驗，談談對人工智慧研發，特別是智能視覺研發的兩點感悟。

360 的人工智慧布局

360的核心是安全，現在我們把安全的概念從網路空間拓展到了物理空間，在關注網路空間問題的同時，通過 AI 能力，把安全的能力從網路空間拓展到物理空間。

今年 5 月份，360 發布了 360 安全大腦。和視覺、語言不一樣，安全問題的數據標註需要頂級專家，人的作用是至關重要的，所以，安全大腦是一個人機協同的系統。2018 年上半年，360 的安全大腦對惡意程序攔截的次數，已達到了 400 億次；對於釣魚攻擊，在半年時間裡的攔截次數也多達 200 多億次；此外對安卓手機中垃圾簡訊和騷擾電話的攔截次數也非常高，比如半年時間裡對騷擾電話的攔截次數已達到 190 億次。我們可以看到它在這些方面的應用非常典型，而用戶的反饋也可以進一步增強安全大腦的能力：用戶用得越多，安全大腦也就變得越智能。

我在360主要帶領建立360 人工智慧平台，為公司的互聯網業務和IoT 業務全面賦能。總的來說，我們主要打造了四個引擎：

第一個是運動引擎，對於 IoT 來說，這是第一個非常重要的能力，能讓智能硬體在地面上進行智能運動；

第二個是交互引擎，這是國內很多公司都比較關注的點。以前，我們對遠場技術方面的關注並不是太多，技術主要以服務於 360 兒童手錶為主。交互引擎除了為360手錶提供支撐，也用於孵化新的語音類產品。

第三個是視覺引擎，我原來的研究方向以計算機視覺為主，這也算是我的老本行。當前，360 的視覺引擎主要分成兩塊：一塊是支持 360 的家庭安防生態，例如 360 最近發布的一款門鈴，它是實實在在地在滿足有中國特色的需求，比如當有外賣、快遞被送到家的時候，即使不在家，也可以通過語音的方式讓外賣員、快遞員將貨物放在門口，與此同時，這個門鈴還可以實時監控這些貨物；另一塊是對網上圖文、短視頻信息流的內容進行安全審核和內容結構化分析。

第四個是決策引擎，這是搜索引擎公司特別關注的一個方面。決策引擎主要根據用戶的歷史行為，來建立相關的決策模型，去預測將來用戶可能會對什麼東西感興趣以及會有一些怎樣的行為。360 對其主要有三個方面的應用：一是金融領域的控制和決策，上周五 360 金融已在美國上市，對於其風控的部分，360 提供了很多的支持和幫助；二是廣告，在過去這段時間，360 的廣告業務因為使用決策引擎的相關技術，在技術的性能方面有了多次明顯提升；三是推薦，通過深度學習的方法，推薦的效能得到有效提升。

個人研究心得

下面我分享一下個人在業界做研究的心得。

在學術界和工業界進行視覺智能研究，差別是非常大的。在學術界研究視覺智能，更像是一個個人攻堅的擂台賽，大家可能是針對某個具體問題、具體數據，去不停地設計新的演算法，從而提升其性能。但是在工業界，則更像是一個綜合的閉環的大戰略，研究已不僅僅是某個小團隊的事情，類似一個大戰役，你可能需要後勤、醫院，需要海、陸、空軍進行協同作戰，才能保證這場戰爭的勝利。所以我覺得在工業界做視覺智能研發很重要的一點，就是要回歸商業的本質，要把視覺智能研究放在價值閉環和數據閉環上進行思考和推進。

針對學術界，今天我跟大家分享 360-NUS聯合實驗室近期在視覺智能領域的一個最新研究成果——Global Reasoning Unit。我們發現有不少人在思考這個問題：當我們用深度學習做推理的時候，都是在用卷積神經網路進行推理，然而卷積神經網路在淺層網路無法感知遠處的目標。那有沒有一種方式可以在淺層網路就能實現很好的感知遠處目標呢？

由於我的團隊是 1×1 卷積的推動者，因而在想盡量用 1×1 的卷積方法來實現這件事情。我們有一個想法：是否可能在任意的網路插入一個模塊進行學習。為此，我的學生Yunpeng CHEN提出了一個思想，叫做 Global Reasoning Unit，將 5 個 1×1 的卷積以模塊的形式插入任意網路做學習，在淺層網路就能對遠處的目標進行感知，使跨區域進行信息交換成為可能。無論是在分類任務，還是在其他的檢測、分割任務中，這種方法都能有效提升現有網路的性能。我覺得無論是在手機端還是智能硬體設備上，Global Reasoning 都將會有不錯的價值，所以今天在這裡特別跟大家分享這個方向。

接下來我將針對工業界，跟大家分享一個研發需要注意的事項：在工業界做研發一定要回歸商業本質，必須將我們的研發放在價值閉環和數據閉環裡面，去不斷地思考和推進研發進度。

什麼叫價值閉環？我估計現場很多朋友讀過一本書，叫《創新者的窘境》，裡面思考的問題是：為什麼一些好的技術在大公司裡面並不能被很好地利用起來？其中分析到的一個主要原因是，這些技術對於技術創新者來說，可能是一件非常嗨的事情，但是對於產品方、最終的用戶以及生態中完成銷售環節的公司來說，可能並沒有帶來價值的提升。也就是說，當技術沒有給所在閉環中的其他維度帶來真正的價值，它的落地會非常困難。因此，在工業界做研發，我們的核心任務已不僅是「炫技」，還需要對所在閉環中的所有維度帶來正向價值，從而保證技術的落地和最終應用。

《創新者的窘境》這本書中提到了四個維度：技術、產品、客戶和企業。不過我認為做視覺智能方面的研究，還有一個非常重要的維度，叫做社會價值觀。當技術落地到一款產品時，如果它本身的社會價值觀不正的話，就不能產生正向的推動作用，這款產品遲早會失敗。因此，我將價值閉環分成了五個維度，其中，不同維度之間相互依存，並通過彼此的驅動來提升各自的價值。比如說技術和產品：新的技術孵化了新的產品，而產品收集了更多場景下的有效數據，又反過來推動技術的迭代；產品和企業則是相互促進的，產品質量和銷量的提升，可以提升企業的品牌和利潤，而企業品牌又反過來會帶動產品的銷量，同時企業賺取利潤後，會加大技術投入，從而提升產品的質量。而企業和社會價值觀則是大家更需要注意的一點：企業文化造就了社會價值觀，員工的價值觀也會影響企業的效率，其中最重要的一點是，企業永遠不能觸及倫理道德的底線。

另外，在工業界做視覺智能研究，尤其是做視覺智能相關產品的時候，數據閉環也非常關鍵。研究者可能更多地關注演算法模型，不過演算法模型和具體產品的後台與用戶的交互就形成了一個數據閉環，它是一個發現問題和迭代產品的過程。

為什麼要將研發放在一個數據閉環中呢？無論是做計算機視覺還是其他方向的研究，有一點是非常明確的——就是永遠沒有完美的演算法，在這種情況下，數據就變得非常關鍵。我常思考並與一些人進行討論的問題是：為什麼中國會出現這麼多做人臉識別的公司，並且這些公司都還生存得非常不錯？其中的一個核心原因是每家公司都具有特定場景下（如銀行、交通監控、公共監控等）的數據優勢，而正是這些數據能夠讓它們去不斷優化模型，實現特定場景下更佳的表現。用戶的反饋才能讓我們在研究中真正發掘他們真正的痛點和需求，因此數據閉環對於工業界的視覺智能研究至關重要。

我自己也感覺到，當我們將研發放入一個閉環的環境中，其所涉及的每個環節只有在穩定、可靠的情況下，才能讓演算法和研發人員去很好地推動技術向前迭代。再以 360 的門鈴為例，一旦服務端的產品聯網延遲問題嚴重，用戶很長時間才能收到家門口的監控信息，就無法獲得良好的體驗，另外如果 APP 的設計不夠好，雲端的數據分析結果就無法很好地通過 APP 讓用戶直接感受到這款智能設備所帶來的價值，進而也讓用戶難以產生有效的反饋，這樣的話，閉環的迭代也會變得異常困難。

無論在學術界還是在工業界，大家做視覺智能研究都還是挺辛苦的，經常面臨加班和熬夜，所以今天我想用一個比較輕鬆的方式來跟大家總結一下，在學術界和工業界做視覺智能研發的不同的特點：

在學術界做視覺智能研究更像戀愛中的男女，每一點進步都讓你們激動無比，同時還希望不斷地有新的進步，達到新的高度。看到的全是對方的優點，你們總是不停地憧憬，因為暫時沒人催你生孩子（產品）。你們也會憧憬生一個小孩（產品）會有多麼美好，認為這個孩子一定會是世界上最聰明、最乖巧的，因為反正不用真的把孩子生出來。

而在工業界做研發更像結婚後的男女，發現生娃（產品）成了你們最首要的任務。父母（公司老闆）天天催著你生娃（產品），你們以為孩子生出來以後會很乖巧，結果生出來以後才發現一堆的問題、一堆的毛病，社會（用戶）也不喜歡他/她，於是你不停地根據經驗和用戶反饋進行調教。最後孩子強大了，你頭髮白了，脊椎也壞了，但看著孩子（產品）還是一臉的滿足幸福。雷鋒網

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※驀然認知：對話交互助力未來出行，開拓「圍繞用戶」的商業新篇章
※IoT：阿里的第五賽道

TAG:雷鋒網 |