當前位置:
首頁 > 科技 > 好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

「日活三億?未免太膽大了吧?」

「我看靠譜,宿華這人說到做到。」

「你不會也成了老鐵吧?」

「那可不,我一直是啊。」

兩位坐在快手展台的參會者有一搭沒一搭的聊著。

6月18日加州長灘,計算機視覺和模式識別大會 (CVPR) 的主議程如期展開。

作為 IEEE 旗下最頂級的,在計算機視覺領域內最負盛名的學術會議,CVPR 2019 參加者人數突破了記錄。主席團朱松純教授透露,今年參會者超過了9,200人,突破紀錄。來自中國大陸的參會者更是超過了1,000名,加之美國本土大批華人研究員的參與,讓 CVPR 變成了亞洲面孔的海洋。

當日早間頒獎典禮上的各獎項更是被華人包攬。CMU 辛書冕為第一作者的論文摘得最佳論文獎;加州大學聖巴巴拉分校王鑫為第一作者的論文,先是摘得滿分,又獲得最佳學生論文獎;本屆大會的朗基特-希金斯基礎貢獻獎榮歸 ImageNet,由知名華人學者李飛飛、李佳等人參與的標註資料庫,最近10年以來計算機視覺領域的開創性研究。

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

儘管是學術會議,CVPR 同樣被工業界追捧,大批研究型公司發表重磅論文、設立展台和參會者互動。儘管 Google、微軟和 IBM 等知名公司佔領了核心位置,展館內的一個角落裡同樣人潮湧動。

華人蔘會者走近一看,發現這裡正是快手的展台。作為一家已經創立八年的公司,快手的產品在中國滲透程度令人難以置信,超過兩億人每天登陸使用,幾乎達到了中國手機上網人數的四分之一。在快手上,每天有超過1500萬條短視頻被製作和上傳,每天的累計觀看數更是達到150億。

快手給人以「魔性」十足的印象,用頗具創意的 DIY 內容和真實大於精緻的風格,收穫了全國人民的歡迎,作為一款互聯網產品的下沉滲透效應明顯,和其它同類社交產品形成了巨大的反差。

為什麼一家如此「接地氣」的公司,出現在了「陽春白雪」的 CVPR 上?

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

駐足於展台內的參會者,大多都是被一項十分「魔性」的 demo 吸引來的:

「遇見世界上的另一個你」 (Meet your doppelganger),是快手基於人臉識別、特徵檢索和大數據處理能力所呈現的一個趣味展示。參會者站在鏡頭前,留下自己的大頭照,系統就能立刻在快手平台上找到和參會者長相酷似的「雙胞胎」。每次拍攝,都能隨機到不同的快手用戶,但是面部特徵都差不多。

實際的效果令人忍俊不禁。一位參會者看著視頻開玩笑地表示:「這不是我失散多年的兄弟嗎?」

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

另一項展示「虛擬主播」,通過多模態融合人臉識別技術、肢體識別技術、手部動作識別三項AI技術,實時學習體驗者的每一個動作、表情,實現虛擬形象3D直播。

據現場工作人員透露,「虛擬主播」可以做出微笑、眯眼、吐舌頭等超過50種細微表情。實現虛擬形象直播,卻只需要一位用戶和一部自己的手機。

一位參會者說,虛擬偶像和直播的結合,讓他想起了初音未來。「這才是老鐵的未來啊。」

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

這些趣味展示達到了快手的目的,吸引到了不少參會者駐足。儘管快手的展台不是全場最大的,卻是18號當天下午最滿的展台之一,和有多篇口頭講解論文和 poster 展示的 Google 有的一拼。就連大會主席團成員之一的朱松純教授也來到了快手展台。

為了向前來參觀的科學家和研究員進一步展示快手的技術能力,快手機器學習負責人劉霽開始了自己的演講。

「CVPR 是一個學術頂會,在這裡發表的論文代表的都是最頂級的研究。然而很多在論文里性能很好的方案,在實際場景裡面卻無法應用。」

劉霽是快手西雅圖 AI 實驗室和 FeDA(商業化實驗室,命名來自於「老鐵」當中的鐵元素)的負責人。他表示,在座的參會者大多使用的是「千元機」——以美元為單位;而快手的用戶範圍更廣,許多用戶使用的是真正的千元機——以人民幣為單位。因此,如何在性能比較低的手機上把演算法跑起來,真正把 AI 賦能到每一個用戶,是他的團隊正在做的事情。

而這次來到 CVPR,劉霽和他的同事正是希望讓處在計算機科學以及機器學習頂端的研究者們注意到、了解到快手。

「我們是一家相對比較低調的公司,在技術上我們卻是追求極致的風格。這次是我們第一次在(學術)會議上主動發聲,借這個機會讓外界了解快手的正在做哪些技術,做的怎麼樣,」劉霽告訴硅星人。

在2018年初的 MIT 35名35歲以下創新者頒獎典禮上,劉霽作為得獎者第一次見到快手創始人宿華。幾番聊天后,劉霽說他跟宿華在對於技術的看法上達成了一致,比如都認為學術和工業之間有認知和方法論上面的斷層。

「比如在解決一個技術問題的時候,我們都認為應該先對問題有一個深刻認識,再去體系化地設計解決方案,而不是盲目上最新最 fancy 的技術,」劉霽說道,「這麼說吧,有些公司是運營驅動的,有些公司喜歡說自己技術驅動,而我認為快手是問題驅動的。」

加入快手半年後,劉霽發現最重要的技術問題之一,就是用戶設備的性能限制。

從 Vine、Snapchat,再到今天的抖音和快手,短視頻產品雖然形態大體不變,細微功能的迭代卻是持續發生的。誰的特效更美觀、有創意,誰的濾鏡嵌套更精準、實時,決定了用戶對不同短視頻產品的粘性。更好的特效、濾鏡,需要更強大的計算機視覺技術。但大比例用戶使用的千元機,讓優化特效和濾鏡的難度倍增。

劉霽團隊將模型壓縮作為工作重點之一,採取了 hardware aware(硬體感知)的思路,讓性能低且參差不齊的設備都可以完成實時的手勢、人臉識別、深度追蹤和視頻語義分割。相關論文《ECC: Platform-Independent Energy-Constrained Deep Neural Network Compression via a Bilinear Regression Model》得到 CVPR 2019 收錄。

「世界上的另一個你」和虛擬主播,都體現了快手在模型設計和壓縮方面的技術優勢。儘管這些展示只是為了體現快手的計算機視覺能力,未來它們有望給普通用戶也帶去更多的歡樂。

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

除了在快手領導西雅圖的 Y-tech人工智慧實驗室、FeDA 商業化實驗室(以及即將組建完成的第三個AI-遊戲實驗室),劉霽還在羅切斯特大學計算機科學系任教,主要研究方向包括機器學習、優化和強化學習等從學術到工業,他形成了一套跨界的新認知體系:

學術界往往崇尚把一個理論場景下的獨立指標提高到極致,而工業界更需要在大規模用戶的背景下解決綜合性的問題。比方說,學術界喜歡看到最優秀的演算法,而工業界需要針對問題場景設計一整套複雜的系統。

劉霽對硅星人表示,對於人才而言,快手的優勢主要在於有豐富的問題場景和廣闊的發展空間。「我們走的是一個務實的路線,用解決問題場景來實現技術對於人類的意義。我們鼓勵發表論文,但我們更希望論文是解決實際問題基礎上的副產品。」

隨著前幾年興起的中國科技創業浪潮逐漸消退,用技術改變數以億計人生活的機會越發難得。而成立八周年的快手,不但改變了中國短視頻行業,讓曾被遺忘的草根用戶獲得了表達和創作的平台,也成為了中國計算機視覺技術革命和應用創新的一支生力軍。

「我覺得工業界最大的優勢是效率高。比如我們很多實習生,短短兩三個月做出來的演算法就可以很快上線到產品里,對用戶產生實際的影響。我覺得這是快手對於人才最大的吸引力之一,」劉霽表示。

快手的「魔性」展示在 CVPR 上吸引了眾多參會者駐足體驗,讓他們在短短几分鐘的時間裡,從不食人間煙火的研究員變成了「老鐵」——原因不外乎此。

劉霽管理的三個實驗室,其總人數占快手員工總數不到1%。但就是這樣一群研究者,為服務全球兩億——即將要達到三億的用戶規模發揮著獨特的作用。

巧合的是,就在 CVPR 2019 正式議程召開的前夜,快手創始人宿華、程一笑突然向全體員工發布了內部信,明確提出了目標,在2020年春節之前實現3億日活躍用戶。信中也摒棄了快手過去低調、隱忍的風格,開始強調「變革」、「戰鬥」等詞語。釋放出了強有力的信號。

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

「看起來不錯的數字背後,我們看到了深深的隱患:在長大的過程中,我們的肌肉開始變得無力,反應變慢,我們與用戶的連接感知在變弱,」創始人寫道。

2018一整年,快手實現了6,000萬日活躍用戶增長;這個數字在2019年春節到現在的五個月時間裡又增長了4,000萬,到達今天的2億水平。

接下來半年再增加一億,的確膽大,絕非空想,前提是這家成立八年的公司恢復初創時代的熱情。

值得提及的是,宿華曾在去年表達過演算法背後需要價值觀指引的態度,和中美市場上一些明星公司和產品形成反差。

劉霽在接受硅星人採訪時透露,快手堅持服務基層草根用戶的普惠價值觀,在大量用戶產生交易需求的前提下,技術上雖然運用了許多先進的方法,比如推薦模型、強化學習等輔助廣告競價系統等,但仍然堅持相對更克制的價值觀。

「真正能夠賺到錢的公司,靠的不是技術,而是用技術去解決實際的問題,」劉霽表示,為此,快手接下來會在公司運作、產品迭代、技術突破和人才引進上都更加專業。

他說,希望能夠在 CVPR 以及今後的更多學術頂會上結識更多的「老鐵」。

好好的研究員,怎麼去了一趟CVPR都變成了「老鐵」?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 PingWest品玩 的精彩文章:

位元組跳動為什麼要做智能手機?
Facebook高管賈斯汀·奧索夫斯基將加盟Instagram擔任COO

TAG:PingWest品玩 |