「AI學霸榜」世界名校十大學霸瓜分200萬AI獎金
【新智元導讀】2018年1月22日,10位來自世界名校的候選人獲得2017年度百度200萬人民幣獎學金,這10位「未來之星」主要專註計算機視覺、自然語言處理、機器學習、數據挖掘四大領域。新智元第一時間與獲獎同學取得聯繫,本文將詳細呈現學霸們的求學經歷和感悟,並獨家分享他們和自己的學術大牛導師的相處軼事。
1月22日,2017年度百度獎學金頒獎典禮在百度科技園舉行,10位來自世界名校的候選人平分200萬人民幣獎金。
經過從初選到答辯的層層選拔,來自清華大學的王奕森和林衍凱、北京大學的王雲鶴、復旦大學的吳昊、中國人民大學的陳師哲、哈爾濱工業大學的朱鎔、廈門大學的張飈、卡耐基梅隆大學的胡志挺和王小龍、麻省理工學院的李成濤榮獲2017年度百度獎學金。
百度技術委員會主席吳華、百度視覺技術部、人臉技術部、增強現實技術部總監吳中勤、百度校園品牌部主任李軒涯等嘉賓及往屆百度獎學金得主代表出席了頒獎典禮。
新智元以四大研究領域分類,分別呈現這十位「未來之星」對各自專業、生活的分享。
計算機視覺
王雲鶴(北京大學):
我在神經網路加速壓縮方面做了深入研究,提出利用離散餘弦變換將卷積神經網路預測過程中的卷積計算從空間域轉換為頻率域,在準確度只有輕微下降的前提下,預測速度大幅度提升、模型消耗的存儲大幅度降低。該方法極具創新性和實用性。
深度卷積神經網路壓縮這個課題非常具有應用前景,因為深度學習模型在大多數任務(例如圖像識別、圖像超解析度等)上的精度已經達到了落地需求,但是它們的線上速度和內存消耗還沒有達到落地需求。
然而,越來越多的實際應用需要用到這些深度學習模型,例如手機、智能攝像頭、無人車等。所以如何設計更輕便、更高精度的深度神經網路仍舊是一個亟需解決的問題。
陳師哲(人民大學):
人大信息學院直博三年級的學生,導師是金琴老師。我的研究方向是多媒體計算,通過多模態的語義分析實現更加和諧自然的人機交互,主要分為兩個方面:
1)客觀語義分析:根據視頻內容生成自然語言描述(video captioning),客觀地理解多模態視頻中的物體/動作/關係等等;
2)情感語義分析:多模態情感識別和理解(multimodal affective computing),通過不同模態分析人物的情感狀態從而更好地與人類交互。這些工作都是非常具有挑戰性的,我希望之後繼續深造,在這些研究課題上有更加深入的理解和突破。
這兩項研究其實都是介於基礎理論研究和實際應用之間的一個中間步驟,未來3年將和實際應用場景結合,例如,情感識別應用於廣告服務中提高廣告製作效率,在交互機器人中提高交互水平等。
王小龍(卡內基梅隆大學):
4年級博士生,我的研究方向是計算機視覺和機器學習。畢業 論文的方向是利用視覺數據的冗餘性進行深度學習的無監督學習和視頻識別。我的畢業時間還未 確定,往後的職業發展偏向公司的研究院或者高校教職。
卷積神經網路中的無監督學習還有很多可以探索的空間,尤其是在RGBD數據和視頻特徵方面, 可以更多的藉助無監督學習來提升識別效果。在視頻的網路模型設計方面,我們做了一次初步的 成功嘗試,但任然有很大的提升空間。
自然語言處理
張飈(廈門大學):
我叫張飈,來自廈門大學軟體學院,師從廈門大學蘇勁松博士,同時也受蘇州大學熊德意教授指導,現處於碩士三年級(最後一年)。目前我已申請出國留學,未來三年將在英國愛丁堡大學自然語言處理實驗室Rico Sennrich博士名下繼續從事自然語言處理,特別是機器翻譯方向的研究,所以現階段我仍然全身心的投入到學術研究當中。
我碩士階段的畢業方向是神經機器翻譯方向,通過設計更加高效的編碼器、解碼器網路結構來進一步提升現有系統的翻譯性能。至於往後的職業發展,雖然也有接觸過包括百度、騰訊、阿里、今日頭條等在內的幾個互聯網公司,我暫時還沒有完全想好,不過今後的發展應該依然和科研緊密關聯。
最近我們設計了一套全新的循環神經單元,採用最少的模型參數和最少的矩陣運算,在最基本的淺層神經機器翻譯系統上面,達到了又快又好的翻譯效果。
上述項目的難點在於,模型的運行效果通和模型參數以及矩陣運算次數之間通常是此消彼長的,如何尋找兩者之間的折中點非常困難。我們的項目組在這一方向付出了大量努力,也積累了豐厚的技術經驗,好在最終成功地找到了在目前看來最佳的設計選擇。相信我們的項目會給其他科研人員在設計新模型時帶來全新的啟示。
林衍凱(清華大學):
清華大學計算機系自然語言處理組,導師孫茂松教授,副導師劉知遠副教授,畢業論文方向《知識的表示、抽取與應用》。我認為目前自然語言處理技術發展的重要方向是如何將知識融入到目前的自然語言處理任務中,做到真正的理解。
博士生期間我認為我最大的收穫是認識到做學術並不僅僅是發表論文,而是可以做出真正有用有價值的工作。
在我博士生三年級下半年的時候,我開始研究自動問答,將其作為我知識應用的一個研究方向。選擇自動問答的原因是一方面自動問答(或者機器閱讀理解)是目前自然語言處理領域一個非常熱門的方向,另外一方面自動問答也是一個非常直觀可以對知識進行應用的一個任務。
在這個問題上,孫茂松老師和劉知遠老師對我的建議是希望我做出來的成果可以真正被使用,而不是簡單的幾篇學術論文。而目前大多數自動問答由於回答問題類型覆蓋率的原因很難被實際應用,所以他們希望我好好思考如何針對這個問題進行解決。
經過一段時間的閱讀論文,我認為根據問題檢索相關文本並對其進行閱讀理解來進行開放問答是目前自動問答的最好的解決方式。這種方法可以利用大規模的文本來提高回答問題類型的覆蓋率,使得自動問答可以趨近於實用。因此,我接下來應該會結合文本和知識圖譜,推出一個更加實用的問答系統。
胡志挺(卡耐基梅隆大學):
卡耐基梅隴大學(CMU)機器學習系博士生,導師是Eric Xing教授,Petuum Inc. Research Scientist and manager。 專註於研究結合深度學習與結構性知識(Structure knowledge)的機器學習框架、貝葉斯方法、大規模機器學習,及其在自然語言處理、醫療、計算機視覺等的應用。他的研究工作Harnessing Deep Neural Networks with Logic Rules獲評ACL 2016傑出論文。 他獲得2017 IBM Fellowship和2017 百度獎學金。未來希望同時推動學術前沿研究和工業實際應用的發展。
深度學習目前在很多應用領域都獲得很大突破和越來越廣泛的應用,但其問題也很明顯,包括對大規模標註數據的依賴、預測結果的不可解釋性、難以直接結合人類先驗知識和意圖(intention)等。
解決這些問題需要將結構性知識、領域知識與深度神經網路相結合,使神經網路中結合結構性偏差(structural bias),並調控神經網路的學習過程。該研究方向的進步將對幾乎所有的應用領域(智能醫療、對話、自動駕駛、法律等等)產生很大的推動。
機器學習
王奕森(清華大學):
計算機系博士4年級,目前正在美國喬治亞理工學院交換,正在趕各種 deadline。我研究工作主要是樹類機器學習模型,尤其是隨機森林模型相關的基礎理論和應用,以及樹類模型往深度學習模型上的遷移。
最簡單的樹類模型就是決策樹,它不僅簡單易懂而且計算效率很高。我們提出了一種統一的決策樹框架——Tsallis決策樹——來大一統了現有的決策樹演算法。針對組合決策樹模型,比如隨機森林,我們不僅提出了一種定量分析樹與樹之間相關性的多變數準則,而且確保了該相關性準則的無偏性、可解釋性和可拓展性。此外,我們還填補了隨機森林模型理論和實踐之間的gap,提出了具有一致性的隨機森林演算法,該演算法既有理論保證,也有良好的實際性能支撐。
目前還在探索一些想法,如何將樹類模型的優秀性質遷移到深度神經網路模型中去,為深度模型提供可解釋性、泛化性分析等。
李成濤(麻省理工學院):
博士四年級。現在還在博士漫漫長路上艱難前行,不過應該快要看到畢業的曙光了(笑)。我的研究主要是關於多樣性採樣方面的,具體來講就是在一個數據集中採樣出一些具有代表性的,沒有冗餘信息的一些樣本來代表整個數據集,比如一本書的梗概,一段視頻的剪輯等等,簡言之就是從大量信息中提取「乾貨」。
通過多樣性採樣,我們可以極大地減少處理數據的時間,在很短的時間內獲得較多的信息。我之前做過一些多樣性採樣的理論工作,主要是關於如何提升多樣性採樣的效率的。比如我們研究的一個比較典型的多樣性採樣的概率分布,Determinantal Point Process。它的採樣過程非常耗時,我和導師研究後通過使用馬爾科夫鏈進行採樣,在理論上證明了它的採樣效率要高於原本的方法,並且運用數值計算的技術(Gauss Quadrature),極大地提升了採樣效率。
數據挖掘
朱鎔(哈爾濱工業大學):
計算機科學與技術學院四年級博士研究生,師從李建中教授和鄒兆年副教授。我的研究興趣包括資料庫、數據挖掘和大數據,研究方向為圖數據分析技術。我的博士課題為多層圖分析技術研究。目前對於學術上興趣比較濃厚,準備在學術上有所發展,考慮聯繫海外高校繼續深造。
簡單來說,我們的研究解決了從多源的圖數據中發現有用知識的難題。多源圖數據不僅僅是對於多個圖數據的簡單組合,而是從一維到多維的有機擴展。因此他具有更加複雜的計算語義,同時對於演算法的效率也有了更高的要求,在語義定義、演算法設計和理論分析上都有很大的難度。
為此,我們針對這一方向進行了一系列系統性的研究。從橫向來看,我們針對多源圖數據多方面的性質進行了分析,針對一系列問題提出了高效、準確的演算法。我們提出了一種新的計算框架,稱為同步計算,在很多問題上相比以往的計算方法有幾個數量級的效率提高。
從縱向來看,我們的研究從基礎理論出發,而後到演算法設計,最後在落實到應用中去。我們針對多源數據稠密區域發現的演算法,在生物網路分析上取得了很好的效果。正在準備申請專利。目前我們正在研究解決的多源數據用戶影響力最大化問題就是一個來源於實際應用的問題。在社交數據上,這一問題的結果可以用最少的代價產生最大的影響效果,在廣告投放和服務推薦中是一個非常有用的工具。
吳昊(復旦大學):
導師孫未未教授,實驗室為移動數據管理實驗室。現在的狀態是一半從學術界脫身去工業界感受下人工智慧領域域學術界的區別。畢業論文將會圍繞軌跡序列建模任務進行展開。今年下半年開始找工作,往後的職業發展是在工業界打拚,從事與AI領域相關的工作。
現階段我所研究的是對城市人類運動行為所產生的軌跡數據進行建模的任務,目前提出了基於循環神經網路的一種適用於城市規模軌跡數據的軌跡模型,相對於已有的基於淺模型(shallow)的模型。
深度模型在當前擁有大量數據的情況下體現出巨大的優勢,建模效果遠好於已有的模型。對軌跡數據建立概率模型能夠支持豐富的應用,包括路徑推薦、異常檢測、缺失推斷、模擬生成、行為預測等,具有很大的研究價值和意義。
對於想要進入該領域的學弟學妹,有何學術上的建議
朱鎔(哈爾濱工業大學):第一,對於計算機的博士,數學能力的培養,怎麼強調都不過分。我的導師會給所有博士生一個必讀的數學書單,內容包括組合數學、圖論、概率論、博弈論、矩陣分析等等內容。
我認為,除掉生物信息等邊緣性的領域,從事核心計算機領域研究的博士生,沒有深厚的數學造詣,讀博過程會很困難。因為在問題建模、演算法設計和理論分析全過程中,都離不開數學工具。數學是一門抽象思想的學問。其實計算機的很多問題,都是數學的一個具體應用。數學工具的熟練掌握,會讓很多分析變得很簡單。
第二,就是珍惜時間。讀博不過4-5年時間,過的很快。我看到過很多讀博多年一事無成最後無法畢業的博士。既然決定走上讀博道路,就早做努力、珍惜光陰。我的導師要求我每周工作60小時(每周六天,每天10小時)。我認為這個要求並不過分。對於剛剛開始從事科研工作的人來說,勤奮是非常有必要的。
吳昊(復旦大學):六個字:多看、多做、多想。「多看」即保持文獻的閱讀,尤其現在AI領域發展極快,可以把paper當新聞讀物看。「多做」即不僅僅停留在閱讀paper的層面,可以嘗試去實現別人或自己提出的演算法,paper是不會把所有的坑給詳詳細細的寫出來的。
只有自己勤coding才會發現那些潛在的坑,一個一個解決後才會提升自己的能力。最後一個階段「多想」即多思考,僅僅看別人的文獻、實現別人的方法,永遠只能停留在複製別人工作的層面,作為一個博士生,需要的是創造,需要發明別人沒有想到的方法,而這就需要對問題的深入思考。
李成濤(麻省理工學院):對於想要進入領域的學弟學妹,不敢妄談「經驗」,只想說說自己讀博期間的一點感受:我一直覺得好的數學技巧和直覺是做出有影響力的工作的必要條件。數學不僅可以用來理解某個模型「為什麼好」,也可以幫助我們了解模型的局限性,然後設計更好的模型,做出更好的研究。所以我對學弟學妹們的建議是,可以多學一點數學。
王奕森(清華大學):首先,時間管理。博士科研時間大部分都是要自己安排的,科研和生活中的瑣事怎麼協調是一個技術活。一定要避免讓自己整天很忙,但又不知道在忙啥。
其次,多讀多看,除了自己領域的paper要多看之外,別的領域的文章也可以適時的多看一些,殊不知有一些idea就是來源於別的領域的。
最後,一定要耐得住寂寞經得起誘惑。
陳師哲(人民大學):科學研究不是隨隨便便的一件工作,研的意思是深入地探求,究是深究到底,研究就是反覆深入地去尋求事物的本質/規律,來解決問題。所以在反覆探索研究的過程中,我覺得最重要的是培養自己基本一些研究素養:求真與懷疑;獨立與自主;努力與堅持。這些品格的培養是進行好的科研工作的必備條件。
另外我覺得隨著各個方向的開源代碼工具和教程的普及,使得科研的進入門檻並不高,很多人即使對這些領域並不深入了解也能作出一些還可以的工作。這並不是一件壞事,整個科研領域的廣度在拓展。但對於專業的科研學習者來說,要更加有危機感,不要滿足於站在前輩們的肩膀上,而是要發揮自己的才能和積極思考,去開拓這個領域的深度。
林衍凱(清華大學):(1)可以通過閱讀經典書籍(如PRML、Yoshua Bengio《Machine Learning》、李航《統計學習方法》等)對這個領域的背景知識有一定的了解。(2)掌握一種深度學習工具(如Tensorflow、Pytorch等),能使用其實現和調試端到端模型、記憶模型等常用的神經網路模型。在學術生涯中,我們遇到的最多的問題就是模型不work,如何在遇到問題的時候迅速的確定是代碼實現的問題還是idea本身的問題是很重要的,可以極大地讓你在學術研究中少走彎路。(3)每天堅持閱讀Arxiv上的領域最新論文,了解目前學術界的最新動態(4)增強自己的英文能力包括聽說和寫作的技巧,在發表學術論文的過程中,雖然工作本身是否紮實十分重要,但是如何將自己的工作在論文中向大家展示也是一項決定你論文是否能被錄用的關鍵因素。
王雲鶴(北京大學):1.數學基礎知識,因為人工智慧領域有太多的問題本質上都是數學問題,如果自己的數學知識不夠充足,就會發現有些問題自己可以發現但是解決不了,非常尷尬。
2.編程能力,這個倒是計算機系必備。因為現在的實驗通常都需要建立在非常大的數據集上,所以如何高效的實現自己的代碼是非常有助於快速的驗證。
3.溝通能力,與老闆、與合作夥伴,良好的溝通能力會讓大家都心情愉悅,任務也可以快速高質量地完成。
4.自我調節能力,稿子被拒多次、連續趕ddl、失眠等,都是研究生面臨的最大問題,保持好心情和健康的身體。
張飈(廈門大學):師父領進門,修行在個人」,保持和導師之間的積極溝通,同時在平時自己多主動地下一些功夫。現在做科研和過去有很大不同,深度學習的發展使得各個領域的入門門檻普遍降低,而且網上都有大量的開源代碼和系統,所以提高自己的自主學習能力、獨立思考能力,積極閱讀論文、跑實驗積累經驗,對自己的科研幫助會很大的。
胡志挺(卡耐基梅隆大學):打好專業基礎(數學、機器學習等),關注最新學術和業界進展的同時,對經典的領域和研究方向也要深入學習,往往能從經典中發現不一樣的視角、和最新的研究碰撞出不一樣的火花。科研成果應更多注重質量而非數量。
學霸書單
朱鎔(哈爾濱工業大學):我平時比較喜歡閱讀詩詞方面的東西,比如《詩經》《漱玉詞》等等。我覺得博理工科士生不能光看專業性的書籍,也應該有一點人文藝術情懷。比如我導師就特別喜歡繪畫。我對於古詩詞很感興趣。我覺得詩詞是人心靈的傾訴,是交流情感很好的方式,也可以很大的舒緩平時學業的壓力。
吳昊(復旦大學):《ロスジェネの逆襲》中文名不知道怎麼翻比較合適(失落世代的逆襲?)。朋友特地從日本給我帶的,池井戶潤的書,也就是前幾年非常流行的半澤直樹日劇的原著小說作者,電視劇拍了第一第二卷,這本『ロスジェネの逆襲』則是該系列的第三卷,講的是第二卷結局半澤被下放到東京中央銀行的證券子公司(東京中央證券)里的故事,如同前兩卷一樣好看,劇情扣人心弦,推薦。
王奕森(清華大學):學術的話,Ian Goodfellow的Deep Learning,這是一本我覺得無論是入門者還是老手都能從中收穫你想要得到的知識的書,而且他online更新接收大家批評的方式讓這本書錯誤極少而且知識點也比較的新。
陳師哲(人民大學):《你今天真好看》:一本很溫暖治癒的漫畫。
王雲鶴(北京大學):莫言《生死疲勞》:類似背景下的書其實有很多,但是莫言老師的這部作品實在是令人耳目一新。
張飈(廈門大學):平時看的書不算太多,有空會看看《三國演義》,個人比較喜歡這種經典書籍,裡面所包含的人情世故、處世哲學、成敗得失總是讓人值得玩味,而且隨著個人閱歷的增加,每次閱讀都會有不同的感想,感覺很受用。
王小龍(卡內基梅隆大學):《Seeing Black and White 》(by Alan Gilchrist) 這也是別人推薦我看的書,從心理學 的角度探討光照和成像的一些問題。我們訓練了很多神經網路處理視覺問題,但其實對人為什麼 能看到圖像,為什麼能分清楚黑色和白色這個問題還是不知道的。
加入社群
新智元AI技術+產業社群招募中,歡迎對AI技術+產業落地感興趣的同學,加小助手微信號: aiera2015_1入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名-公司-職位;專業群審核較嚴,敬請諒解)。
此外,新智元AI技術+產業領域社群(智能汽車、機器學習、深度學習、神經網路等)正在面向正在從事相關領域的工程師及研究人員進行招募
TAG:新智元 |