科技公司爭相湧進ICML 2017,論文數佔1/4,Google獨佔6.3%
ICML是國際頂級的機器學習會議,它與NIPS一起,是機器學習與人工智慧研究領域影響力極高的兩個主要會議。今年的ICML將於8月6-11日在澳大利亞悉尼召開,屆時雷鋒網也將前往現場進行報道。
早在5月時,ICML 2017被接受的論文就已經公布了。今年的ICML收到了創紀錄的1676篇論文,434篇被接受(也創下了新紀錄)。OpenAI的研究科學家Andrej Karpathy對這些論文作了分析,並發現了一些有趣的事。
根據分析,所有論文中共出現了961個機構名稱,其中420個只出現了一次。論文數前30名的機構如下:
統計中Google和微軟的論文數排在了前兩名,CMU排第三。需要注意的是,統計中Google、Google公司、Google大腦和Google Research都屬於一個類別,同樣的還有斯坦福和斯坦福大學。一篇論文中多個人屬於同一機構時會合併。
從這些統計中也可以看出,工業界發表的論文佔了不小的比例。Karpathy統計了一些比較知名的工業界實驗室的論文狀況,比如DeepMind、Google、微軟、Facebook、IBM、迪士尼、亞馬遜和Adobe,發現他們的論文占論文總數的14%。而如果算上其它不太知名業界公司的論文,他認為約20-25%的論文有公司參與。也就是說,ICML 2017的論文中約四分之三是完全來自學術界。
另外,由於DeepMind和Google可以算一家,加在一起它們共參與60篇論文,佔總論文的6.3%。
逐年分析這些論文可以發現,在2011年時很少有工業界研究出現在ICML上。而現在公司的參與有了很顯著的提高。不過學術界仍然做得很好,貢獻了很大一部分論文。
還有其它一些比較有趣的統計數據。
以第一作者身份論文被接受最多的是一位中國研究者朱澤園,他有5篇論文被接受。他如今在北美的微軟研究院工作。
對第一作者所在機構進行統計,排名前五的是CMU(25),Google(19),DeepMind(15),MIT(14)和UCB(14),可見Google的實力。微軟研究院以10篇排在第七。
純數量統計並不能反應真實的研究狀況,一個更重要的指標或許是論文被引用的情況,畢竟論文不是生來平等的。工業界與學術界內容被引用的情況如何,這點還沒有統計。
ICML也也是窺見機器學習最新趨勢的途徑之一。深度學習當然是重要的內容,但雷鋒網檢索標題發現,只有6篇文章含這一關鍵詞。其它出現頻率較高的研究領域還有:強化學習,隨機及高斯過程,嵌入(embeddings),貝葉斯優化,AutoML(用機器學習探索神經網路架構)等。
除了論文,ICML上最受關注的要屬每天的主題演講了。今年大會安排了四場主題演講,涵蓋了AI的前沿、應用和社會影響等方面。
四大主題演講
牛津大學Peter Donnelly
他演講的主題是:基因組學、大數據與機器學習:理解生命圖普,推動醫療革命。演講會通過具體的例子來說明,將機器學習和其他推理工具應用於基因組數據的機會和挑戰。
Donnelly是維康信託中心人類遺傳學研究室主任和牛津大學統計學教授,以及Genomics Plc公司CEO。他是牛津大學博士,曾任倫敦大學和芝加哥大學教授。他的早期研究工作涉及人口遺傳學隨機模型的開發,後來逐漸開發研究遺傳和基因組數據統計方法。他和團隊開發了多種廣泛使用的統計演算法,包括STRUCTURE和PHASE。他還領導了一個名為wWGS500的項目,在其中牛津大學與Illumina合作,對500名具有一系列臨床條件的個體進行測序,以評估臨床醫學中全基因組測序的短期潛力,這一項目也是NHS 100000基因組計劃的前身。
過去10多年,基因測序的成本呈指數級下降,而未來10多年,或許會有近10億人進行基因測序。海量的基因數據與個人的病歷信息和可穿戴設備信息的結合,將顯著提高我們評估個體健康風險、預測健康狀況以及做出個性化治療的能力。
哈佛大學Latanya Sweeney
她的演講主題是:AI設計者如何影響公民生活
作為哈佛大學政府和技術學院教授,Sweeney的使命是開發和運用技術,來評估和解決社會、政治和管理問題。她的重點研究領域是技術對人類的影響,她本人還是Technology Science總編輯 。她對數據隱私也很感興趣,是哈佛數據隱私實驗室主任。
她認為,技術設計者(Technology designer)是新的決策者。雖然他們沒有經過選舉,而且大多數人不知道他們的名字,但正是他們開發工具和創新時做出的決定,影響了那些能規範我們日常生活的代碼。 隱私和安全是新技術的第一個挑戰,而隨著技術的進步,生活的方方面面都會被重新定義。
DeepMind的Raia Hadsell
她的演講主題是:邁向現實世界的加強學習
她是DeepMind的高級研究科學家,在深度學習和機器人領域有10多年研究經驗。她早期的研究與用暹羅網路進行多學科學習有關,這可以用於不變特徵學習。她的博士導師是Yann LeCun,後來加入CMU的機器人研究所,以及SRI International。她在2014年初加入了DeepMind,開始研究通用人工智慧。她目前的研究側重於AI代理和機器人系統持續學習的挑戰。
深度強化學習已經迅速發展成為頗具潛力的人工智慧研究領域,大量的雅達利遊戲也被用於許多基礎開發的主要基準。隨著研究的成熟,更重要的是開發複雜的學習系統,以解決更複雜的任務。她屆時會介紹DeepMind的最近研究,這些研究與在現實世界和具有複雜任務結構的挑戰性環境中進行端到端學習有關。
馬克斯·普朗克智能系統研究所Bernhard Sch?lkopf
他的演講主題是:因果學習。
Sch?lkopf的主要研究領域是機器學習和因果推理。他將研究應用於許多不同的領域,比如生物醫學問題、計算攝影和天文學。他曾在AT&T貝爾實驗室和英國的微軟研究院工作。他是德國科學院的成員,獲得過國際模式識別協會的J.K. Aggarwal獎。
在機器學習中,會使用數據來自動尋找依賴關係,目的是對未來進行預測。大多數機器學習方法都建立在統計學上,當然也可以進一步分析數據在統計依賴性後的因果結構。Sch?lkopf認為,這樣的因果知識可以幫助在機器學習任務中做出預測。他在演講中也會提到因果模型對機器學習任務的影響,如遷移學習和半監督學習。
雷鋒網將在現場帶來ICML 2017的即時報道,敬請關注我們的後續文章。
※探索2050,卡巴斯基安全專家揭秘未來安全
※又有用戶把蘋果公司給告了!竟然是因iOS 6不再支持FaceTime功能
※谷歌G Suite又獲得大客戶,但還不能笑得太早
TAG:雷鋒網 |
※科技早報 – 15英寸Surface Book 2開啟預售、中國手機集體缺席MWC2018 – 20180301
※科技早報 – 今年iPhone入門價550美元、傳Facebook組建晶元團隊 – 20180419
※科技早報 – iPhone X Plus屏幕曝光、三星S9美國定價720美元 – 20180226
※教育科技初創公司Unacademy欲融資3000-3500萬美元
※最強千元機 魅藍S6/紅米5 Plus/360 N6 Lite 對比測評丨科技美學
※融360旗下簡普科技首份年報 營收漲306%增速超Lending Tree
※HONDA 2018年式「CB250R/CB125R」科技大解密
※2018最大科技股IPO?估值226億美元,Spotify提交上市申請!
※高陽科技擬500萬美元認購約243.4萬股Cloopen D系列優先股
※2018最大科技股IPO?估值226億美元的Spotify提交上市申請!
※孟買金融科技公司Rubique完成1500-2000萬美元融資
※科技早報 – iPhoneX比其他機型受捧、Facebook推出約會新功能 – 20180502
※輕奢+新科技,vivo X20Plus屏幕指紋版3598元值不值
※vivo X20Plus屏幕指紋版開售:3598元買黑科技
※農業科技初創公司Gramophone.in完成6400萬盧比新一輪融資
※硬科技領域投融資匯總|4.29-5.5,Kcash將給1億人次用戶免gas費
※科技6點半:iOS11.3來了 iPhone X將停產
※科技早報 – Facebook面臨生死考驗、蘋果2018年研發資金將投140億美金 – 20180319
※華為Mate11重磅黑科技曝光,Mate10跌至74元震驚世界!
※LG 2018旗艦G7 ThinQ將發布,揚聲器有黑科技