領軍AI的華裔女性——李飛飛
不久前,谷歌公布未來人工智慧新布局,整合之前零散分布並各自獨立於雲計算業務部的各個機器學習團隊,成立了新組織,並任命一位華人女性為新組織的首席科學家。消息一出,令業界震驚又興奮。
這位科學家名叫李飛飛,是當今站在金字塔頂端的科學家之一。她36歲就成為斯坦福大學終身教授,任斯坦福人工智慧實驗室和視覺實驗室的主任。她倡導的 ImageNet 競賽,每年都牽動著整個業界的心弦。她的高質量論文,在頂級期刊發表超過100篇,被引用高達4萬餘次。她入選「世界百大思想者」,被評為美國「年度傑出移民」之一(愛因斯坦、基辛格也曾獲此殊榮)。
從中國到美國,握住命運
李飛飛如今光鮮亮麗的背後,還有一段不平凡的早年人生。她1976年出生於北京一戶普通家庭,父母起的名字也極其普通:「飛飛」。 李飛飛出生後不久,一家人就搬到了四川成都。
當時生活條件不高,成都遠沒有今天繁華。但飛飛父母特別保護孩子的求知慾和好奇心,只要成都有展覽就帶飛飛去,儘可能擴大她的眼界,接觸更大的世界、更新奇的事物。同時家裡還有一條很有趣的家規:飛飛放學回家後只能在40分鐘內做作業,40分鐘後就可以看課外書、可以玩,幹啥都可以,但就是不能再做作業。父母此舉就是為飛飛養成專註高效的習慣,做事不拖延不左顧右盼,然後為自己留出充足時間,做自己感興趣的事。
有了濃厚興趣和好習慣的保障,飛飛從小學習就不錯,後來考進四川重點中學成都七中(今為成都中學,全國四所國家級示範高中之一)。
進入成都七中前途似乎就一片光明,然而這時李飛飛的命運卻迎來了重大轉折。為了夢想,她父親決定到美國打拚,後來母親帶她也去了美國。當時李飛飛僅16歲,陡然間進入一個語言、文化完全迥異的環境,如何適應生存下去,成為李飛飛面臨的最大障礙。
另一大障礙,就是沒有錢。李飛飛父母雖然都受過高等教育,但英語關過不了,無法從事類似於國內的好工作。迫於生計,父親成了照相機修理工,母親成了超市收銀員,勉強維持溫飽。因此除了上學,她還要儘可能補貼家用,課餘時間去中餐館、洗衣店打零工,去別人家打掃房子。打工和上學就成了她適應美國新生活的全部內容,最辛苦時一天睡不到4小時。
精英學霸,執著夢想
但在生活學習的重壓下,李飛飛從沒屈服。也得益於幼年養成的好習慣,不到3年時間,在1995年高中畢業時,李飛飛已經從聽不懂英語的移民「差生」,躍升至成績前5%、排名第6的優秀畢業生,而且她還以最高榮譽拿到了世界名校普林斯頓大學的錄取通知書,並且獲得普林斯頓提供的全額獎學金。這個優異成績連當地人都很難達到,為此當地報紙專門採訪報道了她。
1999年,李飛飛以優異成績獲得普林斯頓大學物理專業學士學位。當時美國就業形勢大好,華爾街正是牛市,而她獲得了華爾街的青睞,甚至高盛直接給出數十萬美元年薪錄取她。但是面對高薪又體面的工作,她卻選擇迴環境惡劣的中國西藏,去研究自己一直懷著濃厚興趣的藏醫藥。這個決定瘋狂又令人費解,但她得到父母支持,因為父母當初來美國就是為了實現夢想。
這個決定與她一貫以來的興趣、好奇心、求知慾有關。李飛飛從小好奇心很強,喜歡探求真理,對問題追本溯源,比如宇宙的起源、生命的意義。她渴望擁有這種智慧,夢想通過學術研究造福人類,通過科技改變世界。雖然本科學物理,但她對藏醫藥的濃厚興趣不減,希望能從科學、哲學層面,來研究此神秘領域。
於是接下來整整一年她都呆在西藏,克服高原寒區各種困難,毫無怨言,愉快地融入當地生活醫療,進行藏醫藥研究。這段經歷對李飛飛影響很大,長久以來,西方的科學方法論和哲學思維佔據學術界的主導地位,而以藏醫藥為切入點(之一),她體會到整個人類思想寶庫中完全不同的另一面,對於突破西方哲學、科學的方法論大有裨益。
研究冷門,依舊夢想
從西藏回來後,李飛飛沒有進入職場,而是選擇攻讀研究生。在父母支持和自己辛勤努力下,李飛飛拿到了加州理工學院電子工程專業的博士學位,具體研究方向是人工智慧和計算神經科學。這絕對是一把炙手可熱的金鑰匙,當時無數人趨之若鶩的諮詢公司麥肯錫也向她拋出了入職的橄欖枝。
然而這一次李飛飛又拒絕了,轉而選擇進高校任教做研究,堅守自己以學術研究造福世界的夢想,不為金錢不為地位,也不為環境所迫。不僅如此,在高校工作時她再一次做了「驚人」決定——專攻計算機圖像識別技術。這是當時的冷門研究,冷門到其他教授看不到結果,認為拿不到終身教授,都不願與之合作。
通俗地說,計算機圖像識別就是讓計算機認出任意一張圖片里包含的內容。比如讓計算機認貓,那麼首先告訴計算機,貓是圓臉、胖身子、兩隻尖耳朵和一條長尾巴構成的東西。然而現實生活中,單單貓的品種就有成千上萬,就算同一隻貓,也可能擺出上百種不同姿勢。如果遇到一些骨骼清奇的貓,換個姿勢可能計算機就傻眼了。當時,圖像識別技術已發展了20個年頭,但計算機能夠識別的物體也不過十幾種。大千世界何其多樣,區區這幾種物品遠遠不夠。
堅守不懈,成就夢想
面對圖像識別如此匱乏的「辭彙量」,李飛飛卻有瘋狂的想法。她不僅毫不退縮,還「異想天開」拿出字典,要讓圖像識別涵蓋到字典里每一個詞條!
最終確定的方法很原始也很簡單,就是像人類嬰兒識別貓那樣。人類的眼睛就像一架生物照相機,每200毫秒就能獲取一幅圖片。嬰兒從未被灌輸貓的特徵,卻能很快認出貓,無論什麼品種什麼姿勢。
因此李飛飛開始訓練計算機,讓它看更多圖片。2007年起她在網上下載了近10億幅圖片,然後給它們分類、打標籤,建立題庫為計算機看圖訓練而用。由於工作量太大,幾個月後研究經費幾乎用光,而且照此進度需十幾年才能完成建立題庫的目標。在最困難時,李飛飛想過重操舊業開乾洗店籌集經費,但從未想過放棄。
當大家一籌莫展時,美國最大電商亞馬遜的眾包平台幫了大忙。通過眾包平台,李飛飛在網上僱傭了167個國家共計5萬人,給10億張圖片篩選、排序、打標籤。2009年時題庫就包含了1500萬張圖片,涵蓋2萬多種物品。最後,這個題庫發展成今天大名鼎鼎的ImageNet資料庫。
更可貴的是,ImageNet如此龐大的圖片數據是免費的。它向全球開放,所有致力於計算機視覺識別技術的團隊,都能從它裡面直接拿「試題」,訓練自家識別技術的準確率。如今計算機識別的錯誤率已經從28%降到3.6%,比人眼識別錯誤率5.1%還要低。這都要歸功於ImageNet資料庫以及李飛飛團隊的努力。
夢想點亮未來
計算機圖像識別,是人工智慧領域至關重要的技術,也因此「李飛飛」這三個字如今是AI界無人不曉的名字。
計算機的圖像識別目前還只是用於識別衣服品牌和人臉,只能給人類一點輔助性幫助,而未來計算機將學會如何理解圖片,即自行學習,能像真正的人類一樣去看待世界。屆時,計算機將賦予視覺智能,為後世子孫創造更美好的未來。
所有這些AI研究,都是為了最終服務於人類,就需要學術和產業有效結合。為拉近AI研究與人類日常生活的距離,也為了使AI更接地氣,或許就是因此李飛飛走出實驗室加入了谷歌。
現在,這點陣圖像識別領域的領軍人、人工智慧頂峰的科學家、美貌與智慧並存的華裔奇女子,執掌了世界上最負盛名的谷歌AI產業,她會帶來什麼樣的AI前景,又會把人類帶到什麼樣的未知領域?我們翹首以待吧。
TAG:大科技雜誌社 |