當前位置:
首頁 > 科技 > 谷歌街景攝像頭迎來重大升級,Waymo 亦將受益海量高清數據

谷歌街景攝像頭迎來重大升級,Waymo 亦將受益海量高清數據

谷歌街景影像採集車的新攝像頭使得圖像更高清,因此,提取到的信息也更可信。這不僅能讓新的谷歌軟體產品更加理解這個世界,也為公司的自動駕駛技術實力再添重要籌碼。

編譯 | 高靜宜 王藝 邱陸陸

作者|Tom Simonite

來源|《連線》

曾經為 NASA 的兩個火星探測漫遊者打造過攝像頭。此時,這個為 NASA 提供攝像頭技術的牛人正在一家普通的谷歌停車場里,端詳自己的最新作品:固定在現代汽車車頂上的裝置。四根白色支架,支撐著一個搭載了八個攝像頭的黑色豎桿。有了這個稍顯笨拙的裝置,汽車高度幾乎增加了一倍。「我們為它驕傲,不過也曾考慮過把它們遮起來。怪咖是這樣的。」Silverman 說道。

Silverman 和他的團隊打造的硬體,可供谷歌街景進行圖像採集。2007 年上線以來,谷歌街景已經積累了超過 1000 萬英里的全景圖像,包括公路、建築,甚至偶然拍攝到的隨地大小便等,這些全景信息會放到網上共享。此次全新設計是八年來的首次重大升級。上個月,團隊開始定期上街進行圖像採集。逐漸收集回來的數據,將增強谷歌從數字角度掌控世界的能力。

考慮到 2009 年手機使用的攝像頭水平,谷歌街景圖像追求的是更高清晰度。即使坐在沙發上也可以瀏覽到解析度更高、也更具衝擊力的世界圖景。不過,這次新設計的硬體並不僅僅是為了提升人們視覺體驗,汽車頂部裝置內嵌的兩個攝像頭可以分別從車身兩側捕獲靜態的高清圖像,為谷歌訓練圖像識別演算法提供更清晰的近距離建築物及道路標牌圖像。

這些演算法可以不知疲倦地讀取數以百萬計的標牌和店面圖片。吸收了海量街道可視化信息,包括路牌、店鋪名稱、甚至是街角小吃店窗口上的營業時間,谷歌有望提升本已強大的測繪資料庫。這家靠索引網站演算法起家的巨頭,正用相同的戰略為真實世界建立索引。

全球監測

谷歌街景這一想法幾乎與谷歌的成立一樣久遠。2001 年,也就是谷歌成立的三年後,公司 CEO Larry Page 帶著一盤錄像帶前往斯坦福大學的圖形實驗室。錄像帶錄製了他的行車情況,他希望研究人員想辦法充分利用影片中的圖片數據。當時,這個項目被命名為「crawling the physical web」。2006 年,採用了相關技術的谷歌街景車首次上路。一年後,公司正式發布街景計劃。

十年後,谷歌街景車在 85 個國家的上千座城市,拍攝了 800 多億張照片。常規測繪數據更為廣泛。不過,谷歌仍追尋著更好索引世界的辦法。「人們每天都會帶給我們更難、更深的問題。」公司副總裁、地圖部門負責人 Jen Fitzpatrick 表示。

第一次使用谷歌地圖或谷歌街景搜索,你可能會輸入一條街道的名字,或者你自己所處的位置。Fitzpatrick 說,現在公司遇到一些非常棘手的問題,例如,「配送範圍內,還在營業的泰國菜館子是哪家?」,我們急需一個可以實時更新的、也更為詳細的真實世界的數字模型。

她希望谷歌街景地圖能夠回答類似的問題,這需要系統對這個社會的模樣有所了解。「街角教堂旁邊的粉紅色店面叫什麼名字?」谷歌在大力推動用戶使用其虛擬助手的同時,也逐漸培養出用戶用口語說出其需求的習慣。「像這樣的問題,只有在我們的系統擁有更豐富、更深層次的信息的時候,才能解答。」Fitzpatrick 說。

好在谷歌對於機器學習以及人工智慧方面的投入巨大,街景團隊才有能力獲得這些信息。團隊目前正在進行的一項工作是,當街景地圖採集車路過某一條街,採集到長長的沿街影像時,演算法能夠通過定位以及轉寫圖片中的街道名字以及數字,自動為谷歌地圖更新地址信息。值得一提的是,街景部門是谷歌所有產品部門中第一個使用谷歌定製晶元 TPU 的團隊。

該系統還自己學會了辨認縮寫,例如 AV. 表示大道。通過對比分析全國其它路牌上的名字,並結合谷歌地圖上已有的數據,系統學會了縮寫與全稱的對應關係。研究人員還訓練系統能夠學會是被公司名字,當遇到非常有名的公司用 Logo(商標圖案)代替名字時,系統也能輕鬆對號入座。例如當它看到星巴克的海妖 Logo 時,能夠辨認出這家店是星巴克。

谷歌街景影像採集車的新攝像頭使得圖像更高清,因此,提取到的信息也更可信。「從機器學習的角度出發,一切都變得容易多了。」團隊中的工程師 Andrew Lookingbill 說。他們希望系統能夠自動識別店鋪的類型,並且增加例如營業時間等細粒度信息。團隊的成果甚至能夠被轉化為新的軟體產品,這些產品具備更好地理解世界的能力。

新的領域

用演算法解碼道路、城市和商業活動高速變化、但經濟不甚發達地區的街景圖像,特別有用。這也是谷歌及其對手們爭奪「下一個十億用戶」的戰場。印度政府發布報告稱,印度近期的道路修建速度為每天 14 英里。今年夏天,奈及利亞首都拉各斯的谷歌街景地圖正式上線,這座城市的人口達 2100 萬。Fitzpatrick 表示,谷歌的圖像索引演算法能夠幫助地圖業務拓寬新的盈利渠道,例如在地圖中夾雜廣告。這樣,新的城市覆蓋以及更高的準確率在吸引更多用戶使用的同時能夠帶來新的收益。

谷歌希望吸引全球人民參與其地圖項目。科技界對 VR(虛擬現實)的熱情使得 360 度全景攝像機價格有所下降。自今年夏天以來,谷歌已經賦予一些相機 Street View Ready(街景資格)認證。這意味著你可以通過街景 APP(應用程序)向谷歌上傳你自己的全景照片,隨後,和谷歌自己採集到的照片一樣,你上傳的照片將被谷歌的圖像識別軟體解析並提取最新的地圖信息。

谷歌希望通過眾包的形式維持街景地圖數據的有效性。「谷歌已經將(互聯網)世界索引起來。」街景地圖的產品經理 Charles Armstrong 說。「但是谷歌永不滿足於現狀。」谷歌以虛擬獎品的形式回報向其地圖做貢獻的用戶,谷歌希望用戶能夠自發地參與進來。Armstrong 預測到,不久的將來,公司、旅遊景區、甚至政府將會開著他們自己的頂部裝有相機的汽車採集圖像,來確保谷歌地圖和世界同時進化。

谷歌街景的各式更新都有助於谷歌保持其在數字地圖界的領先地位。谷歌可以說是全球為數不多的地圖測繪項目中最突出的一個了。另一些重量級參與者包括:由一系列德國汽車公司持有的 HERE;以獨立 GPS 設備和手錶聞名的 Tomtom;以及協作項目 Open Street Map。「每家都以其他公司作為標準衡量自己的水準。」Open Street Map 美國分布主席 Alyssa Wright 如是說。(蘋果進入地圖測繪圈的時間相對較晚,它的數據來自 Tomtom。)如今大多數人都隨身攜帶有 GPS 功能的智能手機,因此地圖數據的重要程度已經遠遠超過了指引方向。「從自動駕駛車輛到約會軟體,地圖是建設數字化未來的基礎。」Wright 如是說。

街景所使用的新攝像頭和谷歌對於眾包圖像採集的推動可能會為公司引來更多隱私爭議。從街景項目開始以來,把短暫的公共場景變成了互聯網上永久的存檔的行為就時不時會遇到集中爆發的用戶擔憂。德國和奧地利的大部分地區已經有相當多年在谷歌街景上都是不可見的了,這是因為谷歌曾經陷入「街景車擅自記錄 Wi-Fi 數據」的麻煩。街景車最近剛剛得以重回這兩個國家。2012 年,瑞士最高法院勒令谷歌削減攝像頭數量以防止其越牆偷窺,並要求其模糊處理女性收容所等場景。

Fitzpatrick 表示,高質量圖像可能會帶來更多隱私問題。「我們還沒有遇到有更多隱私需求的情況,」她說。谷歌會繼續將自己獲取的街景圖片中的人臉和汽車牌照做模糊處理。但是對眾包圖像來說,這並非一個默認選項,而讓採用了讓用戶在上傳時自行選擇是否使用谷歌的模糊處理技術。

運用圖像處理演算法,谷歌能夠從這些街景照片中獲取多少額外信息呢?答案是,非常多。

今年早些時候,斯坦福大學的研究人員,包括現任谷歌雲服務的首席科學家李飛飛教授,展示了他們能通過建模,使用谷歌街景圖片中出現的汽車的型號、生產年限等信息,來預測特定美國城市的收入水平、種族比例和政治傾向。而當記者詢問谷歌是否參與了這些項目的規劃時,谷歌的發言人回答說,谷歌只會運用潔凈數據來改善公司的平台和產品,包括地圖,以及地圖之外的其他產品。

而對谷歌街景圖像以及其用戶的分析也可能會對其谷歌的兄弟公司,致力於自動駕駛的 Waymo 產生幫助。「我們的團隊會時不時進行合作。」Fitzpatrick 只肯說這麼多。當然,反過來,她的團隊也會從 Waymo 處受益。

回到谷歌的停車場,攝影師 Silverman 承認,在高速公路上駕駛街景車並不好玩。「開上一天,你就會不想再做『公交車司機』,回歸工程工作了。」他說。就像自動駕駛會改變叫車服務的經濟歌劇一樣,「不再需要支付街景車司機工資」也會對街景工作產生重大改變。畢竟,谷歌試圖給物理世界創建演算法索引的工作,才剛剛開始。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之能 的精彩文章:

首單落地滴滴出行,追一科技要做的不僅僅是「智能客服」—專訪
又被打臉,三星 Galaxy Note8 「掃臉」解鎖功能存在隱患
聯想遠赴俄羅斯,使最大鋼鐵製造商 Severstal 通過構建數據池而成功轉型
市值超 1000 億美元,利潤上漲 56%,24 歲的英偉達如何成為科技明星?

TAG:機器之能 |