當前位置:
首頁 > 最新 > 阿里華先勝:城市大腦將來能成為城市的基礎設施,就像水電煤一樣

阿里華先勝:城市大腦將來能成為城市的基礎設施,就像水電煤一樣

在由雷鋒網主辦的「2018中國人工智慧安防峰會」上,阿里達摩院機器智能技術實驗室副主任華先勝發表了《城市大腦的機器視覺技術》的主題演講。創客貓作為合作媒體到場進行現場報道。

華先勝

整個城市級別的全局智能,這樣一套系統叫做城市大腦。城市大腦提出的背景是因為AI技術的發展、算力的提升和數據超大規模的匯聚,它的核心是用不斷進展的AI技術和逐步增長的強大的計算能力挖掘城市裡面大量的異構數據的不可替代的價值。

華先勝指出,目前城市管理存在三個現象,一是盲人摸象,二是燈下黑,三是霧裡看花。在這樣的背景下,阿里希望把這個城市各種各樣的數據聚合起來,發掘它的價值,尤其是視頻的數據。

「視頻數據是其中最大量的數據,也是潛在價值最大的數據,也是最難使用的數據。」華先勝表示,首先要對數據進行感知,之後進行決策優化,包括了對城市趨勢的預測、交通等情況的預防,最後就是干預。

城市大腦提出之後,面臨三個挑戰,一是投入,不管是計算的投入還是帶寬的投入,或者是演算法研發的投入,這個投入能否撐得住。二是能從這些數據裡面挖掘出什麼價值,這些價值到底是錦上添花還是必須有的東西。三是跟過去講的智慧城市、視頻監控有什麼不一樣。

那麼城市大腦標準是什麼?華先勝在現場指出,除了全面、全量、實時之外,城市大腦一定是不依賴於硬體的。「我們可以在不增加外場設備,不改變現有鏈路的情況下,通過雲上的視覺計算,使得原有的普通攝像頭具備多種智能。」

最後他指出,城市大腦的不同之處在於,第一是用大量異構城市數據中通過大規模計算和AI,挖掘其不可替代的價值;第二,城市大腦是在做人的智能不能完全的事情,因為它的複雜度、計算量已經沒有辦法用人力來完成;第三,城市大腦還希望將來能成為一個城市的基礎設施,就像水電煤一樣。

以下為華先勝演講實錄:(經創客貓編輯,有所刪減)

華先勝:

城市管理的現狀

「城市大腦」這個詞兩年前提出來的時候不像今天這樣這麼熱,兩年前是無人問津的,當時在阿里也只有我們團隊和另外一個團隊在探索這個領域。而今天不管是公司內部還是公司外部,很多人都說自己是做城市大腦的。我有時候講我們是做正版城市大腦的,後來想想「正版」這個詞有點打擊面太廣了,我們後來還是講我們是做原創城市大腦的,所以今天跟大家分享一下原創的城市大腦到底是怎麼回事,這裡面是實實在在實戰的城市大腦,也是正在運行的城市大腦。

城市大腦是怎麼提出來的?它的背景就是因為AI技術的發展、算力的提升和數據超大規模的匯聚,所以使得我們在想,可不可以為城市安裝一個大腦,去挖掘這個城市的價值,它的核心是用不斷進展的AI技術和逐步增長的強大的計算能力挖掘城市裡面大量的異構數據的不可替代的價值。這個價值體現在什麼方面?可以從不同的角度來講,數據智能助力城市管理和服務,全面、實時、全面的優化和干預,帶來的必然是便捷和靈活。往上提一個層次就是城市管理領域、服務領域的突破和產業發展領域的突破。再往上提一層是城市安全管理。

現在的城市管理是什麼樣的,大家都是從事安防的都比我更清楚。

第一點是盲人摸象。我們有很多單點、局部的交通和安防的感知,還有很多的設備是損壞的。覆蓋量最大的視頻,我們投入了很多錢建設視頻的攝像頭,但是這部分的資源沒有充分的利用起來,我們可能用它做一個交通處罰,做一個事後的斷案,但是它的價值遠遠不止這些。

第二是燈下黑。很多城市尤其是比較早期的城市的攝像頭是沒有什麼智能的,今天的智能攝像頭也只是一部分,另外這個智能也是很有限的。我們怎麼樣充分地利用這些攝像頭,把它的效能發揮起來?因為這些不可能靠人工來看。

第三是霧裡看花。所有的設備是單點,無法發現一些現象和問題背後的真實的原因。

城市大腦的三大挑戰

這個事情提出來之後,我們就希望把這個城市各種各樣的數據聚合起來,發掘它的價值,尤其是視頻的數據。從一開始這個項目提出來的時候就面臨了很多的挑戰,不管是公司內部還是公司的外部,大量的挑戰,今天還有人在挑戰這些問題。

總結起來,這些挑戰可以總結為三個詞:一是投入。我們要處理整個城市幾萬路、幾十萬路的視頻,我們的投入有多大,不管是計算的投入還是帶寬的投入,或者是演算法研發的投入,這個投入我們撐不撐得住。在今天來說視頻本來就已經傳到了計算中心存起來了,它的帶寬僅僅是從存儲的地方到計算的地方的帶寬,這根本不是什麼問題。

第二是價值。我們能從這些數據裡面挖掘出什麼價值,這些價值到底是錦上添花還是必須有的東西?雖然這個必須有有可能是創造出來的。我經常舉個例子,就像今天的手機,過去手機都是打電話用的,沒有很大的屏幕,都是一個小的顯示屏,甚至顯示屏都沒有,今天手機沒有大屏別人都不買了,這個大屏實際上是創造出來的不可替代的需求,成為一個剛需。城市的數據可不可以做到這樣?我們在為城市數據創造價值的時候是不是也可以再到這樣?

第三是跟過去講的智慧城市、視頻監控有什麼不一樣?為什麼我們做的這個城市大腦跟智慧城市的區別在哪裡呢?雖然今天的時間有限,只能講其中一部分,但是我希望講完以後,還是讓大家知道這是一個不太一樣的東西。

視頻數據是潛在價值最大的數據

什麼是城市大腦?首先城市有大量的數據,有GPS、線圈、公交、微波等等,這些數據都會使用,視頻數據是其中最大量的數據,也是潛在價值最大的數據,也是最難使用的數據。所以第一點我們要對它進行感知,或者叫做認知。要理解它,知道它發生了什麼事情,整個視覺裡面看到了什麼,發生了什麼,不管是車還是人,或者是事件、物體,我們都要了如指掌。了解這個之後,我們就可以進行決策優化。有的是直接感知認知之後馬上就可以決策,比如說發生交通事故,馬上就可以招呼交警去處理,如果是嚴重的交通事故,還可以把醫療資源馬上叫過來。還有優化,比如說對紅綠燈的優化,我們對整個城市的車流、人流等等有了全面的感知以後,當然可以做更好的全局的優化。還有就是把整個城市的視覺元素放到一個搜索引擎裡面去。

我不知道大家有沒有玩過阿里巴巴很好的一個產品叫做拍立淘,把我們喜歡的東西拍一張照去淘寶裡面找到相關的產品來進行購買。我們把城市裡的要素放到搜索引擎裡面去,當然它是實時索引,可能幾秒鐘之後,這個城市裡面攝像頭看到的元素都進入索引進行搜索。還有就是預測,我們對城市的趨勢,無論是對交通還是對安全都非常重要,對交通而言我們知道要不要管控,對安全來講,可以知道有沒有安全隱患。我們也可以做更長時間的預測,比如說第二天會發生什麼事情,比如說第二天天氣很糟糕,要下大雨,有幾個歌星要在哪裡開演唱會,根據過去歷史的數據,我們大概可以預測出來明天的交通狀況是什麼樣子的,安全狀況是什麼樣子的,哪裡到哪裡擁堵時間可能會超過很多。

有了這些預測之後,我就可以最先進行預防,不管是警力還是醫療資源。另外我知道明天會發生什麼,我能不能做什麼事情不讓它發生,我可以預先做交通的管控,做誘導。本來這個人明天要去那裡,但是因為那個地方可能會發生擁堵,他的目的地不在那裡,他當然可以避開那個地方,他明天不必要出行的話,他也可以不出行。

還有一個就是干預,因為我們有了預測就可以進行干預。整個城市級別的全局智能,我們把這樣一套系統叫做城市的大腦。當然目前是以交通和安全兩個領域為重要的應用場景,當然未來我們可能還會在環保、能源、土地使用等等領域都會彙集到這個大的領域裡來,甚至是規劃都會彙集到這個大腦裡面來。

感知層的三大目標:全面、全量、實時

今天時間有限,我挑幾個點介紹一些例子。

首先是感知層。城市感知的發展是經歷了很多階段的,最早叫無感無知,那時候想知道發生了什麼,需要向別人了解。後來是感而不知,那時候很多公司裝攝像頭、裝硬碟、裝錄像帶。那時候安防不像今天這麼高大上,今天安防行業都是人工智慧最頂端的行業,那時候都是要人來監控的。到後來是感而略知,攝像頭上有了一點智能。今天我們做城市大腦要做到感而全面知、感而全量知、感而實時知。

第一個是全面,全面也是隨著今天算力的提升,使得我們對道路的情況,對攝像頭看到的東西進行全面的感知。這裡面不僅是能看到車牌,在一個質量很差的視頻里,我們的演算法依然要做到高精準、高速度和高性能,還要全面,對車、行人和拋灑物等等都要進行全面的感知。當然這些事情都是要在很短的時間內完成,因為還有很多其它的事情要做,可能在多少毫秒之內要把它完成。

這裡我們費了很大勁做了一個演算法,經常我們做目標檢測的時候,有時候大的做好了,小的做不好,小的做好了,大的做不好,我們當時做了一個高效全尺寸多目標檢測。基於這個結果,我們贏得了兩項比賽的第一名,第一個是車輛檢測,車輛檢測在這個榜單第一名持續了一年時間。第二個是行人檢測,持續了幾個月也在第一名。除了感知人、車、物之外,還要能感知事件。平時車流在正常通行的時候,這樣的數據是大量的,異常的數據是少的,我們為正常的事情建模,異常的事情進來的時候,它就會有明顯的反應。基於時空異常的檢測,在這裡面也有一些創新的工作,比說兩個Branch的工作。

經過這樣的分析之後,我們可以發現車與人相撞、車與車相撞、車與路相撞,人與人相撞等等,我們都可以進行檢測。剛才講了兩個事情,一個是物,一個是事。這裡面有一個很大的事情,我們號稱要在雲端處理,到底能不能算得過來?在雲端的計算能力有多強?這涉及到全量和實時這兩個指標。我們依靠阿里雲的實時計算的平台,我們在這個平台的基礎上建立大規模的實時處理的平台就沒那麼困難了,雖然也不是一件很容易的事情,因為它要處理的量非常大,計算也是比較難的。

這裡面的成本是一個關鍵的問題,比如說一個事情要做得差一點的話,用了一兩台機器不會有什麼事,但是你要做這樣一個規模的系統,可能需要好幾千台機器,我們用了2000台,這是一個很大的系統,我們當時花了很大的精力提升它的性能,我們今天的性能相比第一版有20倍的變化,而且我們後面還有新的硬體的加入,又有了好幾倍性能的提升。

我們具體在其中的一個例子是我們最近即將要發布的杭州城市大腦裡面做的交警認為非常好的工作,這個產品叫做機器代替交警巡邏。大家知道城市裡面有一類叫做槍機,一類是球機,球機基本上是沒有什麼智能的,我們今天的工作就是要讓城市裡大量的球機變得有智能,不管是交通違法還是交通事故,都可以讓它進行監控。現在我們在杭州試點的200多個球機,每天有好幾千起事件被發現,遠遠超過了交警的能力。如果我們算算這個數字,大概可以代替200個警力。

有一個真實的在杭州運行的界面,大屏上會顯示我們檢測到的各種各樣的事件,對應的支隊就會看著屏幕進行處理,他們還有專門的騎警隊,看到事件暴露出來之後就會去處理。我們長時間觀察如果有些地方一天老是報警,這種地方肯定是有問題的,我們第一版發布的時候,看到有一個地方就會老是報警,交警去現場看,確實現場某些設備是有問題的,然後就進行線下的處理,處理完了之後報警量就開始下降。

這個工作有一個特點,就是充分利用城市既有的監控設施發揮它最大的效率,不需要再安裝一個攝像機,不管你的視頻的質量怎麼樣,我們都可以解決問題。但是這個話說出來,做攝像機的可能不太願意看到,但是確實我們可以這樣做。

數據的搜索和挖掘

剛才講的是感知層。再往後就是搜索和挖掘,這是實時進行處理的。我們在互聯網上找東西可以通過搜索引擎來找,如果城市的管理者要找城市發生的事情,可以通過城市的搜索引擎來找,我們把城市裡看到的人、車、路、物、事等等全部放到搜索引擎里去。做這件事情有兩大挑戰,第一個挑戰是系統的挑戰,也就是說你要去索引那麼大量的數據,怎麼能夠讓索引的搜索足夠快。第二個是我用什麼東西去描述我們關心的這些對象,關心的那個車和那些東西。當然我們也可以用結構化的信息來做,這個車是什麼顏色、什麼牌子,這個人是男是女等等。

今天我們可以用特徵的方式來識別,它是一串數字,這串數字就代替了你所關心的這輛車、這個人的特徵,我們通過這個特徵進行目標的索引和檢索。怎麼樣找這個合適的特徵,怎麼樣把一個圖片,一個目標變成一個特徵,這是核心的課題,這裡面有很多的方法,我們可以通過學習的方法,通過神經網路、目標函數的設計,可以逼迫神經網路收集到我們想要去的地方,從而使它表達出我們想要表達的方法。

從上面來講是從識別的角度逼迫神經網路,後面是通過VID的方法逼迫這個神經網路。這裡我只介紹其中一個例子,是我們前不久做的一個工作,就是Part-Leve特徵學習,我們通過這個學習,在做索引的時候,在比較的時候,它就會成為重要的指標。當然還有一些方法可以發現到底哪些點是獨特的,比如說像車的檢索,我們做商品的車的檢索的時候是比較簡單的,同一輛車、同一個牌子、同一個型號認為是同一個產品,但是在安防的場景下,不是一個人的車,它就不是一個東西,這時候需要發現它的細小的差別,而且要自動發掘它。我們這些工作也在行人RD-ID的一個測試裡面應用,現在我們的測試結果是最好的,達到了97%,而人類的最好結果是94%。

接下來是講預測,雖然我們無法預測某個個體的行為,但是我們可以預測整體的趨勢。我們在蘇州做了這樣的實驗,預測車流在20分鐘、30分鐘後的變化。我們經常講今天有GPS導航的時候,它其實是沒有幫你做車流預測的,它僅僅是根據當前的車流給你選擇一個最優路線,所以走著走著它給你建議不同的路線,因為交通狀況在變化。如果我們有預測,GPS的路徑規劃就可以做得更好,如果時間更長的話,還可以進行更好的干預。這裡面我們用深度學習的方法預測下一時刻的交通狀況,這在蘇州得到了很好的預測。

城市大腦的不同之處,第一是用大量異構城市數據中通過大規模計算和AI,挖掘其不可替代的價值。第二,城市大腦是在做人的智能不能完全的事情,因為它的複雜度、計算量已經沒有辦法用人力來完成。比如說紅綠燈的配置、眾多球機的觀測無法通過人力完成,我們要通過城市大腦完成人不能完成的事情。我們經常講人工智慧有的地方是超越人的,有的地方是遠遠不如人的,在這個地方它是超越人的。第三,城市大腦還希望將來能成為一個城市的基礎設施,就像水電煤一樣。深度學習、數據、計算能力使得AI有了發展,這個發展使得我們思考能不能為城市建造一個大腦,挖掘城市的價值,改變這個城市,改變我們在城市裡的生活方式。由於這個城市的環境、城市的平台是非常獨特的,它的數據的量、計算的需求,問題的複雜性、它對價值挖掘需求的量和迫切性使得城市可以成為一個平台,或者說城市大腦可以成為一個平台,去孵化更多的技術,有更多的創新在這個平台上能夠發掘出來,使得一些科研的技術、實驗室的技術在這個平台上得到錘鍊,得到扎紮實實的實現。

這也是為什麼城市大腦會被科技部選為首批四個國家人工智慧開放創新平台之一。像阿里這樣的公司就搭建這樣一個檯子,把它搭得漂亮,同時還需要有幾個好的演員在上面演,不然大家都說這個檯子不好,這個檯子上最大的空間是合作者,不管是人的層次,還是數據應用平台、只能應用平台還是計算平台,在這上面可以創造更大的價值。城市大腦需要很多人一起來繁榮、一起來創造,謝謝大家。

(以上為創客貓現場報道,轉載請註明來源。)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 創客貓 的精彩文章:

區塊鏈資本完成1.5億美元融資 欲將投資觸角延伸到「幣圈」之外

TAG:創客貓 |