深度學習仍是視覺大數據領域的最好分析方法之一
雷鋒網註:本文作者為中國科學院信息工程研究所張曉宇副研究員和電子科技大學李長升研究員。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
隨著移動互聯網和物聯網的快速普及,全球數據總量呈指數級增長。據雷鋒網統計,我們每天創造約2.3萬億GB數據。
過去,人們對海量數據無從下手。隨著大數據與人工智慧、雲計算、物聯網、區塊鏈等前沿技術的緊密融合以及硬體基礎設施的快速發展,這些新興技術為數據增值提供了強有力保障,由此帶來了巨大商業應用價值,並逐漸成為各國搶佔下一步發展機遇的戰略性技術。
最近,美國政府啟動了大數據研究計劃,致力於提升大數據分析演算法和系統的效率;同時,日本對信息產業提出新的戰略規劃,將大數據作為重點發展的科技領域,著重強調數據採集與分析;近年來,我國大數據產業蓬勃發展。中國信通院在2018年發布的《大數據白皮書》進一步調動了全國各地發展大數據的積極性,各行各業開始利用大數據進行智能升級轉型。
在大數據技術中,數據分析逐漸成為其核心技術,包括對數據處理的實時性成為工業界的主要需求。 當前,各種數據分析技術層出不窮。其中,最為引人關注的當屬深度學習技術。
一、深度學習是最好的方法之一
深度學習仍是目前大數據處理與分析的最好方法之一。
深度學習擅於發掘多維數據中錯綜複雜的關係。基於大數據的深度學習演算法在計算機視覺、自然語言處理以及信息檢索等多個領域不斷刷新著記錄。
在這個數據為王的時代,深度學習中的監督/半監督學習與數據規模、數據質量等有很大關係,因此數據標註是在現實場景中提升模型性能的最直接有效的方法。
但由於傳統的數據集數量/質量有限,在解決新的問題或是想要獲得更好的效果時,往往需要進行額外的數據標註。 因此,對於數據要求不那麼高的半監督/弱監督學習一直是視覺大數據處理中的熱點問題。 同時,當使用某數據集訓練了一個很好的模型,但在實際應用時,往往由於「領域鴻溝」(domain gap)的存在,模型性能大幅度下降,遷移學習是這一問題的常用解決思路。
此外,由於移動設備或物聯網設備的存儲和計算資源有限,無法像伺服器一樣輕鬆地運行訓練好的模型,限制了深度學習技術在大數據領域的應用落地,針對此問題,目前有效的解決方案包括模型壓縮、計算加速。
生成對抗網路Generative Adversarial Networks (GANs)的提出,為神經網路添加了一個新的分支。該網路結構能極大提高圖像生成的質量,進一步推動了計算機視覺領域的發展。
近幾年,計算機視覺正在向視頻理解領域延伸,而視頻比圖像多了一維時序信息,如何有效建模並利用這一時序信息是處理這類問題的關鍵。
深度強化學習是大數據時代的另一研究熱點,強化學習是主體通過與外部環境交互來進行學習的過程。目前已經取得了實質性的突破,2017年DeepMind公司的提出的AlphaGo Zero通過自我博弈的強化深度學習演算法進行訓練,經過3天的學習,以100:0的成績超越了AlphaGo Lee的實力(以4:1戰勝李世石的版本),21天後達到了AlphaGo Master的水平,並在40天內超過了所有之前的版本。
自2017年以來,AutoML(Automated machine learning)迅速興起,AutoML試圖將特徵提取、模型優化、參數調節等重要步驟進行自動化地學習,使得機器學習模型無需人工干預即可被應用。但目前其在搜索效率、實際應用等方面有待進一步探索。
二、計算機視覺
計算機視覺是人工智慧領域最為成熟的技術之一,其主旨在於利用計算機模擬人類視覺,是人工智慧中的『看』,進而為後續的應用目標提供判別信息。計算機視覺研究和應用非常廣泛,近幾年取得了快速的發展,其應用已經在政府、金融、互聯網等行業市場率先落地。
此外,利用大數據可以對實體經濟行業進行市場需求分析,優化生產流程、供應鏈與物流能源管理,以及提供智能客戶服務等。雖然大數據已經服務於眾多行業,但是在實際應用中還有很多局限,仍舊有很多問題沒有解決。
近年來,國家對人工智慧行業的大力支持為計算機視覺的發展提供了有利環境,極大促進了計算機視覺的商業化落地。目前我國共有100餘家計算機視覺企業,涉獵身份認證、安防影像、醫療影像等眾多領域。
目前CV公司比較集中的技術賽道有:人臉識別、自動駕駛、醫療圖像等,目前商業化落地最快的仍是人臉識別及其業務相關的一些技術。
縱觀計算機視覺發展,可以看到中國與西方國家的演進路線的不同。國際上前沿的技術主要集中在深度學習的基礎研究層面,而中國的計算機視覺技術更傾向於產業落地。經過多年的沉澱,中國已經在人才、數據、場景和政策層面做了比較多的儲備,為中國計算機視覺技術的發展提供了豐沃的土壤。
尤其是在應用方面。計算機視覺領域一定要通過落地應用才能更好推動學術的發展,而中國在這方面具有巨大的優勢。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
這裡仍然是雷鋒網的一條廣告:在本屆ICIG會議中,有諸多有意思的論壇,其中之一為「第三屆視覺大數據高峰論壇」。關於論壇的簡介如下:
目前,全球視覺數據正處於爆炸式的增長中,給視覺大數據的處理帶來了前所未有的挑戰,同時也給視覺技術的應用帶來了巨大的機遇。這個論壇旨在通過科研工作者、行業企業精英等視覺數據領域一線研究者之間的學術交流,共同分享我國視覺領域的最新理論和技術發展、深入挖掘視覺大數據中蘊含的價值,共同探討視覺技術領域發展的新模式,對推動視覺大數據領域的理論創新、行業發展,以及促進領域間的交流具有重要的意義。
邀請嘉賓包括:
·???????? 西北工業大學教授IET Fellow 韓軍偉 作主題為「高解析度遙感圖像理解」的報告;
·???????? 北京大學研究員北京市傑青、國家青年千人 張史梁 作主題為「視頻圖像行人重識別」的報告;
·???????? 美國西弗吉尼亞大學計算機科學與電氣工程系副教授 郭國棟 作主題為「Human-Centered Visual? ? ? ? ? ? Analytics」的報告;
·???????? 微軟研究院視覺計算研究員IAPR Fellow王井東 作主題為「Deep High-Resolution Representati? ? ? ? ? ? on Learning for Visual Recognition」的報告;
·???????? 滴滴出行智能控制首席科學家IEEE Fellow 唐劍 作主題為「Automatic Structured Pruning for D? ? ? ? ? ? eep Convolutional Neural Networks」的報告;
·???????? 阿里巴巴集團安全部資深演算法專家 王炎 作主題為「Security AI at Alibaba」的報告。
※前景巨大,關乎未來,如何用AI「武裝」我們的教育?
※專訪遠昊科技CEO鄧艾華:解決校園霸凌是智慧校園的下個方向
TAG:雷鋒網 |