領域頂級專家報告、廠商展台、晚宴盛況概覽
IRC
2017日10月11日上午9:00,3DV國際會議正式邁入了第二天的日程。3DV前兩日匯聚了多位特邀專家報告、口頭報告和短報告、海報、廠商展覽等精彩內容,現在讓我們一起回顧這些精彩記錄吧。
特邀專家報告
高文:Online visual processing for 3D reconstruction, SLAM, and object recognition
中國工程院院士、北京大學教授高文老師給我們帶來關於視覺處理、三維重建以及移動搜索方面的講座。首先,高文老師介紹了視覺處理中如何計算特徵點。傳統方法就是用引用過萬的SIFT特徵,特徵選擇和聚合也可以極大提高準確率,特徵經過壓縮後可以減少很多存儲。
隨後高文老師介紹了他們的MPEG壓縮演算法的相關工作。MPEG也可以用於點雲壓縮。之後高老師講述了用深度學習與傳統演算法結合的方法,提高了搜索準確率。之後,高老師給我們介紹了SLAM(及時定位與地圖構建)方面的相關工作。
SLAM有許多挑戰包括實時高精度的要求以及缺乏特徵的場景等。高老師團隊提出的USB特徵有著更快更精確的特點。最後,高老師介紹了三維重建方面的工作, 給我們展示了其團隊對北京大學掃描重建的結果。高老師團隊專註特徵的表達和壓縮,以後會解決更多的挑戰!這個領域還有許多問題需要解決。 相信高老師團隊會給我們帶來更多優秀工作!
權龍:Computer Vision, Visual Learning, and 3D Reconstruction: Modeling the world with drones and smartphones!
香港科技大學終身教授權龍充滿激情地給我們介紹了他在人工智慧、計算機視覺、3D視覺重建等方面的思考和研究。權龍教授認為從AI的角度看,相比於語音和文字,視覺大約佔所有信息的80%,所以更為重要,AI的演變主要來自於計算機視覺。權龍教授帶我們簡單地回顧了一下AI的發展歷史,從1998年到2012年15年的時間裡,AI一直沒有很大的變化;但是在這沉默的15年中,計算硬體有了巨大的提升,GPU也在科學研究中得到了廣泛的應用,這帶來了AI近幾年迅猛的發展。
在對計算機視覺的理解上,權龍教授認為計算機視覺就是對基本視覺特徵的搜索,而特徵則是圖像重構和識別的基礎。這方面通過使用深度學習的方法已經有了非常優秀的效果,但是仍有許多不足有待改進。例如在識別方面,它仍然只能完成特定任務、不能像人一樣理解圖像。在重構方面,則還面臨著諸如如何在兩張圖中找到相同事物、相關特徵或像素等,如何去除不需要事物(例如天空)等問題。
接下來,權龍教授介紹了現代三維重建管道的內容,並相應地提出了「深度三維重建」的概念——包括對傳統上特徵檢測和匹配、來自運動的結構、多視角立體等方面的改進。此外,權龍教授還給我們展示了Altiture.com上3D重建出的幾個demos,效果非常驚人。
Davide Scaramuzza:Robust, Visual-Inertial State Estimation: from Frame-based to Event-based Cameras
昨日下午的特邀報告同樣十分精彩,蘇黎世聯邦工學院機器人與視覺實驗室主任Davide Scaramuzza 主要研究視覺慣性狀態估計, 基於視覺的飛行機器人導航、端到端學習以及時間驅動視覺。他的目標是製造快速的、輕量的、全自動的飛行機器人,並將其用於搜救工作中。要實現這個目標,實際上需要解決計算機視覺中的幾個重要挑戰:高動態場景、高速運動、少紋理、運動模糊等問題。
Davide從視覺慣性狀態估計的問題展開:當2幀間overlap大於30%時,稀疏的估計比稠密和版稠密能夠更快收斂。Divide團隊還改進了四旋翼飛行器系統,能夠進行不需要gps的快速巡航以及自動實時稠密的重建。之後,他介紹了基於事件的相機模型,其革命性的地方在於,能夠穩健低延遲處理高速運動和高動態場景。
口頭報告、短報告、海報概覽
GraphMatch: Efficient Large Scale Graph Construction for Structure from Motion
文章提出了一種類似圖像匹配的方法,可有效的用於大規模運動恢復結構問題(Structurefrom Motion, SfM)中。不同於現有解決SFM問題中,使用辭彙表(Voc)來避免蠻力搜索並快速構建匹配圖的方法。本文研究人員提出的GraphMatch方法,不需要在預處理階段構建繁雜的辭彙表,通過兩方面的先驗數據檢測相似的圖相對,更高效匹配圖像。先驗數據一方面來自與對任意兩幅圖像的Fisher vector即似然函數的梯度向量評估所得數據,另一方面基於對底層匹配圖中頂點之間的圖像距離評估所得。進過研究人員的實驗證明,GraphMatch方法與其他相似的圖像匹配演算法相比更加有效。這無疑是在解決計算機視覺大規模運動恢復結構問題方向的又一重大突破。
Line-based Robust SfM with Little Image Overlap
相比於前文所述可應用於SFM的圖像匹配問題的全新解決思路,本文考慮到通常的結構運動(SFM)技術需要至少三焦點重疊攝像機標定和重建場景的問題,提出了基於直線共面假設的新方法,估計共享一個相機的兩個獨立焦距校準相對尺度。實驗表明,雖然會以相對不精確為代價,但是這種方法可以校準之前無法處理的數據集,具有更廣泛的適用性。對於每一位奮鬥在科研一線的研究人員,解決問題永遠沒有最好的解決方法,只有更好的方法。
ControllableVariation Synthesis for Surface Motion Capture
本文解決了自動捕獲四維模型微變的問題,特別是在多視角下對運動人體形態的捕獲。微變是實現真實運動的一個重要組成部分,然而今年的動畫網格數據集和製作工具卻缺乏這種豐富性,對此,研究人員提出了新的解決方法。建立了嵌入多個低緯形態的動力學模型,並利用蒙特卡羅馬爾科夫鏈MCMC抽樣獲得表現運動軌跡的模型組。
Cascaded Scene Flow Predictionusing Semantic Segmentatio
該報告帶來了一種新的從一對3D相機給出的兩個連續幀中同時估計被觀測場景中物體的形狀和運動的方法。他們的方法綜合考量了分割、形狀、運動、光流場等可用因素,通過優化對整體的目標函數,取得精準的語義場景流估計。通過在KITTI數據集中的驗證,他們的方法確實精準而有效。
Staticand Dynamic Objects Analysis as a 3D Vector Field
Jiang Cansen等人則在中提出了一種新的場景分析方法,該方法具有三個卓著貢獻:首先,可以有效地檢測物體的運動;第二,提供了一種質量較高的物體運動分割方法;第三,可以較好地生成靜態地圖和剛性物體。他們的方法在擁擠環境中的精準機器人定位和自動駕駛等方面有著十分廣闊的發展前景。
廠商展台概覽(1)
百度:百度機器人
在本次會議上百度展出了一套軟硬體一體的視覺解決方案,機器人視覺SDK同時具有導航定位和物體識別功能,雙目攝像頭獲取的圖像經過深度神經網路,可以精準完成的障礙物檢測。此外,這一機器人視覺解決方案連接百度雲端API,可以快速準確地進行人臉識別、身份識別、物體識別和文字識別。這樣完備的機器人視覺解決方案可以說是為機器人提供了一雙慧眼。
光珀智能:ToF感測器
光珀智能帶來了他們的ToF感測器產品,GP001A-16適用於戶外使用,其提供的RGBD信息能為三維數據分析提供精準的數據支持。而GP003與傳統的機械掃描式激光雷達相比,具有全固態、無移動部件、可靠性和抗震性能高的優勢,在運行過程中不依賴於環境光照明,成像距離可達幾百米。可應用到安防監控、汽車自動駕駛、機器人導航、三維建模、虛擬/增強現實、人機交互、機器人3D視覺等多種領域。
商湯科技:移動AR應用
商湯科技展示了能實時三維重建並添加AR效果的移動端應用。特色部分是AR的陰影和遮擋效果,在應用場景中,虛擬物體在移動過程中能夠被實物遮擋,虛擬物體的陰影也會隨著其移動和光線變化而變化和移動。此外,商湯科技還展出了基於人臉關鍵點定位的技術,可適應大角度側臉、表情變化、遮擋、模糊、明暗變化等各種實際環境。
縱目科技:智能輔助駕駛系統
縱目科技在本次會議中,縱目科技主要展出了ZM-2D/3D環視系統和實時道路監測系統的相關技術。2D/3D 360°全景泊車系統首先收集車身前後左右四個魚眼相機中採集的視頻,然後在環視系統中對採集的視頻進行畸變校正和視角變換後,拼接出完整的全景視頻輸出到車內屏幕。
阿丘科技:智能分揀系統
阿丘科技的SmartPicker智能分揀系統依託於3D物體識別和深度學習等技術,能夠實現對任意擺放的工業產品進行檢測識別以及姿態估計。該系統能使機械臂自主完成規劃和抓取操作,自動完成識別分揀相關任務。
清影技術:「多目慧眼」
清影機器視覺技術展示的「多目慧眼」即「通用式三維即時視覺感測技術」,該技術的核心部分是與相機硬體特殊結構相結合的一整套通用計算方法,由三維立體相機採集三維數據,通過專用的高速數據處理器進行計算處理解算出景物的三維坐標及其表面紋理特徵。
晚宴:舉杯共飲,攜手前行
11號的晚宴上,本次3DV的主席陳寶權教授為大家致辭。陳老師首先歡迎了來自各個國家的參會人員。
隨後,陳老師對這次3DV的主辦方,山東大學交叉研究中心(IRC)進行了介紹。在介紹中我們了解到,IRC團隊是一個年輕,向上,充滿激情和活力的和諧團隊。團隊有著良好的研究氛圍和濃厚的文化氣氛。作為主辦方,IRC的老師和同學們付出了辛勤的勞動,保證了大家良好的與會體驗。
陳老師與聯合主辦方未來影像高精尖創新中心(AICFVE)的總體部副主任王春水一同介紹了未來影像高精尖創新中心。AICFVE是由北京電影學院聯合國內外高校,研究機構,知名企業建立的,具備雄厚的科研實力。以未來影像創造為目標,AICFVE正在相關研究的道路上摸索前行。
之後,本次的兩家贊助商,光珀智能和地平線機器人分別對自身的發展歷程,公司現狀和科研情況進行了介紹。兩家公司同為新興的科技公司,都具備十分良好的發展潛力,也為科研向工業應用的轉化做出了相應的貢獻。
席間觥籌交錯,來自不同國家的研究者們舉杯暢飲,互相介紹自己的研究成果。陳老師和王老師也來到大家中間,與大家暢聊彼此的見聞和與會感受。歡樂時光總如白駒過隙,一晃而過。宴會之後,意猶未盡的研究者們繼續著自己的話題,在這次學術的盛會上,沒有國界的隔閡,也沒有民族的不同,有的是相同的研究精神和科研目標,或許這也正是3DV這樣的學術盛會其魅力之所在。
主題涵蓋:::
先進位作流程:實時渲染引擎、可視化預覽、數字資產與虛擬角色、智能拍攝、動作捕捉、三維快速掃描與建模、先進位作管理系統等。XR影像內容:VR/AR/MR/全息影像技術及敘事藝術創新等。未來影像技術前瞻:人工智慧、光場技術、體獲取與體顯示技術、機器人與自動化在影像產業中的應用等。高質量影像:高幀率、高動態、高解析度、激光光源、廣色域等。
詳情點擊:高精尖創新中心徵稿啟事
※北風吹:以身外身,做夢中夢—數字虛擬下的肉體現實
※承認「我做不到啊」,生活也許能過得更好
※近期熱巴粉絲嗖嗖漲?其實我早就被她的衛衣造型圈粉了!
※王子、雪囧、大布集體來發糖
TAG:輕芒 |