IBM的Watson AI用於開發多面跟蹤演算法
大藍 IBM利用其沃森人工智慧(AI)技術開發了一種新的多面跟蹤演算法。
儘管改變了攝像機角度,照明和外觀,系統仍使用AI來跟蹤場景中的多個人。
IBM Watson研究員Chung-Ching Lin與羅格斯大學統計與生物統計學系教授Ying Hung合作, 帶領一支科學家團隊開發該技術,採用一種方法在視頻序列中發現不同的個體。
系統還能夠識別人們是否離開然後重新輸入視頻,即使他們看起來非常不同。
為了在人工智慧中創造這種創新,林解釋說,該團隊首先為源材料中的人們製作了「跟蹤」。
「這些跟蹤基於多個身體部位(面部,頭部和肩部,上半身和整個身體)的共同出現,因此即使人們不能完全看到相機,也可以跟蹤人們 - 例如,他們的面孔被其他物體擋開或遮擋「。
林補充說:「我們將多人跟蹤問題表述為具有兩種邊緣的圖形結構。」
這些中的第一個是「空間邊緣」,其表示候選者在幀內的不同身體部位的連接,並且用於生成候選者的假設狀態。
第二個是「時間邊緣」,它指的是相鄰身體部位在相鄰幀上的連接,並用於估計不同幀中每個人的狀態。
「我們使用來自每個人的軌跡的面部邊框來生成面部軌跡,並提取面部特徵以進行聚類,」他補充說。
為了了解該技術的表現如何,林和他的團隊將其與分析無約束視頻的挑戰性數據集的最先進方法進行了比較。
在一項實驗中,他們使用了音樂視頻,這些視頻具有高圖像質量,但在場景,相機設置,相機移動,化妝和配件(如眼鏡)中有顯著的快速變化。
「我們的演算法在聚類精度和跟蹤方面都優於其他方法,」林補充道。「與其他方法相比,我們的演算法可以顯著提高聚類純度[和]自動確定要跟蹤的人數或聚類數,而無需手動進行視頻分析。」
該演算法及其性能在IBM的CVPR研究論文 「 無約束視頻中的多面跟蹤的先行方法」中有更詳細的描述。μ
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
※IBM通過Project Dabater展示人工智慧優勢
※IBM的辯論計算機:AI專家的判決
TAG:瞎說開發那些事 |