當前位置:
首頁 > 科技 > 標註AI訓練用視頻數據有新方法,比傳統流程快15倍

標註AI訓練用視頻數據有新方法,比傳統流程快15倍

今年COMPUTEX活動上,魁達智能(creDa)展出了今年1月正式上線的動態圖片標記平台「ezLabel」,只要上傳視頻至平台,並針對目標對象第一次、最後一次出現的畫面進行標註,就能通過演算法自動標記出視頻中的目標對象,可以比傳統標記方式快15倍。而在4月9號改版後,除了介面中可支持的對象標記添加到1026種,也加入了標記行為的功能,可針對同一區段的多種行為重複標記。

一般在標記動態圖片時,會需要在一幀一幀的靜態畫面中標出目標對象,若以一秒24幀來算,每十幀標記一次,在一秒內就需要標記2-3次,時常耗費大量時間來標記圖片。為了縮短標註時間,魁達推出ezLabel動態圖片標記平台,用戶只需上傳視頻至平台,先行用方框框出目標物第一次、最後一次出現在畫面中的位置,再點擊執行,系統就會通過深度學習提取畫面特徵值並與視頻比對,再自動標出目標對象。

雖然平台沒有限制視頻上傳長度,但魁達智能首席執行官沈柏均也提醒,圖片在平台上播放與標記時,會佔用個人計算機的暫存內存,內存要夠大才能處理更長時間的圖片,因此會建議視頻長度以五分鐘為限。

沈柏均也表示,現行的演算法仍無法適用於所有對象的標記。經開發團隊測試後,確定可被自動化標記的對象共有1026項,包括常見的汽機車、行人,或是水中生物等,均已內置於平台介面中,但如果用戶在介面中找不到欲標註的對象,可以便用自定義的功能添加項目來測試,仍然可能適用於自動化標註。

「全自動的演算法沒有到完美,可是可以比過去快15倍。」沈柏均表示,能否被自動標註也取決於圖片的複雜度,例如在大量機車停等紅燈的場景中,目標機車就不容易被識別,因此,在系統自動化標註完成後,需要人工複查,重新將錯誤標記的部分更正,但即便如此,整個標記流程還是能比傳統方式快15倍。

ezLabel平台提供用戶自行創建任務的功能,並可以選擇欲標記物項的種類(Category)、型式(Type)、特徵(Attribute)。

若介面中找不到欲標註的對象,可以便用自定義的功能添加項目來測試。

接下來就可以在視頻的畫面中標記出目標物,再通過演算法自動標註。

今年4月9號改版後ezLabel添加了標記行為的功能,沈柏均表示,許多開源軟體提供標記行為的方式,是用單張靜態畫面去標註,但行為應該是連續性的動作。因此,ezLabel讓用戶在區段中標記行為,例如「走路」這個行為,可以用十幀畫面中、被標註的人的動作變化來定義。此外,在區段中也可重複標記不同的行為,例如一個人一邊走路一邊撐傘,就能在區段中同時標記「走路」與「撐傘」的行為。

ezLabel註冊帳號後就可以使用,學生用戶比例較高,在標記完成後,ezLabel也提供兩種常見的下載格式,分別是PASCAL VOC、JSON,能直接用於AI模型的訓練。未來,魁達也希望能將標記完的數據直接串聯雲計算,能讓用戶能更便利運用數據來訓練模型,省去數據被下載、再上傳雲計算的程序。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 十輪網科技 的精彩文章:

抗憂鬱葯竟可能「逆轉」癌症及避免產生「抗藥性」
我的工作會被人工智慧取代?你更應該問:如何讓AI為我工作

TAG:十輪網科技 |