標註AI訓練用視頻數據有新方法，比傳統流程快15倍

科技 06-06

今年COMPUTEX活動上，魁達智能（creDa）展出了今年1月正式上線的動態圖片標記平台「ezLabel」，只要上傳視頻至平台，並針對目標對象第一次、最後一次出現的畫面進行標註，就能通過演算法自動標記出視頻中的目標對象，可以比傳統標記方式快15倍。而在4月9號改版後，除了介面中可支持的對象標記添加到1026種，也加入了標記行為的功能，可針對同一區段的多種行為重複標記。

一般在標記動態圖片時，會需要在一幀一幀的靜態畫面中標出目標對象，若以一秒24幀來算，每十幀標記一次，在一秒內就需要標記2-3次，時常耗費大量時間來標記圖片。為了縮短標註時間，魁達推出ezLabel動態圖片標記平台，用戶只需上傳視頻至平台，先行用方框框出目標物第一次、最後一次出現在畫面中的位置，再點擊執行，系統就會通過深度學習提取畫面特徵值並與視頻比對，再自動標出目標對象。

雖然平台沒有限制視頻上傳長度，但魁達智能首席執行官沈柏均也提醒，圖片在平台上播放與標記時，會佔用個人計算機的暫存內存，內存要夠大才能處理更長時間的圖片，因此會建議視頻長度以五分鐘為限。

沈柏均也表示，現行的演算法仍無法適用於所有對象的標記。經開發團隊測試後，確定可被自動化標記的對象共有1026項，包括常見的汽機車、行人，或是水中生物等，均已內置於平台介面中，但如果用戶在介面中找不到欲標註的對象，可以便用自定義的功能添加項目來測試，仍然可能適用於自動化標註。

「全自動的演算法沒有到完美，可是可以比過去快15倍。」沈柏均表示，能否被自動標註也取決於圖片的複雜度，例如在大量機車停等紅燈的場景中，目標機車就不容易被識別，因此，在系統自動化標註完成後，需要人工複查，重新將錯誤標記的部分更正，但即便如此，整個標記流程還是能比傳統方式快15倍。

ezLabel平台提供用戶自行創建任務的功能，並可以選擇欲標記物項的種類（Category）、型式（Type）、特徵（Attribute）。

若介面中找不到欲標註的對象，可以便用自定義的功能添加項目來測試。

接下來就可以在視頻的畫面中標記出目標物，再通過演算法自動標註。

今年4月9號改版後ezLabel添加了標記行為的功能，沈柏均表示，許多開源軟體提供標記行為的方式，是用單張靜態畫面去標註，但行為應該是連續性的動作。因此，ezLabel讓用戶在區段中標記行為，例如「走路」這個行為，可以用十幀畫面中、被標註的人的動作變化來定義。此外，在區段中也可重複標記不同的行為，例如一個人一邊走路一邊撐傘，就能在區段中同時標記「走路」與「撐傘」的行為。

ezLabel註冊帳號後就可以使用，學生用戶比例較高，在標記完成後，ezLabel也提供兩種常見的下載格式，分別是PASCAL VOC、JSON，能直接用於AI模型的訓練。未來，魁達也希望能將標記完的數據直接串聯雲計算，能讓用戶能更便利運用數據來訓練模型，省去數據被下載、再上傳雲計算的程序。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 十輪網科技 的精彩文章:

※抗憂鬱葯竟可能「逆轉」癌症及避免產生「抗藥性」
※我的工作會被人工智慧取代？你更應該問：如何讓AI為我工作

TAG:十輪網科技 |