當前位置:
首頁 > 科技 > 開源照片管理工具digiKam發新版,人臉管理功能更新採用深度學習技術

開源照片管理工具digiKam發新版,人臉管理功能更新採用深度學習技術

開源照片管理工具digiKam發布了最新7.0的測試版,這個版本主要的更新是換掉舊有的臉部識別技術,改採用深度學習演算法,以強化臉部識別的功能,過去要6張臉照才能開始進行人臉識別,但現在只要1張。

digiKam早從第二版開始,就提供了臉部偵測與識別的功能,但因為後台使用的演算法較舊,無法有效支持自動化人臉管理工作流程。過去使用的方法是OpenCV函數庫中,基於特徵的級聯分類器(Cascade Classifier),用來隔離或是標記人臉。

這種舊方法無法提供高水準的偵測結果,雖然分析時可以獲得約80%的良好結果,但是用戶需要提供大量反饋,以協助程序確認是否偵測到人臉,且根據用戶在bug管理系統上的反應,舊的人臉識別功能無法良好地自動識別人臉並進行標記。

而其實早在2017年,社群就打算在digiKam的人臉識別中使用深度學習技術,但是當時使用的是Dlib函數庫,其神經網路的表現不佳,因為計算速度慢,所以也只能當作概念的技術驗證,無法真正的應用在生產環境中。而在今年,這項計劃又被重新打開,保留了部分想法,但是在偵測和識別引擎上,則使用了更新的深度學習方法。

新的實例是基於OpenCV函數庫中的深度神經網路功能,將預學習數據模型用於臉部管理上,不需要學習階段就可以進行臉部偵測與識別,整體執行速度更快且正確率達到97%,而且還能用於偵測非人像是狗的臉。新的神經網路模型的性能很好,可以偵測模糊、屏蔽、側面以及只有一部分的臉部。

而在臉部識別方面,新的實例只需要一張照片就可以開始執行,這比起過去的實驗性功能,需要6張照片臉部識別功能才可開始運行,效率明顯高出不少,當然,標記越多臉孔,臉部識別功能的精確度就越好,現在的精確度可達95%,而過去的實例運算速度慢,且精確度一直無法突破75%。運算性能也獲得大幅度的改進,由於新實例支持多核心運算,因此可以加快計算速度。

由於新的實例允許使用其他預學習數據模型,因此官方預告,他們還會將偵測與識別功能,擴展應用到諸如紀念碑、植物與動物等不同類型的物體上。目前測試階段發現了一些內存泄漏的複雜問題,開發團隊正著手解決中。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 十輪網 的精彩文章:

歐盟針對Google及臉書的廣告業務展開調查
優衣庫成功打造100%全自動倉儲中心,機器手臂連折衣服、包裝都能做!