開源照片管理工具digiKam發新版，人臉管理功能更新採用深度學習技術

科技 12-28

開源照片管理工具digiKam發布了最新7.0的測試版，這個版本主要的更新是換掉舊有的臉部識別技術，改採用深度學習演算法，以強化臉部識別的功能，過去要6張臉照才能開始進行人臉識別，但現在只要1張。

digiKam早從第二版開始，就提供了臉部偵測與識別的功能，但因為後台使用的演算法較舊，無法有效支持自動化人臉管理工作流程。過去使用的方法是OpenCV函數庫中，基於特徵的級聯分類器（Cascade Classifier），用來隔離或是標記人臉。

這種舊方法無法提供高水準的偵測結果，雖然分析時可以獲得約80％的良好結果，但是用戶需要提供大量反饋，以協助程序確認是否偵測到人臉，且根據用戶在bug管理系統上的反應，舊的人臉識別功能無法良好地自動識別人臉並進行標記。

而其實早在2017年，社群就打算在digiKam的人臉識別中使用深度學習技術，但是當時使用的是Dlib函數庫，其神經網路的表現不佳，因為計算速度慢，所以也只能當作概念的技術驗證，無法真正的應用在生產環境中。而在今年，這項計劃又被重新打開，保留了部分想法，但是在偵測和識別引擎上，則使用了更新的深度學習方法。

新的實例是基於OpenCV函數庫中的深度神經網路功能，將預學習數據模型用於臉部管理上，不需要學習階段就可以進行臉部偵測與識別，整體執行速度更快且正確率達到97%，而且還能用於偵測非人像是狗的臉。新的神經網路模型的性能很好，可以偵測模糊、屏蔽、側面以及只有一部分的臉部。

而在臉部識別方面，新的實例只需要一張照片就可以開始執行，這比起過去的實驗性功能，需要6張照片臉部識別功能才可開始運行，效率明顯高出不少，當然，標記越多臉孔，臉部識別功能的精確度就越好，現在的精確度可達95％，而過去的實例運算速度慢，且精確度一直無法突破75％。運算性能也獲得大幅度的改進，由於新實例支持多核心運算，因此可以加快計算速度。

由於新的實例允許使用其他預學習數據模型，因此官方預告，他們還會將偵測與識別功能，擴展應用到諸如紀念碑、植物與動物等不同類型的物體上。目前測試階段發現了一些內存泄漏的複雜問題，開發團隊正著手解決中。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

請您繼續閱讀更多來自 十輪網 的精彩文章:

※歐盟針對Google及臉書的廣告業務展開調查
※優衣庫成功打造100％全自動倉儲中心，機器手臂連折衣服、包裝都能做！