大撒花,搜狗人工智慧打破世界紀錄!
77.0分!世界紀錄!
在國際頂級賽事PascalVOC挑戰賽
目標檢測Competition 3子任務中
搜狗人工智慧圖像團隊
所提交的FPNSSD深度模型
一局取得該項目世界最好成績!
有圖有真相!
下面汪仔就為大家科普一下
什麼是PascalVOC挑戰賽
它是計算機視覺目標檢測的經典權威賽事
其數據集標註質量高、場景複雜
目標多樣、檢測難度大
是快速檢驗演算法有效性的首選
在計算視覺領域
Pascal VOC挑戰賽為頂級級別比賽
是國內外AI公司
激烈競爭的主賽場之一
PASCAL VOC的數據集包括20個目錄
人類,動物、交通工具、室內物體
其中
搜狗圖像團隊參加的Competition 3子任務
以官方提供的數據集為訓練集
不能添加其他額外標註數據
更能體現參賽團隊的模型設計和技術功底
搜狗圖像團隊研發的FPNSSD檢測演算法
借鑒了RetinaNet的架構設計思想
並優化經典的SSD檢測演算法
設計出基於ResNet152的
Feature Pyramid Network(FPN)網路結構
同時融合淺層與深層的多尺度特徵信息
這種在模型上的選擇和優化策略
大大增強了對小目標物體的檢測能力
在此次挑戰賽中
搜狗圖像團隊的FPNSSD檢測演算法在
20個子目錄中獲得10個單項第一
其中在鳥、貓、狗等
小物體類別上勝出優勢明顯
充分驗證了FPNSSD檢測演算法
在模型結構設計上的先進性
此外
FPNSSD檢測演算法採用
SoftmaxLoss + Hard Negative Mining
在FPNSSD框架中
相對當前業內常用的基於
FocalLoss的訓練方式
能取得更高精度
搜狗圖像團隊成員大多來自
清華、北大、中科院、浙大等高校
曾先後取得幾十項相關技術專利
團隊長期專註於場景文字檢測識別
人臉識別、圖像細粒度分類
敏感圖像檢測、圖像理解等
前沿領域研究,相關成果已廣泛應用於
搜狗旅行翻譯寶、搜狗翻譯APP
搜狗輸入法、搜狗汪仔答題助手
搜狗識圖等產品
在眾多垂直領域及具體場景中
滿足著廣大用戶日益多樣化
個性化的應用需求
不僅如此
搜狗人工智慧圖像團隊的前沿成果
還通過搜狗AI開放平台
正在為金融、保險、醫療等
行業客戶提供優質的AI服務和解決方案
作為人工智慧帶路黨的搜狗
未來還將基於圖像識別技術在
更多場景實現進一步突破創新
帶來更豐富便捷的AI體驗
TAG:網眾傳媒 |