中國AI公司公開擊敗谷歌微軟,這次是Yi+AI視覺團隊
本文轉載自Yi+AI團隊
2018年7月,在國際權威計算機視覺競賽PASCAL VOC comp4目標檢測競賽中,Yi+AI團隊獲得了目標檢測單模型第一名,超越了現有排行榜中的微軟研究院、谷歌 、阿里達摩院、Face++等國內外眾多知名公司,以精度90.7%的成績打破了世界記錄,成為世界第一家總成績突破90%計算機視覺企業。同時在Pascal VOC 「comp3」中,首次突破80%,刷新世界紀錄。
Pascal VOC comp4是眾多國內外企業物體檢測團隊證明自己實力的地方,此次Yi+力壓群雄,取得了90.7%的成績,比第二名的阿里達摩院高了1.5個百分點,在物體檢測領域,1.5個百分點意味著需要比對方「多」檢測正確6000多個框,同時值得注意的是,此次Yi+AI團隊使用的是難度更高的單模型,而第二名的方法是多模型融合。
PASCAL VOC可謂視覺識別類競賽的鼻祖,包含了物體分類、目標檢測、圖像分割等任務。PASCAL VOC對計算機視覺的發展具有深遠而巨大的影響,後續的ImageNet競賽的任務設置就基本沿用了它的設定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發團隊先後在這個排行榜上刷新紀錄。
Yi+AI的負責人表示,在此次Pascal VOC comp4競賽中,Yi+AI團隊使用的方法叫做FXRCNN,其中「X」,代表「多元」的意思,意味著Yi+AI使用的結構不僅僅是高準確率的模型,同時也適用多元場景,包括移植到移動端(通過更改Backbone和Head),實現圖像分割(增加Mask分支),實現人體關鍵點(增加Key point分支),實現人臉檢測(增加Face分支)。
Yi+提交的深度學習模型,雖然採用了Faster RCNN的基本結構,但有很多不同之處:
1)採用ResNeXt作為基礎網路,結合FPN實現多尺度特徵融合;
2)在後處理階段,採用SoftNMS和多框投票融合;
3)通過Yi+海量數據進行預訓練;
4)多尺度訓練,進一步加強數據增強。本次提交的模型,是Yi+多年來技術積累的結果,是通過不斷的攻克實際問題的結果,是Yi+內部模型不斷優化的結果,Yi+ AI的FXRCNN在速度,內存,精度,應用範圍等多維度進行了全面的優化。
在人工智慧領域,目標檢測技術應用廣泛,是Yi+AI場景落地的關鍵性技術之一。
Yi+將目標檢測技術應用在圖像搜索引擎和圖片視頻結構化引擎中,Yi+圖像搜索引擎可檢測類目超100類,覆蓋服飾、3C商超、家居、日用品、交通工具等;Yi+圖片視頻結構化引擎則採用目前業界最領先的基於深度學習的通用目標檢測演算法,支持超過300類常用物體的目標檢測、識別,可實現對視頻和圖像中的場景、人、車輛、物體(輪廓)檢測、識別、分割、跟蹤;可識別近10,000種物品,400種場景。
近年來,Yi+對人工智慧、大數據等方向進行了大量的新技術研發和應用,除了目標檢測技術以外,Yi+在人臉識別方向同樣取得了驕人的成績。
2018年3月,國際權威人臉識別公開測試集LFW(LabeledFaces in the Wild)最新公布的測試結果,Yi+人臉識別技術以99.83%的識別精度和較低的波動幅度為位居世界第一,超越了現有LFW排行榜中的谷歌、騰訊優圖、百度、商湯、Face++等國內外眾多知名公司。
人臉識別是Yi+AI的核心產品之一,Yi+人臉識別能快速準確完成人臉檢測、關鍵點檢測及人臉屬性檢測。實現識別出畫面中人物的性別、年齡、種族、情緒、顏值、性感、時尚等屬性,支持中外娛樂明星的識別;基於深度學習的人臉對比技術,實現大規模人臉查找比對,可用於人臉聚類、敏感人物監控等場景。
目前Yi+AI已將人臉識別和目標檢測技術應用在多個使用場景中,包括「智能硬體」、「營銷」、「新零售」、「智慧城市」等解決方案,具體則應用在場景廣告平台、新零售平台、大屏AI助手、智慧安防、智慧交通、智慧社區等多項領域之中。
下一步,Yi+將結合現有技術優勢,讓計算機看懂世界,用科技提供人工智慧服務,幫助人們看見非凡,see different。
Yi+已獲得阿里巴巴等B輪融資,服務眾多500強客戶。團隊成員大多來自頂尖企業與高校,如哥倫比亞大學、帝國理工、耶魯、普林斯頓、普渡、新加坡國大、南洋理工、清華、北大等及微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等企業。
—完—
※眼擎科技CEO朱繼志:自動駕駛視覺成像系統解析
※機器人漢堡店即將開業,做一個漢堡需要5分鐘
TAG:量子位 |