fashionAI服飾屬性標籤識別總結
賽題:
a) 屬性維度(AttrKey):比如袖長。是一個屬性定義範疇。
b) 屬性值(AttrValues):比如中袖、七分袖、九分袖等。它們都是在屬性定義範疇(袖長)下面的屬性值。
上圖實線框所示所有屬性值為本次競賽的直接評測目標,專註於服飾商品的局部屬性識別,圖中所有可清晰辨別的屬性標籤都要求預測。考慮到服飾知識的複雜性,初賽提供的數據僅包含單人模特的商品圖。在複賽中,將進一步引入單件平鋪商品圖的屬性識別問題。
top5的選手所採用的基礎模型有SENet、InceptionV4、ResNetResNeXt等,並且大部分選手選擇對分成length和design2部分分別訓練,並且都採用了TTA (Test Time Augmentation)。
下面按照答辯順序分別介紹top5選手解決方案中的要點。
1
BUPT_OVERFITED
①基礎網路為SENet+InceptionV4
②聯合訓練八個大類分為length4類+design4類,分別訓練,基礎網路共享,fc層分開
③對於design,根據熱力圖裁剪出關注的局部(如衣領部分)可對訓練提供一個弱監督,原圖和熱力圖裁剪的局部一起輸入進行多域訓練
④對於length,修改loss利用不確定的m標籤信息,對top2,top3提升更明顯
2
SIAT-MMLab-VIP
①基礎網路senet、resnext 雙路網路分類訓練好之後concat然後fc-softmax
②嘗試各種數據增強,發現水平翻轉和縮放有用,其他增強方法作用不大
③主要關注數據預處理。design類,兩個尺度的裁剪(neck crop body crop) 利用關鍵點定位現有模型alpha pose(「Pose Flow: Efficient Online Pose Tracking」by Xiu et al.)進行定位和高精度裁剪,肩寬加臂長確定裁剪區域。length類,用alpha pose進行關鍵點校正,body alignment, 二分類器把是否有人分開,有人體的部分數據圖片根據關鍵點進行裁剪並使用平移旋轉高度變換等數據增強。平鋪圖的部分數據用目標檢測確定boundingbox再進行分類。
3
小飛豬
①fastRCNN和yolov2進行目標檢測boundingbox然後進行數據增強
②基礎網路使用DPN和NASNet,進行多任務學習
③考慮到長度的遞增性,設計soft label和incremental label
4
禾思眾成
①基礎網路resnet、InceptionV4
②使用聯合訓練
③使用訓練好的teacher model處理圖片未標記屬性,作為soft label
④所提到的Net2Net,主要參考"Parallel Grid Pooling for Data Augmentation" by Takeki et al,使用dilated convolution,增大感受野,又不損失信息,還不過多增大計算量
⑤stochastic weight average 模型融合,主要參考「Averaging Weights Leads to Wider Optima and Better Generalization」 by Izmailov et al
5
Just GAN
①多任務模型,自下而上層間特徵融合
②基於類間距離(interclass distance)的loss設計,主要用length類
③訓練策略:
AMSGrad優化器(「On the convergence of adam and beyond」by Reddi et al),Cyclical learning rates in each epoch(「Cyclical learning rates for training neural networks」by Smith et al)
TAG:北極魚 |