ImageNet 2016的結(jié)果揭曉,冠軍幾乎被中國團隊包攬:CUImage(商湯和港中文),Trimps-Soushen(公安部三所),CUvideo(商湯和港中文),HikVision(??低?/a>),SenseCUSceneParsing(商湯和港中文),NUIST(南京信息工程大學)分別拿下多個項目的冠軍。
1、物體探測
任務1a,用提供的訓練數(shù)據(jù)進行物體探測,冠軍隊伍 CUImage,使用提供數(shù)據(jù)合成6個模型,探測物體勝出種類數(shù)量109,精準度 0.662751。
下圖,任務1b,使用額外訓練數(shù)據(jù)進行物體探測。冠軍隊伍 CUImage,使用的是自己在ImageNet Det 數(shù)據(jù)上的標簽基準。識別物體勝出種類數(shù)量176個,平均精準度0.66081。
2. 物體定位
下圖,任務2a:使用提供的訓練數(shù)據(jù)進行分類+定位。冠軍隊伍Trimps-Soushen。第一名的模型定位錯誤率為0.077087,分類錯誤率為0.02991。
下圖,任務2b:使用額外訓練數(shù)據(jù)進行分類和定位結(jié)果。Trimps-Soushen在定位和分類上依然排在第一。
3. 視頻中的物體探測(VID)
下圖,任務3a,使用提供訓練數(shù)據(jù)進行的視頻中的物體探測。冠軍團隊NUIST,識別物體勝出種類數(shù)量10個,平均精準度0.808292。
下圖,任務3b,使用額外訓練數(shù)據(jù)進行的視頻中的物體探測。冠軍團隊NUIST,識別物體勝出種類數(shù)量17個,平均精準度0.79593。
下圖,任務3c,用提供訓練數(shù)據(jù)進行的視頻中物體探測和追蹤,冠軍是CUvideo。
下圖,任務3d,用額外訓練數(shù)據(jù)進行的視頻中物體探測和追蹤,冠軍是NUIST。
4. 場景分類
冠軍 Hikvision
5. 場景分析
冠軍SenseCUSceneParsing