Object Detection Datasets
λ³Έ κΈμ 2020-2νκΈ° βμ»΄ν¨ν° λΉμ β μμ μ λ£κ³ , μ€μ€λ‘ νμ΅νλ©΄μ κ°μΈμ μΈ μ©λλ‘ μ 리ν κ²μ λλ€. μ§μ μ μΈμ λ νμμ λλ€ :)
λͺ©λ‘
- PASCAL VOC
- 2007
- 2012
- ImageNet
- ILSVRC (2010 ~ 2017)
- MS COCO
- 2014
- 2017
PASCAL VOC
2005λ λΆν° 2012λ κΉμ§ μ€μλ PASCAL VOC challengeλ₯Ό μν΄ κ°λ°λ λ°μ΄ν°μ μ΄λ€.
picture from PASCAL VOC
PASCAL VOC
λ°μ΄ν°μ
μ 2007λ
λ²μ κ³Ό 2012λ
λ²μ μ΄ μλ€. λ λͺ¨λ 20κ° ν΄λμ€κ° μμΌλ©°, 2007λ
VOCλ 9,963μ₯, 2012λ
VOCλ 11,530μ₯μ μ΄λ―Έμ§λ₯Ό μ 곡νλ€.
λ³Έλμ PASCAL VOC
λ°μ΄ν°μ μ¬μ΄νΈκ° μ μ μμ΄ μ λμ λ―Έλ¬ μ¬μ΄νΈμΈ μλ μ¬μ΄νΈλ₯Ό ν΅ν΄ λ€μ΄λ‘λ ν μ μλ€.
PASCAL VOC 2007
μ 439MBλ‘ λ°μ΄ν°μ
ν¬κΈ°κ° κ±°λνμ§ μμμ λ°μ΄ν°μ
μ 체ννλ μ©λλ‘ μΈλ§νλ€.
νμ¬λ λͺ¨λΈμ μ±λ₯μ νκ°νλ benchmark μ©λλ‘λ§ μ¬μ©λλ©°, νμ΅μλ μ μ¬μ©νμ§ μλλ€κ³ νλ€.
ImageNet
ImageNet
λ°μ΄ν°μ
μ 1,000κ° ν΄λμ€μ 1.2Mμ₯μ νμ΅ λ°μ΄ν°, 100Kμ₯μ ν
μ€νΈ λ°μ΄ν°λ₯Ό κ°μ§ κ±°λν λ°μ΄ν°μ
μ΄λ€.
picture from ADRIAN COLYER's blog
ImageNet
λ°μ΄ν°μ
μ νμ©νλ ILSVRC ImageNet Large Scale Visual Recognition Challenge λνλ₯Ό μ£Όκ΄νλ€. ILSVRC λνλ 2010λ
λΆν° 2017λ
κΉμ§ μ§νλμλ€.
ILSVRC λνλ₯Ό ν΅ν΄ κΈ°λΌμ± κ°μ λͺ¨λΈλ€μ΄ μμμ Έ λμλ€. μ°μΉν λͺ¨λΈλ€μ μ΄ν΄λ³΄λ©΄,
picture from Siddharth Das's blog
AlexNet, VGG, ResNet λ±λ± μ λ§ μ»΄ν¨ν° λΉμ λΆμΌλ₯Ό 견μΈν κ°ν λͺ¨λΈλ€μ λ°°μΆν λνλ€.
λ€λ§, λ°μ΄ν°μ λ€μ΄λ‘λ κ³Όμ μ΄ μ‘°κΈ κΉλ€λ‘λ€.
κ·Έλ¬λ ImageNet
λ°μ΄ν°μ
μλ μλμ κ°μ λ¬Έμ μ μ΄ μμλλ°
- μ΄λ―Έμ§ λ΄μ objectκ° ν° νΈμ
- objectκ° μ€μμ μ μμΉν΄ μμ
- μ΄λ―Έμ§μ μ‘΄μ¬νλ objectμ μκ° μ μ
μ΄λ° λ¬Έμ μ λλ¬Έμ λ°μ΄ν°μ μΈλΆμ μ€μ μ¬μ§μμλ λͺ¨λΈμ μ νλκ° λ¨μ΄μ§λ€λ μ§μ μ΄ μμλ€.
MS COCO
picture from MS COCO
MC COCO
λ PASCAL VOC
μ ImageNet
λ°μ΄ν°μ
μ λ¬Έμ μ μ ν΄κ²°ν 2014λ
μ 곡κ°λ λ°μ΄ν°μ
μ΄λ€.
λ§ 4μΈ μμ΄κ° μ½κ² μΈμν μ μλ μ΄λ―Έμ§λ€μ μ 곡νλ€. μ΄λ―Έμ§ λ΄λΆμ λ€μν ν¬κΈ°μ 물체λ€μ΄ μ‘΄μ¬νλ©°, λμ νλ₯ λ‘ μμ 물체λ€μ΄ λ±μ₯νλ€.
λλ΅ 80κ° ν΄λμ€1μ 330Kμ₯μ μ΄λ―Έμ§λ₯Ό μ 곡νλ©°, 1.5M μ λμ object instanceλ€μ΄ μ‘΄μ¬νλ€.
2014λ λ²μ κ³Ό 2017λ λ²μ μ΄ μ‘΄μ¬νλ€. ν΄λμ€ λ μ΄λΈμ μλ λλ€ 80κ°λ‘ λμΌνλ€.
COCO 2017
λ COCO 2014
μμ Train/Valμ λΉμ¨μ μ‘°μ ν λ°μ΄ν°μ
μ΄λ€. COCO 2014
μμλ Train/Valμ 83K/41Kλ‘ λλ΄λ€λ©΄, COCO 2017
μ Train/Valμ 118K/5Kμ λΉμ¨λ‘ λλμλ€.
λ°μ΄ν°μ μ ν¬κΈ°κ° Trainμ β₯13GB, Valκ³Ό Testλ 6GB μ λμ κ±°λν λ°μ΄ν°μ μ΄λ€.
μ°Έκ³ λ‘ λ³ΈμΈμ΄ κ°μ§ 8GB GPUλ‘λ 컀λ²κ° μ λλ μμ΄μλ€ γ γ·γ· λ°°μΉ μ¬μ΄μ¦λ₯Ό μ μ‘°μ νλ©΄ λͺ¨λΈμ λ릴 μ μκΈ΄ νλ€. κ·Έλ°λ° 1 epoch λλ μκ°μ΄ λμ ν κΈ°λ€λ¦΄ μ μλ μμ€μ΄λΌμ κΉλνκ² λ‘컬μμ λ리λ κ±Έ ν¬κΈ°νλ€ γ γ
μ°Έκ³ μλ£
- λ€ν¬ νλ‘κ·Έλλ¨Έ/μ»΄ν¨ν° λΉμ λΆμΌμ κ΅μ λν μκ°
- ChaCha/Object detection dataset 리뷰
- COCO Category 91 vs 80