Definicja
Gromadzenie danych obrazowych to proces gromadzenia zbiorów danych wizualnych do szkolenia systemów wizji komputerowej. Źródłami danych są kamery, drony, satelity i publiczne zbiory danych.
Cel
Celem jest zapewnienie, aby modele zawierały różnorodne przykłady uczenia się wzorców wizualnych w różnych środowiskach i przypadkach użycia.
Znaczenie
- Istotne dla dokładności modelu widzenia komputerowego.
- Musi uwzględniać zróżnicowane oświetlenie, kąty i dane demograficzne, aby uniknąć stronniczości.
- Powstaje problem prywatności i zgody podczas gromadzenia wizerunków ludzi.
- Wysokie wymagania dotyczące przechowywania i zarządzania.
Jak to działa
- Określ cele projektu i potrzeby dotyczące danych.
- Zbieraj obrazy za pomocą czujników, interfejsów API lub repozytoriów.
- Organizuj i oznaczaj metadane w celu ułatwienia śledzenia.
- Przechowuj bezpiecznie w celu dokonania adnotacji lub w celach szkoleniowych.
- Ciągła aktualizacja zestawów danych w celu zapewnienia ich trafności.
Przykłady (świat rzeczywisty)
- ImageNet: wizualny zbiór danych na dużą skalę dla sztucznej inteligencji.
- Zbiór danych COCO: zebrane i opatrzone komentarzem obrazy na potrzeby badań.
- Google Street View: obrazy zbierane przez aparaty fotograficzne do celów mapowania i wizji.
Odniesienia / Dalsza lektura
- Projekt ImageNet — Princeton i Stanford.
- Zbiór danych COCO — cocodataset.org.
- ISO/IEC TR 20547-5: Architektura referencyjna dużych zbiorów danych.
- Dlaczego do przetwarzania obrazu komputerowego potrzebny jest zbiór danych treningowych?