Definicja
Segmentacja semantyczna to zadanie komputerowej wizji polegające na klasyfikowaniu każdego piksela na obrazie i przyporządkowywaniu go do określonej kategorii, np. droga, budynek lub pieszy.
Cel
Celem jest zapewnienie szczegółowego zrozumienia sceny na potrzeby zastosowań sztucznej inteligencji w pojazdach autonomicznych, obrazowaniu medycznym i robotyce.
Znaczenie
- Niezbędne do postrzegania na poziomie pikseli w systemach o znaczeniu krytycznym dla bezpieczeństwa.
- Umożliwia precyzyjne wyznaczanie granic obiektów w porównaniu do pól ograniczających.
- Wymaga dużych, opatrzonych adnotacjami zbiorów danych.
- Wymaga dużej mocy obliczeniowej przy wysokich rozdzielczościach.
Jak to działa
- Zbieraj i opisuj obrazy na poziomie pikseli.
- Trenuj modele głębokiego uczenia, takie jak w pełni splotowe sieci.
- Obraz wejściowy jest przetwarzany na przewidywania na poziomie pikseli.
- Maska wyjściowa przypisuje każdy piksel do klasy.
- Oceniaj za pomocą wskaźników takich jak Intersection over Union (IoU).
Przykłady (świat rzeczywisty)
- Zbiór danych miejskich krajobrazów: segmentacja semantyczna scen miejskich.
- Tesla Autopilot: segmentacja na poziomie pikseli do nawigacji drogowej.
- Obrazowanie medyczne: segmentacja guzów w obrazach MRI.
Odniesienia / Dalsza lektura
- Long i in. „W pełni splotowe sieci do segmentacji semantycznej”. CVPR 2015.
- Zbiór danych dotyczących krajobrazów miejskich.
- IEEE Transactions on Medical Imaging.