Adnotacja pola ograniczającego 3D LiDAR dla autonomicznej jazdy

W jaki sposób Shaip dostarczył precyzyjną adnotację trójwymiarowych prostopadłościanów ograniczających w 14 klasach obiektów z ok. 53 polami na klatkę na podstawie danych z chmury punktów pojedynczej klatki — skalibrowanych na podstawie obrazów 2D w celu zapewnienia percepcji pojazdów autonomicznych w skali produkcyjnej.

Adnotacja pola ograniczającego lidar 3D do autonomicznej jazdy

Przegląd projektu

Wraz z wdrażaniem autonomicznej percepcji jazdy w produkcji klient potrzebował wysoce wyspecjalizowanego procesu adnotacji 3D LiDAR, który umożliwiałby umieszczanie precyzyjnych prostopadłościennych pól ograniczających o gęstości wymaganej dla rzeczywistych danych szkoleniowych AV — z etykietowaniem wieloatrybutowym i kalibracją obrazu 2D.

Shaip zbudował kompleksowy proces adnotacji obejmujący rozmieszczanie trójwymiarowych prostopadłościanów, wymuszanie domyślnego rozmiaru, etykietowanie wielu atrybutów, obsługę skrajnych przypadków środowiskowych i walidację obrazu referencyjnego — dostarczając gotowe do użycia w modelu zestawy danych percepcji AV w 14 klasach obiektów.

Status klucza

Klasy obiektów

14

Liczba pudełek na ramkę

~ 53

Warstwy atrybutów

5

Poziomy okluzji

4

Wyzwania

  • wprowadzanie ~53 trójwymiarowe prostopadłościenne pudełka na klatkę z precyzyjnym, ciasnym dopasowaniem do krawędzi chmury punktów
  • Prowadzenie 14 klas obiektów przez pojazdy, pieszych, zwierzęta i obiekty ruchome
  • Pracujący jednocześnie z obrazami kalibracyjnymi 2D i chmurą punktów 3D dane
  • Zarządzający chmury punktów widmo, odbicia na ziemi, mgła, mgiełka i rozpryski wody
  • Egzekwowanie domyślne wymiary rozmiaru dla każdej klasy dla spójności między klatkami

Rozwiązanie

Proces rozmieszczania prostopadłościanów 3D

Adnotatorzy umieszczali precyzyjne, prostopadłościenne, trójwymiarowe pola ograniczające na danych z chmury punktów w pojedynczych klatkach, jednocześnie z 2D obrazem odniesienia kalibracji. Każda klasa miała zdefiniowane domyślne wymiary pól ograniczających, aby zapewnić spójność rozmiarów w różnych klatkach — samochody 3.4–5.1 m, ciężarówki 3.4–14 m, piesi 0.4–1.2 m szerokości.

Etykietowanie wieloatrybutowe

Oprócz umieszczenia pola ograniczającego, każdy opisany obiekt otrzymał etykiety atrybutów obejmujące stan pojazdu (jazda/zaparkowany), stan pojazdu dwukołowego (z rowerzystą/bez rowerzysty), stan pieszego (stojący/siedzący/leżący), stan zasłonięcia (4 poziomy: brak, częściowe, całkowite, całkowite) i stan kończyn (wystające obiekty, otwarte drzwi, przymocowany sprzęt).

Obsługa skrajnych przypadków środowiskowych

Surowe zasady regulowały adnotację silnie zasłoniętych lub oddalonych obiektów, chmur punktów widmowych spowodowanych błędną kalibracją podwójnego LiDAR-u, odbić od podłoża oraz szumów otoczenia pochodzących z rozprysków wody, mgły i mgiełki. Wyraźnie wykluczono lusterka boczne, otwarte drzwi, ramiona dźwigu, bagażniki dachowe i bagaże dla pieszych; uwzględniono syreny alarmowe i skrzynie ładunkowe ciężarówek.

Walidacja ścisłego dopasowania

Wymagano, aby pola ściśle przylegały do ​​krawędzi chmury punktów, z minimalnymi widocznymi przerwami. Orientację zweryfikowano za pomocą danych kalibracyjnych i kontekstu pasa ruchu, gdzie chmury punktów były niejednoznaczne. Sceny nocne i deszczowe traktowano tak samo jak w warunkach dziennych, aby zapewnić spójność adnotacji.

Wielomodalne zapewnianie jakości

Wszystkie adnotacje zostały zweryfikowane na podstawie referencyjnych obrazów 2D w celu weryfikacji poprawności rozmiaru i orientacji. Ta międzymodalna warstwa kontroli jakości (QA) wychwyciła rozbieżności, które nie byłyby widoczne z samej chmury punktów, zapewniając dokładność na poziomie produkcyjnym w dalszym szkoleniu modelu percepcji AV.

Zakres projektu

Typ zbioru danych Zajęcia Pudełka/Ramki Atrybuty Poziomy okluzji Walidacja
Percepcja 3D LiDAR AV 14 ~53 średnio 5 warstw atrybutów 4 (0–100%) Kontrola krzyżowa obrazu 2D

Wyniki

  • Założona gęsty proces adnotacji 3D LiDAR z ~53 polami na klatkę przy dokładności produkcyjnej
  • znormalizowane 14-klasowa ontologia obiektów z wymuszaniem domyślnego rozmiaru dla każdej klasy
  • Dostarczany 5 warstw atrybutów w tym 4-stopniowa klasyfikacja okluzji
  • Zaimplementowane międzymodalne zapewnianie jakości walidacja pudełek 3D na podstawie obrazów kalibracyjnych 2D
  • Włączono klienta percepcja pojazdów autonomicznych, ADAS i jazda autonomiczna model szkolenia

Ogólnie rzecz biorąc, Shaip pomógł przekształcić złożone wymagania dotyczące percepcji 3D LiDAR w ustrukturyzowany, gotowy do produkcji proces adnotacji — taki, który obsługuje autonomiczne prowadzenie pojazdów, ADAS, robotaksówki i rozwój autonomicznych ciężarówek z dokładnością na poziomie kalibracji w trudnych warunkach rzeczywistych.

Ikona cytatu

Shaip poradził sobie z przypadkami brzegowymi AV, które zakłócają większość procesów adnotacji – mgłą, chmurami punktów widmo, gęstą okluzją i ~53 polami na klatkę. Ich walidacja krzyżowa 2D-3D dostarczyła nam zaufanych danych do treningu percepcji.

— Inżynier wiodący, Perception Stack

★ ★ ★ ★ ★
Ikona cytatu