Adnotacja pola ograniczającego narzędzi do angażowania gruntu (GET)
Firma Shaip dostarczyła miesięcznie 40 000 adnotacji w postaci pól ograniczających w 15 klasach narzędzi do pracy w terenie — zęby łyżki, adaptery, osłony, osłony krawędzi — na obrazach z łyżki koparki, rozróżniając powierzchnie wewnętrzne i zewnętrzne w warunkach terenowych, w których występuje brud, zanieczyszczenia, rozmycie ruchu i słabe oświetlenie, przy bramce o dokładności ponad 99% w formacie KITTI 1.0, w ramach 12-miesięcznego kontraktu na monitorowanie zużycia za pomocą sztucznej inteligencji
Przegląd projektu
Wraz z przeniesieniem predykcyjnej konserwacji i monitorowania zużycia do ciężkiego sprzętu AI, klientowi potrzebne było narzędzie do adnotacji specyficzne dla danej dziedziny, które potrafiłoby wykrywać i oznaczać narzędzia do pracy w terenie (GET) na łyżkach koparki na podstawie zaszumionych, zabrudzonych, rzeczywistych obrazów terenowych.
Shaip zbudował kompleksowy proces adnotacji obejmujący rozmieszczanie pól ograniczających w 15 klasach GET, obsługę przypadków brzegowych według złotych reguł, dwupoziomową kontrolę jakości i cotygodniowe dostarczanie KITTI 1.0 — obsługujący 12-miesięczny harmonogram produkcyjny obejmujący 40 tys. obrazów miesięcznie przy dokładności na poziomie 99%.
Status klucza
Obrazy miesięcznie
40,000
Zajęcia GET
15
Próg dokładności
99%
Dostawa tygodniowa
10,000
Wyzwania
- Adnotacje 40,000 obrazów miesięcznie w 9–10 pól ograniczających na obraz średnio
- Prowadzenie 15 odrębnych klas GET z różnicowaniem twarzy wewnętrznej i zewnętrznej
- Współpraca z obrazy o jakości terenowej — brud, zanieczyszczenia, rozmycie ruchu, słabe oświetlenie i trudne kąty
- Utrzymywanie Dokładność adnotacji na poziomie ponad 99% pod presją cotygodniowych dostaw o dużej objętości
- Eksportowanie w Format KITTI 1.0 gotowy do bezpośredniej integracji szkolenia modelu
Rozwiązanie
Schemat GET i różnicowanie klas
Shaip skonfigurował 15-klasową ontologię GET obejmującą zarówno wewnętrzne, jak i zewnętrzne widoki zasobników. Adnotatorzy zostali przeszkoleni w rozróżnianiu między wewnętrznymi i zewnętrznymi powierzchniami każdego komponentu – rozróżnienie specyficzne dla danej domeny, kluczowe dla dokładności monitorowania zużycia w dalszej części łańcucha.
Złote zasady obrazowania terenowego
Adnotatorzy przestrzegali ścisłych złotych zasad, aby zachować integralność danych. Nie utworzono adnotacji, w których komponenty nie były wyraźnie widoczne. Pominięto żądania GET pokryte ponad 50% zanieczyszczeń. Wykluczono komponenty rozmyte lub ciemne. Klasy warg były oznaczane tylko wtedy, gdy obiekt był widoczny w 100%. Powiększenie służyło wyłącznie do nawigacji, a nie do podejmowania decyzji o etykietowaniu.
Biblioteka szkoleń Edge-Case
Udokumentowano czternaście szczegółowych studiów przypadków, aby wyszkolić adnotatorów w zakresie typowych przypadków brzegowych — częściowo zasłoniętych obiektów GET, kontenerów w ruchu, ciemnych tła i niejednoznaczności granic między sąsiadującymi komponentami. Dzięki tej bibliotece wytyczne dotyczące adnotacji stały się jednymi z najbardziej kompleksowych w dziedzinie sztucznej inteligencji w ciężkim sprzęcie.
Dwupoziomowa kontrola jakości i bramka o dokładności 99%
Po adnotacji Poziomu 1 wszystkie obrazy przekazano do dedykowanego zespołu kontroli jakości (QC) w celu przeprowadzenia ustrukturyzowanej oceny. Drobne błędy poprawiono na podstawie opinii adnotatora; poważne błędy skutkowały ponownym przydzieleniem prac. Zestawy danych zatwierdzano dopiero po osiągnięciu dokładności adnotacji na poziomie 99% lub wyższym. Wszystkie wyniki kontroli jakości (QC) rejestrowano w arkuszu śledzenia dla zapewnienia pełnej transparentności.
Tygodniowa dostawa w formacie KITTI 1.0
Tygodniowy cel dostaw został ściśle utrzymany na poziomie 1.0 000 obrazów, wszystkie wyeksportowane w formacie KITTI 1.0 i gotowe do bezpośredniej integracji z modelem. 12-miesięczny kontrakt utrzymał tę częstotliwość bez żadnych opóźnień.
Zakres projektu
| Typ zbioru danych | Miesięczny wolumen | Zajęcia | Średnie pola / obraz | Format: | Umowa |
|---|---|---|---|---|---|
| Pobierz adnotację ograniczającego pola | Obrazy 40,000 | 15 klas GET | 9–10 pudełek | KITTI 1.0 | 12 miesięcy |
Wyniki
- Założona 12-miesięczny proces przetwarzania 40 tys. obrazów miesięcznie do wykrywania zużycia ciężkiego sprzętu AI
- znormalizowane 15 klas GET z różnicowaniem powierzchni wewnętrznej/zewnętrznej
- Utrzymywał Bramka o dokładności 99%+ w każdej partii pod presją cotygodniowych dostaw
- Zbudowano 14 studium przypadku biblioteki przypadków brzegowych do szkolenia i wdrażania adnotatorów
- Dostarczany Wyjścia w formacie KITTI 1.0 gotowy do bezpośredniej integracji szkolenia modelu
Ogólnie rzecz biorąc, Shaip pomógł przekształcić wymagania dotyczące wykrywania GET w warunkach terenowych w ustrukturyzowany, gotowy do produkcji proces adnotacji — taki, który jest w stanie obsługiwać monitorowanie zużycia, konserwację predykcyjną i inicjatywy dotyczące sztucznej inteligencji w sprzęcie budowlanym, zapewniając spójność, możliwość śledzenia i realistyczną dokładność w warunkach terenowych.
Shaip poradził sobie z najbardziej chaotycznym obrazem, jaki mieliśmy – brudem, gruzem, rozmyciem w ruchu, całą masą – i mimo to zapewnił ponad 99% dokładności w 12-miesięcznym, cotygodniowym cyklu dostaw. Wyniki ich KITTI 1.0 trafiły prosto do szkolenia modelu.
— Menedżer produktu, sztuczna inteligencja ciężkiego sprzętu