Adnotacje twarzy w różnych grupach demograficznych, w ramach dyscypliny etycznej — studium przypadku
W jaki sposób Shaip stworzył na dużą skalę adnotacje do ludzkich twarzy, łącząc wykrywanie pól ograniczających i mapowanie kluczowych punktów charakterystycznych twarzy z ponad 10 warstwami atrybutów — stworzonymi jako zbiór danych klasy produkcyjnej do rozpoznawania twarzy, wykrywania emocji, szacowania wieku i weryfikacji tożsamości za pomocą sztucznej inteligencji, przy zachowaniu rygorystycznych zasad etyki.
Przegląd projektu
Wraz z wdrażaniem sztucznej inteligencji twarzy w sektorach bezpieczeństwa, opieki zdrowotnej, handlu detalicznego i technologii konsumenckich, klient potrzebował kompleksowego systemu adnotacji, który łączyłby wykrywanie twarzy z mapowaniem punktów orientacyjnych na poziomie cech — uwzględniając zróżnicowane dane demograficzne, oświetlenie, kąty i warunki okluzji — przy zachowaniu ścisłych zasad prywatności i etycznego postępowania.
Shaip zbudował kompleksowy proces adnotacji obejmujący wykrywanie pól ograniczających, rozmieszczanie kluczowych punktów charakterystycznych twarzy, tagowanie wieloma atrybutami na ponad 10 warstwach i pokrycie skrajnych przypadków demograficznych — generując gotowe do modelowania zestawy danych dla aplikacji sztucznej inteligencji do analizy twarzy.
Kluczowe statystyki
Typ adnotacji
Pudełko + Zabytki
Warstwy atrybutów
10 +
Różnorodność źródeł
Obraz + Wideo
Demografia
Różnorodność
Wyzwania
- łącząc wykrywanie pola ograniczającego w mapowanie kluczowych punktów charakterystycznych twarzy równolegle
- Prowadzenie ekstremalne kąty, rozmycie ruchu i niska rozdzielczość obrazy z monitoringu
- Praca w poprzek warunki okluzji — maski, okulary, kapelusze, włosy, części twarzy
- zapewnienie różnorodność demograficzna w różnych grupach wiekowych, płci i pochodzeniu etnicznym
- Stosowanie surowe wytyczne dotyczące prywatności i etyki przez cały proces adnotacji
Rozwiązanie
Połączone wykrywanie + adnotacja punktu orientacyjnego
Każda ludzka twarz na każdym zdjęciu została opisana za pomocą kombinacji pól ograniczających do wykrywania twarzy oraz punktów kluczowych twarzy do lokalizacji na poziomie cech. Punkty kluczowe twarzy obejmowały oczy, brwi, czubek nosa, grzbiet nosa, kąciki ust, górną i dolną wargę, linię żuchwy, brodę i uszy – tworząc kompleksową mapę przestrzenną każdej twarzy.
Ponad 10 warstw atrybutów
Każda opisana twarz została wzbogacona o atrybuty obejmujące grupę wiekową, płeć, pochodzenie etniczne, stan emocjonalny (szczęśliwy, smutny, zły, zaskoczony, neutralny, przestraszony), orientację twarzy (frontalna, profilowa, trzy czwarte), stan okluzji (okulary, maski, nakrycia głowy, włosy), odcień skóry, warunki oświetleniowe oraz ocenę jakości obrazu. To wielowarstwowe bogactwo atrybutów napędza sztuczną inteligencję twarzy w wielu aplikacjach.
Zakres różnorodności demograficznej
Twarze pojawiały się w szerokim zakresie warunków – zmienne oświetlenie, skrajne kąty, częściowe przesłonięcia, rozmycie w klatkach wideo, niska rozdzielczość nagrań z monitoringu oraz zróżnicowana reprezentacja etniczna i wiekowa. Proces adnotacji został zaprojektowany specjalnie z myślą o zachowaniu dokładności w tym zróżnicowaniu, zapobiegając stronniczości demograficznej w wytrenowanych modelach.
Reguły adnotacji przypadków brzegowych
Przypadki brzegowe, takie jak częściowo widoczne twarze na krawędziach obrazu, twarze odbite w lustrach, zasłonięcie twarzy maskami lub okularami przeciwsłonecznymi oraz twarze niemowląt i osób starszych o niestandardowych proporcjach, zostały obsłużone za pomocą szczegółowych reguł adnotacji, specyficznych dla danego przypadku. Reguły te zapewniły odporność zbioru danych na rzeczywiste warunki wdrożenia sztucznej inteligencji rozpoznawania twarzy.
Prywatność i zgodność z zasadami etycznymi
Adnotatorzy przestrzegali ścisłych wytycznych dotyczących prywatności i etyki w całym projekcie, zapewniając zgodność przetwarzania danych z obowiązującymi standardami ochrony danych. Ta warstwa zgodności jest niezbędna dla aplikacji wykorzystujących sztuczną inteligencję do rozpoznawania twarzy, działających w regulowanych branżach, takich jak bezpieczeństwo, bankowość i opieka zdrowotna.
Zakres projektu
| Typ zbioru danych | Metody | Atrybuty | Źródła | Zasięg demograficzny | Zgodność |
|---|---|---|---|---|---|
| Adnotacja twarzy ludzkiej | Pole + punkty kluczowe | 10+ warstw | Obraz + klatki wideo | Różnorodność wieku, płci i pochodzenia etnicznego | Ścisła prywatność + etyka |
Wyniki
- Założona połączony proces wykrywania i adnotacji punktów orientacyjnych dla sztucznej inteligencji twarzy
- znormalizowane 10+ warstw atrybutów obejmujące dane demograficzne, emocje, orientację, okluzję
- Dostarczany zasięg zróżnicowany demograficznie aby złagodzić stronniczość modelu
- Zaimplementowane obsługa przypadków brzegowych do częściowych twarzy, luster, masek i niestandardowych proporcji
- Utrzymany ścisła prywatność i zgodność z zasadami etycznymi w całym procesie adnotacji
Ogólnie rzecz biorąc, Shaip pomógł przekształcić złożone wymagania dotyczące adnotacji twarzy w ustrukturyzowany, gotowy do produkcji proces — taki, który obsługuje rozpoznawanie twarzy, wykrywanie emocji, szacowanie wieku, weryfikację tożsamości, zapobieganie podszywaniu się oraz interakcję człowieka z komputerem za pomocą sztucznej inteligencji z precyzją i etyką wymaganą przez daną aplikację.
System adnotacji twarzy Shaipa zapewnił nam różnorodność demograficzną i odporność na skrajne przypadki, czego nie może osiągnąć większość dostawców — a ich dyscyplina etyczna sprawiła, że nasze przeglądy zgodności przebiegły bezproblemowo.
— Szef ds. sztucznej inteligencji w zakresie tożsamości