Adnotacje twarzy w różnych grupach demograficznych, w ramach dyscypliny etycznej — studium przypadku

W jaki sposób Shaip stworzył na dużą skalę adnotacje do ludzkich twarzy, łącząc wykrywanie pól ograniczających i mapowanie kluczowych punktów charakterystycznych twarzy z ponad 10 warstwami atrybutów — stworzonymi jako zbiór danych klasy produkcyjnej do rozpoznawania twarzy, wykrywania emocji, szacowania wieku i weryfikacji tożsamości za pomocą sztucznej inteligencji, przy zachowaniu rygorystycznych zasad etyki.

Adnotacja twarzy ludzkiej

Przegląd projektu

Wraz z wdrażaniem sztucznej inteligencji twarzy w sektorach bezpieczeństwa, opieki zdrowotnej, handlu detalicznego i technologii konsumenckich, klient potrzebował kompleksowego systemu adnotacji, który łączyłby wykrywanie twarzy z mapowaniem punktów orientacyjnych na poziomie cech — uwzględniając zróżnicowane dane demograficzne, oświetlenie, kąty i warunki okluzji — przy zachowaniu ścisłych zasad prywatności i etycznego postępowania.

Shaip zbudował kompleksowy proces adnotacji obejmujący wykrywanie pól ograniczających, rozmieszczanie kluczowych punktów charakterystycznych twarzy, tagowanie wieloma atrybutami na ponad 10 warstwach i pokrycie skrajnych przypadków demograficznych — generując gotowe do modelowania zestawy danych dla aplikacji sztucznej inteligencji do analizy twarzy.

Kluczowe statystyki

Typ adnotacji

Pudełko + Zabytki

Warstwy atrybutów

10 +

Różnorodność źródeł

Obraz + Wideo

Demografia

Różnorodność

Wyzwania

  • łącząc wykrywanie pola ograniczającego w mapowanie kluczowych punktów charakterystycznych twarzy równolegle
  • Prowadzenie ekstremalne kąty, rozmycie ruchu i niska rozdzielczość obrazy z monitoringu
  • Praca w poprzek warunki okluzji — maski, okulary, kapelusze, włosy, części twarzy
  • zapewnienie różnorodność demograficzna w różnych grupach wiekowych, płci i pochodzeniu etnicznym
  • Stosowanie surowe wytyczne dotyczące prywatności i etyki przez cały proces adnotacji

Rozwiązanie

Połączone wykrywanie + adnotacja punktu orientacyjnego

Każda ludzka twarz na każdym zdjęciu została opisana za pomocą kombinacji pól ograniczających do wykrywania twarzy oraz punktów kluczowych twarzy do lokalizacji na poziomie cech. Punkty kluczowe twarzy obejmowały oczy, brwi, czubek nosa, grzbiet nosa, kąciki ust, górną i dolną wargę, linię żuchwy, brodę i uszy – tworząc kompleksową mapę przestrzenną każdej twarzy.

Ponad 10 warstw atrybutów

Każda opisana twarz została wzbogacona o atrybuty obejmujące grupę wiekową, płeć, pochodzenie etniczne, stan emocjonalny (szczęśliwy, smutny, zły, zaskoczony, neutralny, przestraszony), orientację twarzy (frontalna, profilowa, trzy czwarte), stan okluzji (okulary, maski, nakrycia głowy, włosy), odcień skóry, warunki oświetleniowe oraz ocenę jakości obrazu. To wielowarstwowe bogactwo atrybutów napędza sztuczną inteligencję twarzy w wielu aplikacjach.

Zakres różnorodności demograficznej

Twarze pojawiały się w szerokim zakresie warunków – zmienne oświetlenie, skrajne kąty, częściowe przesłonięcia, rozmycie w klatkach wideo, niska rozdzielczość nagrań z monitoringu oraz zróżnicowana reprezentacja etniczna i wiekowa. Proces adnotacji został zaprojektowany specjalnie z myślą o zachowaniu dokładności w tym zróżnicowaniu, zapobiegając stronniczości demograficznej w wytrenowanych modelach.

Reguły adnotacji przypadków brzegowych

Przypadki brzegowe, takie jak częściowo widoczne twarze na krawędziach obrazu, twarze odbite w lustrach, zasłonięcie twarzy maskami lub okularami przeciwsłonecznymi oraz twarze niemowląt i osób starszych o niestandardowych proporcjach, zostały obsłużone za pomocą szczegółowych reguł adnotacji, specyficznych dla danego przypadku. Reguły te zapewniły odporność zbioru danych na rzeczywiste warunki wdrożenia sztucznej inteligencji rozpoznawania twarzy.

Prywatność i zgodność z zasadami etycznymi

Adnotatorzy przestrzegali ścisłych wytycznych dotyczących prywatności i etyki w całym projekcie, zapewniając zgodność przetwarzania danych z obowiązującymi standardami ochrony danych. Ta warstwa zgodności jest niezbędna dla aplikacji wykorzystujących sztuczną inteligencję do rozpoznawania twarzy, działających w regulowanych branżach, takich jak bezpieczeństwo, bankowość i opieka zdrowotna.

Zakres projektu

Typ zbioru danych Metody Atrybuty Źródła Zasięg demograficzny Zgodność
Adnotacja twarzy ludzkiej Pole + punkty kluczowe 10+ warstw Obraz + klatki wideo Różnorodność wieku, płci i pochodzenia etnicznego Ścisła prywatność + etyka

Wyniki

  • Założona połączony proces wykrywania i adnotacji punktów orientacyjnych dla sztucznej inteligencji twarzy
  • znormalizowane 10+ warstw atrybutów obejmujące dane demograficzne, emocje, orientację, okluzję
  • Dostarczany zasięg zróżnicowany demograficznie aby złagodzić stronniczość modelu
  • Zaimplementowane obsługa przypadków brzegowych do częściowych twarzy, luster, masek i niestandardowych proporcji
  • Utrzymany ścisła prywatność i zgodność z zasadami etycznymi w całym procesie adnotacji

Ogólnie rzecz biorąc, Shaip pomógł przekształcić złożone wymagania dotyczące adnotacji twarzy w ustrukturyzowany, gotowy do produkcji proces — taki, który obsługuje rozpoznawanie twarzy, wykrywanie emocji, szacowanie wieku, weryfikację tożsamości, zapobieganie podszywaniu się oraz interakcję człowieka z komputerem za pomocą sztucznej inteligencji z precyzją i etyką wymaganą przez daną aplikację.

Ikona cytatu

System adnotacji twarzy Shaipa zapewnił nam różnorodność demograficzną i odporność na skrajne przypadki, czego nie może osiągnąć większość dostawców — a ich dyscyplina etyczna sprawiła, że ​​nasze przeglądy zgodności przebiegły bezproblemowo.

— Szef ds. sztucznej inteligencji w zakresie tożsamości

★ ★ ★ ★ ★
Ikona cytatu