Adnotacja danych

Adnotacja danych

Definicja

Adnotacja danych to proces oznaczania surowych danych tagami, które nadają im znaczenie dla modeli AI. Przykładami mogą być tagowanie obrazów kategoriami obiektów lub tagowanie tekstu za pomocą sentymentu.

Cel

Celem jest stworzenie zbiorów danych treningowych, które pozwolą sztucznej inteligencji uczyć się wzorców w uczeniu nadzorowanym. Bez adnotacji wiele zadań sztucznej inteligencji nie byłoby możliwych.

Znaczenie

  • Dostarcza „prawdy podstawowej” do szkolenia modeli ML.
  • Jakość adnotacji wpływa na dokładność i uczciwość modelu.
  • Zadanie czasochłonne i wymagające dużych zasobów.
  • Często wymaga specjalistycznej wiedzy (np. adnotacje medyczne).

Jak to działa

  1. Zdefiniuj kategorie zadań i etykiet.
  2. Zbieraj i wstępnie przetwarzaj surowe dane.
  3. Użyj narzędzi adnotacyjnych do etykietowania.
  4. Zweryfikuj poprzez kontrolę jakości.
  5. Eksportuj oznaczone dane w celu trenowania modelu.

Przykłady (świat rzeczywisty)

  • Amazon Mechanical Turk: platforma do tworzenia adnotacji oparta na crowdsourcingu.
  • Shaip: usługa adnotacji danych dla zbiorów danych pojazdów autonomicznych.
  • Oznaczanie obrazów radiologicznych: szpitale opisują skany w celu diagnozy za pomocą sztucznej inteligencji.

Odniesienia / Dalsza lektura

  • Adnotacje danych dla sztucznej inteligencji — NIST.
  • Adnotacje i etykietowanie zbiorów danych — IEEE Transactions on Data Engineering.
  • ISO/IEC 24617: Struktura adnotacji semantycznych — ISO.
  • Czym jest adnotacja danych – Shaip

Powiedz nam, jak możemy pomóc w Twojej następnej inicjatywie AI.