Gotowe zbiory danych

Gotowe zbiory danych

Definicja

Gotowe zbiory danych to wstępnie zebrane i publicznie lub komercyjnie dostępne zbiory danych, które można bezpośrednio wykorzystać do szkolenia lub oceny modeli sztucznej inteligencji.

Cel

Celem jest przyspieszenie prac badawczo-rozwojowych poprzez zapewnienie łatwo dostępnych danych bez konieczności kosztownego ich gromadzenia.

Znaczenie

  • Oszczędza czas i zasoby zespołom zajmującym się sztuczną inteligencją.
  • Umożliwia powtarzalność i porównywanie wyników.
  • Może brakować specyfiki domeny dla niektórych zadań.
  • Wymaga sprawdzenia stronniczości i ograniczeń licencyjnych.

Jak to działa

  1. Zidentyfikuj zbiór danych istotny dla zadania AI.
  2. Przejrzyj licencje i ograniczenia użytkowania.
  3. Pobierz lub kup zbiór danych.
  4. Przeprowadź wstępne przetwarzanie w celu zapewnienia zgodności.
  5. Szkolenie lub ocena modeli przy użyciu zestawu danych.

Przykłady (świat rzeczywisty)

  • MNIST: zbiór danych zawierających ręcznie zapisane cyfry do celów porównawczych.
  • ImageNet: zbiór danych na dużą skalę dla potrzeb przetwarzania obrazu komputerowego.
  • Common Crawl: otwarty zbiór danych tekstowych dla przetwarzania języka naturalnego.

Odniesienia / Dalsza lektura

Powiedz nam, jak możemy pomóc w Twojej następnej inicjatywie AI.

Szaip
Przegląd prywatności

Ta strona korzysta z plików cookie, abyśmy mogli zapewnić Ci najlepszą możliwą obsługę. Informacje o plikach cookie są przechowywane w przeglądarce użytkownika i służą do wykonywania funkcji, takich jak rozpoznawanie użytkownika po powrocie do naszej witryny i pomaganie naszemu zespołowi w zrozumieniu, które sekcje witryny są dla niego najbardziej interesujące i użyteczne.