Otwarte zbiory danych

Odkryj zbiory danych typu open source, które pozwolą Ci trenować modele ML

Otwarte zbiory danych

Zbiory danych typu open source, aby rozpocząć pracę z modelami AI/ML

Wyniki Twoich modeli AI i ML są tak dobre, jak dane, których używasz do ich trenowania – dlatego precyzja, jaką stosujesz do agregacji danych oraz znakowania i identyfikowania tych danych, jest ważna!

Więc jeśli chcesz rozpocząć nową inicjatywę AI/ML, a teraz szybko zdajesz sobie sprawę, że znalezienie wysokiej jakości danych treningowych będzie jednym z trudniejszych aspektów twojego projektu, ponieważ wysokiej jakości zestawy danych są paliwem, które utrzymuje sztuczną inteligencję/ Działa silnik ML. Zgromadziliśmy listę otwartych zbiorów danych, z których można bezpłatnie korzystać i trenować modele AI/ML przyszłości.

Specjalizacja DataType Nazwa zbioru danych Przemysł / Dział Adnotacja/przypadek użycia Połączyć
+NLP Tekst Amazon Recenzje E-commerce Analiza sentymentów Połączyć
+NLP Tekst Dane linków do Wikipedii Ogólne Połączyć
+NLP Tekst Bank drzew sentymentu w Standford rozrywka Analiza sentymentów Połączyć
+NLP Tekst Sentyment linii lotniczych USA na Twitterze Linia lotnicza Analiza sentymentów Połączyć
+CV Obraz Sieć obrazów Ogólne Połączyć
+CV Obraz Otwarte obrazy Google Ogólne Połączyć
+NLP Tekst Dialogi filmowe Cornella rozrywka Dialogi Połączyć
+NLP Tekst Pani Marco Ogólne Odpowiadanie na pytania Połączyć
+NLP Tekst Zestaw danych pytań naturalnych Ogólne Odpowiadanie na pytania Połączyć
+NLP Tekst DBPedia Ogólne Wykres Wiedza Połączyć
+NLP Tekst JAGO Ogólne Wykres Wiedza Połączyć
+NLP Tekst FreeBase Ogólne Wykres Wiedza Połączyć
+NLP Tekst Ontonotes Ogólne Etykietowanie ról semantycznych Połączyć
+CV Obraz Orzech kokosowy Ogólne Wykrywanie obiektów Połączyć
+CV Obraz LZO PASKALA Ogólne Wykrywanie obiektów Połączyć
+CV Obraz Krajobrazy miejskie Autonomiczna jazda Segmentacja semantyczna Połączyć
+CV Obraz MNIST Ogólne Klasyfikacja cyfr Połączyć
+CV Obraz Moda-MNIST Sprzedaż detaliczna Klasyfikacja obrazu Połączyć
+NLP Audio Libriseeech Ogólne ASR Połączyć
+NLP Audio TED-LIUM Ogólne ASR Połączyć
+NLP Audio TYMIT Ogólne Rozpoznawanie fonemów Połączyć
+NLP Audio Wspólny głos Ogólne ASR Połączyć
+NLP Audio VoxCeleb Ogólne Rozpoznawanie mówców Połączyć
+NLP Tekst Zrzut Wikipedii Ogólne Modelowanie języka Połączyć
+NLP Tekst Gigaword Aktualności Modelowanie języka Połączyć
+NLP Tekst Recenzje IMDB rozrywka Analiza sentymentów Połączyć
+CV Wideo Kinetyka-700 Ogólne Rozpoznawanie akcji Połączyć
+CV Wideo UCF101 Ogólne Rozpoznawanie akcji Połączyć
+CV Wideo HMDB51 Ogólne Rozpoznawanie akcji Połączyć
+CV Obraz CASIA-WebFace Ogólne Rozpoznawanie twarzy Połączyć
+NLP Tekst Drużyna Ogólne Czytanie ze zrozumieniem Połączyć
+NLP Tekst MultiNLI Ogólne Wnioskowanie w języku naturalnym Połączyć
+NLP Tekst SNLI Ogólne Wnioskowanie w języku naturalnym Połączyć
+CV Obraz Kwiaty Oksfordzkie 102 botanika Klasyfikacja drobnoziarnista Połączyć
+CV Obraz CIFAR-10 Ogólne Klasyfikacja obrazu Połączyć
+CV Obraz CIFAR-100 Ogólne Klasyfikacja obrazu Połączyć
+CV Obraz Układ osoby VOC Ogólne Oszacowanie pozycji Połączyć
+CV Obraz Pozycja człowieka MPII Ogólne Oszacowanie pozycji Połączyć
+NLP Tekst 20 grup dyskusyjnych Ogólne Klasyfikacja tekstu Połączyć