Wizja komputerowa

22+ najbardziej poszukiwane zbiory danych typu open source do widzenia komputerowego

Algorytm AI jest tak dobry, jak dane, którymi go podajesz.

Nie jest to ani odważne, ani niekonwencjonalne stwierdzenie. Kilka dekad temu sztuczna inteligencja mogła wydawać się dość naciągana, ale od tego czasu sztuczna inteligencja i uczenie maszynowe przeszły naprawdę długą drogę.

Wizja komputerowa pomaga komputerom zrozumieć i interpretować etykiety i obrazy. Kiedy wyszkolisz swój komputer za pomocą odpowiedniego rodzaju obrazów, może on zyskać zdolność wykrywania, rozumienia i identyfikowania różnych rysów twarzy, wykrywania chorób, prowadzenia pojazdów autonomicznych, a także ratowania życia za pomocą wielowymiarowego skanowania narządów.

Przewiduje się, że rynek wizji komputerowych osiągnie $ 144.46 Billion do 2028 r. ze skromnych 7.04 mld USD w 2020 r., rosnąc w CAGR 45.64% między 2021 a 2028 r.

Niektóre przypadki użycia wizji komputerowej to:

  • Obrazowanie medyczne
  • Autonomiczny pojazd
  • Rozpoznawanie twarzy i obiektów
  • Identyfikacja wady
  • Wykrywanie scen

Połączenia zbiór danych obrazu karmisz i szkolisz zadania związane z uczeniem maszynowym i wizją komputerową, które mają kluczowe znaczenie dla powodzenia projektu AI. Dosyć trudno jest uzyskać wysokiej jakości zestaw danych. W zależności od złożoności projektu uzyskanie wiarygodnych i odpowiednich zestawów danych do celów wizji komputerowej może zająć od kilku dni do kilku tygodni.

Tutaj zapewniamy szereg (sklasyfikowanych dla Twojej łatwości) zestawów danych o otwartym kodzie źródłowym, z których możesz korzystać od razu.

Kompleksowa lista zbiorów danych wizji komputerowej

Napisz do nas

  1. ImageNet (Link)

    ImageNet jest szeroko stosowanym zbiorem danych i zawiera zdumiewającą liczbę 1.2 miliona obrazów podzielonych na 1000 kategorii. Ten zestaw danych jest zorganizowany zgodnie z hierarchią WorldNet i podzielony na trzy części – dane szkoleniowe, etykiety obrazów i dane walidacyjne.

  2. Kinetyka 700 (Link)

    Kinetics 700 to ogromny zestaw danych wysokiej jakości zawierający ponad 650,000 700 klipów 700 różnych klas ludzkiego działania. Każde z pozwów zbiorowych ma około XNUMX klipów wideo. Klipy w zbiorze danych zawierają interakcje człowiek-obiekt i człowiek-człowiek, które okazują się bardzo pomocne przy rozpoznawaniu ludzkich działań w filmach.

  3. CIFAR-10 (Link)

    CIFAR 10 to jeden z największych zbiorów danych wizyjnych, zawierający 60000 obrazów 32 x 32, reprezentujących dziesięć różnych klas. Każda klasa ma około 6000 obrazów wykorzystywanych do trenowania algorytmów widzenia komputerowego i uczenia maszynowego.

Rozpoznawanie twarzy:

Rozpoznawanie twarzy

  1. Oznaczone twarze na wolności (Link)

    Labeled Faced in the Wild to ogromny zbiór danych zawierający ponad 13,230 5,750 zdjęć prawie XNUMX osób wykrytych w Internecie. Ten zestaw danych twarzy ma na celu ułatwienie badania nieograniczonego wykrywania twarzy.

  2. CASIA WebFace (Link)

    CASIA Web face to dobrze zaprojektowany zbiór danych, który pomaga w uczeniu maszynowym i badaniach naukowych nad swobodnym rozpoznawaniem twarzy. Dzięki ponad 494,000 10,000 obrazom prawie XNUMX XNUMX prawdziwych tożsamości jest idealny do zadań związanych z identyfikacją twarzy i weryfikacją.

  3. Zbiór danych twarzy UMD (Link)

    UMD ma do czynienia z dobrze opatrzonym adnotacjami zbiorem danych, który składa się z dwóch części – nieruchomych obrazów i klatek wideo. Zbiór danych zawiera ponad 367,800 3.7 adnotacji do twarzy i XNUMX mln klatek wideo z adnotacjami osób.

Rozpoznawanie pisma odręcznego:

  1. Baza danych MNIST (Link)

    MNIST to baza danych zawierająca próbki odręcznych cyfr od 0 do 9 i zawiera 60,000 10,000 i 1999 XNUMX obrazów szkoleniowych i testowych. Wydany w XNUMX roku MNIST ułatwia testowanie systemów przetwarzania obrazu w Deep Learning.

  2. Zestaw danych sztucznych znaków (Link)

    Zbiór danych sztucznych znaków to, jak sama nazwa wskazuje, sztucznie wygenerowane dane, które opisują strukturę języka angielskiego za pomocą dziesięciu wielkich liter. Zawiera ponad 6000 obrazów.

Omówmy dzisiaj Twoje wymagania dotyczące danych szkoleniowych AI.

Wykrywanie obiektów:

  1. Pani COCO (Link)

    MS COCO lub Common Objects in Context to zestaw danych do wykrywania obiektów i tworzenia napisów.

    Ma ponad 328,000 80 obrazów z wykrywaniem punktów kluczowych, wykrywaniem wielu obiektów, podpisami i adnotacjami maski segmentacji. Zawiera XNUMX kategorii obiektów i pięć podpisów na obraz.

  2. LSUN(Link)

    LSUN, skrót od Large-scale Scene Understanding, zawiera ponad milion oznaczonych obrazów w 20 kategoriach obiektów i 10 kategoriach scen. Niektóre kategorie mają blisko 300,000 300 obrazów, z czego 1000 obrazów przeznaczonych specjalnie do walidacji i XNUMX obrazów do danych testowych.

  3. Obiekty domowe(Link)

    Zestaw danych Home Objects zawiera adnotowane obrazy losowych obiektów z całego domu – kuchni, salonu i łazienki. Ten zbiór danych zawiera również kilka filmów z adnotacjami i 398 zdjęć bez adnotacji przeznaczonych do testowania.

Automobilowy:

  1. Zbiór danych miasta (Link)

    Cityscape to zbiór danych, do którego należy się udać, szukając różnych sekwencji wideo nagranych ze scen ulicznych w kilku miastach. Zdjęcia te były rejestrowane przez długi czas, w różnych warunkach pogodowych i oświetleniowych. Adnotacje dotyczą 30 klas obrazów podzielonych na osiem różnych kategorii.

  2. Głęboki napęd Barkleya (Link)

    Barkley DeepDrive jest specjalnie zaprojektowany do szkolenia pojazdów autonomicznych i zawiera ponad 100 tysięcy sekwencji wideo z adnotacjami. Jest to jedna z najbardziej pomocnych danych treningowych dla pojazdów autonomicznych przy zmieniających się warunkach drogowych i drogowych.

  3. Mapilarny (Link)

    Mapillary ma ponad 750 milionów scen ulicznych i znaków drogowych na całym świecie, co jest bardzo przydatne w trenowaniu modeli percepcji wizualnej w uczeniu maszynowym i algorytmach sztucznej inteligencji. Pozwala na tworzenie pojazdów autonomicznych, dostosowanych do różnych warunków oświetleniowych i pogodowych oraz punktów widokowych.

Obrazowanie medyczne:

  1. Covid-19 Otwarty zbiór danych badawczych (Link)

    Ten oryginalny zestaw danych zawiera około 6500 pikseli wielokątnych segmentacji płuc na temat prześwietleń klatki piersiowej AP/PA. Dodatkowo dostępnych jest 517 zdjęć prześwietleń rentgenowskich pacjentów z Covid-19 z tagami zawierającymi imię i nazwisko, lokalizację, szczegóły przyjęcia, wynik i inne.

  2. Baza danych NIH zawierająca 100,000 XNUMX prześwietleń klatki piersiowej (Link)

    Baza danych NIH jest jednym z najobszerniejszych publicznie dostępnych zbiorów danych zawierających 100,000 XNUMX zdjęć rentgenowskich klatki piersiowej i powiązanych danych przydatnych dla społeczności naukowej i badawczej. Zawiera nawet obrazy pacjentów z zaawansowanymi chorobami płuc.

  3. Atlas Patologii Cyfrowej (Link)

    Atlas of Digital Pathology oferuje kilka obrazów histopatologicznych łatek, łącznie ponad 17,000 100, z blisko XNUMX opatrzonych adnotacjami slajdów różnych narządów. Ten zestaw danych jest przydatny w opracowywaniu oprogramowania do widzenia komputerowego i rozpoznawania wzorców.

Rozpoznawanie scen:

Rozpoznawanie scen

  1. Rozpoznawanie sceny wewnętrznej Indoor (Link)

    Indoor Scene Recognition to wysoce skategoryzowany zbiór danych zawierający prawie 15620 obrazów obiektów i scenerii wewnętrznych do wykorzystania w uczeniu maszynowym i treningu danych. Zawiera ponad 65 kategorii, a każda kategoria zawiera co najmniej 100 zdjęć.

  2. xWidok (Link)

    Jako jeden z najbardziej znanych publicznie dostępnych zbiorów danych, xView zawiera mnóstwo zdjęć z adnotacjami z różnych złożonych i dużych scen. Mając około 60 klas i ponad milion instancji obiektów, celem tego zbioru danych jest zapewnienie lepszej pomocy w przypadku katastrof przy użyciu zdjęć satelitarnych.

  3. Miejsca (Link)

    Places, zbiór danych dostarczony przez MIT, zawiera ponad 1.8 miliona zdjęć z 365 różnych kategorii scen. W każdej z tych kategorii jest około 50 obrazów do walidacji i 900 obrazów do testowania. Możliwe jest poznanie funkcji głębokich scen w celu ustanowienia rozpoznawania scen lub zadań rozpoznawania wizualnego.

Zabawa:

  1. Zbiór danych IMDB WIKI (Link)

    IMDB – Wiki to jedna z najpopularniejszych publicznych baz danych twarzy oznaczonych odpowiednio wiekiem, płcią i imionami. Ma też około 20 tysięcy twarzy celebrytów i 62 tysiące z Wikipedii.

  2. Twarze celebrytów (Link)

    Celeb Faces to obszerna baza danych zawierająca 200,000 XNUMX zdjęć celebrytów z adnotacjami. Obrazy zawierają szumy tła i warianty pozy, co czyni je przydatnymi do szkolenia zestawów testowych w zadaniach widzenia komputerowego. Jest to bardzo korzystne dla osiągnięcia większej dokładności rozpoznawania twarzy, edycji, lokalizacji części twarzy i nie tylko.

Teraz, gdy masz ogromną listę zbiorów danych obrazu o otwartym kodzie źródłowym, które napędzają twoją maszynerię sztucznej inteligencji. Wynik modeli sztucznej inteligencji i uczenia maszynowego zależy przede wszystkim od jakości zestawów danych, które zasilasz i na których je trenujesz. Jeśli chcesz, aby Twój model AI generował dokładne prognozy, potrzebuje wysokiej jakości zestawów danych, które są agregowane, znakowane i znakowane do perfekcji. Aby wzmocnić sukces swojego komputerowego systemu wizyjnego, musisz korzystać z wysokiej jakości baz danych obrazów odpowiednich do wizji twojego projektu. Jeśli szukasz więcej takich zbiorów danych Kliknij tutaj

Podziel społecznej

Może Ci się spodobać