Zestaw danych w językach arabskim, tajskim, wietnamskim, hindi, angielskim i chińskim
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 150k
Adnotacja: Tak
Opis: Zestaw danych w językach arabskim, tajskim, wietnamskim, hindi, angielskim i chińskim
Zestaw danych tekstów arabskich
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 1k
Adnotacja: Tak
Opis: Zestaw danych Arabic Text zawiera zbiór próbek tekstów napisanych po arabsku. Obejmuje różne formy treści, takie jak artykuły informacyjne, posty w mediach społecznościowych, literaturę i dialogi, obejmujące różne tematy i style pisania. Ten zestaw danych jest używany do zadań takich jak przetwarzanie języka naturalnego (NLP), klasyfikacja tekstu, analiza sentymentów i tłumaczenie maszynowe w aplikacjach języka arabskiego.
Zestaw danych języka chińskiego, angielskiego, tybetańskiego i ujgurskiego
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 38k
Adnotacja: Tak
Opis: Zestaw danych języka chińskiego, angielskiego, tybetańskiego i ujgurskiego
Zestaw danych menu chińskiego i angielskiego
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 60k
Adnotacja: Tak
Opis: Zestaw danych Chinese and English Menu zawiera obrazy lub próbki tekstu menu restauracji, które zawierają zarówno język chiński, jak i angielski. Zawiera różne czcionki, układy i struktury menu, prezentując dwujęzyczne nazwy dań, opisy i ceny. Ten zestaw danych jest przydatny do zadań takich jak optyczne rozpoznawanie znaków (OCR), tłumaczenie maszynowe i digitalizacja menu w środowiskach wielojęzycznych.
Zestaw danych chińskich kompozycji rękopisowych
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 3k
Adnotacja: Tak
Opis: Zestaw danych Chinese Handwritten Composition Dataset zawiera próbki chińskiego tekstu pisanego odręcznie, w tym kompozycje, eseje i inne długie teksty. Zawiera różne style pisma odręcznego i poziomy złożoności i jest używany do zadań takich jak rozpoznawanie pisma odręcznego, analiza tekstu i szkolenie modeli uczenia maszynowego.
Zestaw danych chińskiego komunikatu WIFI
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 1k
Adnotacja: Tak
Opis: Zestaw danych Chinese WIFI Prompt składa się z próbek tekstu znalezionych w komunikatach WIFI i ekranach logowania napisanych po chińsku. Zazwyczaj zawiera różne komunikaty, instrukcje i komunikaty o błędach związane z łączeniem się z sieciami WIFI lub zarządzaniem nimi. Ten zestaw danych jest używany do zadań takich jak rozpoznawanie tekstu, przetwarzanie języka naturalnego i ulepszanie interfejsów użytkownika dla łączności sieciowej.
Zestaw danych pisma odręcznego w języku angielskim i chińskim
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 12k
Adnotacja: Tak
Opis: Zestaw danych English & Chinese Handwriting Dataset zawiera próbki pisma odręcznego w języku angielskim i chińskim, prezentując różne style pisania i złożoność znaków. Jest on zazwyczaj używany do szkolenia i oceny modeli rozpoznawania pisma odręcznego, wspierania analizy tekstu wielojęzycznego i innych powiązanych badań. Zestaw danych obejmuje zróżnicowany zakres znaków, cyfr, słów i zdań w obu językach.
Zestaw danych znaków sklepowych w języku angielskim i chińskim
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 30k
Adnotacja: Tak
Opis: Zestaw danych English & Chinese Shopsign Dataset zawiera obrazy szyldów sklepowych, które zawierają zarówno tekst w języku angielskim, jak i chińskim. Rejestruje różne elementy oznakowania, takie jak nazwy sklepów, reklamy, promocje i wskazówki, wyświetlane w różnych czcionkach, stylach i formatach. Ten zestaw danych jest używany do zadań, takich jak wykrywanie i rozpoznawanie tekstu, rozumienie wielojęzycznej sceny i ulepszanie modeli widzenia komputerowego w celu interpretowania dwujęzycznego oznakowania.
Zestaw danych tekstów specjalnych kątowych w języku angielskim i chińskim
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 50k
Adnotacja: Tak
Opis: Zestaw danych English & Chinese Special Angle Text Dataset zawiera obrazy tekstu wyświetlanego pod różnymi kątami i w różnych orientacjach zarówno w języku angielskim, jak i chińskim. Obejmuje tekst ze źródeł, takich jak znaki, reklamy i dokumenty, które nie są prezentowane w standardowych formatach poziomych. Ten zestaw danych jest używany do szkolenia i oceny modeli wykrywania i rozpoznawania tekstu, w szczególności tych, które są w stanie obsługiwać tekst w niestandardowych orientacjach i perspektywach.
Zestaw danych menu w języku angielskim
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 20k
Adnotacja: Tak
Opis: Zestaw danych English Menu Dataset zawiera obrazy lub próbki tekstu menu restauracji napisane w języku angielskim. Zawiera różnorodne czcionki, układy i style formatowania, a zawartość obejmuje nazwy dań, opisy i ceny. Ten zestaw danych jest często używany do zadań takich jak optyczne rozpoznawanie znaków (OCR), ekstrakcja tekstu i digitalizacja menu w aplikacjach związanych z żywnością.
Zestaw danych tekstowych scen angielskich
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 33k
Adnotacja: Tak
Opis: Zestaw danych English Scenes Text Dataset składa się z obrazów zawierających naturalne sceny z osadzonym tekstem angielskim. Tekst pojawia się w różnych formach, takich jak znaki, billboardy i plakaty, często w różnych czcionkach, rozmiarach i orientacjach. Ten zestaw danych jest powszechnie używany do trenowania i testowania modeli w zadaniach wykrywania tekstu, rozpoznawania i rozumienia scen.
Odręczny zbiór danych tekstowych
Przypadek użycia: Dokument AI
Format: HEIC (obrazy) i .mov (filmy)
Liczyć: 94053
Adnotacja: Nie
Opis: Zdjęcia na żywo z odręcznym tekstem w języku japońskim, koreańskim i rosyjskim
Urządzenie rejestrujące: Aparat iPhone'a i iPada
Stan nagrywania: - Agresywne oświetlenie/odblask - Włączona lampa błyskowa - Kolorowe światło - Słabe oświetlenie, brak lampy błyskowej - Normalny
Zestaw danych języka japońskiego i koreańskiego
Pole ograniczające + tekst
Przypadek użycia: OCR
Format: Obraz
Liczyć: 40k
Adnotacja: Tak
Opis: Zestaw danych języka japońskiego i koreańskiego zawiera próbki tekstu zarówno w języku japońskim, jak i koreańskim. Zawiera szereg treści, takich jak zdania, frazy i słowa, obejmujące różne konteksty i style. Ten zestaw danych jest używany do zadań takich jak przetwarzanie języka naturalnego (NLP), tłumaczenie maszynowe i analiza tekstu w aplikacjach wielojęzycznych.