Zestaw danych w językach arabskim, tajskim, wietnamskim, hindi, angielskim i chińskim

Pole ograniczające + tekst

Zestaw danych w językach arabskim, tajskim, wietnamskim, hindi, angielskim i chińskim

Przypadek użycia: OCR

Format: Obraz

Liczyć: 150k

Adnotacja: Tak

X

Opis: Zestaw danych w językach arabskim, tajskim, wietnamskim, hindi, angielskim i chińskim

Zestaw danych tekstów arabskich

Pole ograniczające + tekst

Zestaw danych tekstów arabskich

Przypadek użycia: OCR

Format: Obraz

Liczyć: 1k

Adnotacja: Tak

X

Opis: Zestaw danych Arabic Text zawiera zbiór próbek tekstów napisanych po arabsku. Obejmuje różne formy treści, takie jak artykuły informacyjne, posty w mediach społecznościowych, literaturę i dialogi, obejmujące różne tematy i style pisania. Ten zestaw danych jest używany do zadań takich jak przetwarzanie języka naturalnego (NLP), klasyfikacja tekstu, analiza sentymentów i tłumaczenie maszynowe w aplikacjach języka arabskiego.

Zestaw danych języka chińskiego, angielskiego, tybetańskiego i ujgurskiego

Pole ograniczające + tekst

Zestaw danych języka chińskiego, angielskiego, tybetańskiego i ujgurskiego

Przypadek użycia: OCR

Format: Obraz

Liczyć: 38k

Adnotacja: Tak

X

Opis: Zestaw danych języka chińskiego, angielskiego, tybetańskiego i ujgurskiego

Zestaw danych menu chińskiego i angielskiego

Pole ograniczające + tekst

Zestaw danych menu chińskiego i angielskiego

Przypadek użycia: OCR

Format: Obraz

Liczyć: 60k

Adnotacja: Tak

X

Opis: Zestaw danych Chinese and English Menu zawiera obrazy lub próbki tekstu menu restauracji, które zawierają zarówno język chiński, jak i angielski. Zawiera różne czcionki, układy i struktury menu, prezentując dwujęzyczne nazwy dań, opisy i ceny. Ten zestaw danych jest przydatny do zadań takich jak optyczne rozpoznawanie znaków (OCR), tłumaczenie maszynowe i digitalizacja menu w środowiskach wielojęzycznych.

Zestaw danych chińskich kompozycji rękopisowych

Pole ograniczające + tekst

Zestaw danych chińskich kompozycji rękopisowych

Przypadek użycia: OCR

Format: Obraz

Liczyć: 3k

Adnotacja: Tak

X

Opis: Zestaw danych Chinese Handwritten Composition Dataset zawiera próbki chińskiego tekstu pisanego odręcznie, w tym kompozycje, eseje i inne długie teksty. Zawiera różne style pisma odręcznego i poziomy złożoności i jest używany do zadań takich jak rozpoznawanie pisma odręcznego, analiza tekstu i szkolenie modeli uczenia maszynowego.

Zestaw danych chińskiego komunikatu WIFI

Pole ograniczające + tekst

Zestaw danych chińskiego komunikatu WIFI

Przypadek użycia: OCR

Format: Obraz

Liczyć: 1k

Adnotacja: Tak

X

Opis: Zestaw danych Chinese WIFI Prompt składa się z próbek tekstu znalezionych w komunikatach WIFI i ekranach logowania napisanych po chińsku. Zazwyczaj zawiera różne komunikaty, instrukcje i komunikaty o błędach związane z łączeniem się z sieciami WIFI lub zarządzaniem nimi. Ten zestaw danych jest używany do zadań takich jak rozpoznawanie tekstu, przetwarzanie języka naturalnego i ulepszanie interfejsów użytkownika dla łączności sieciowej.

Zestaw danych pisma odręcznego w języku angielskim i chińskim

Pole ograniczające + tekst

Zestaw danych pisma odręcznego w języku angielskim i chińskim

Przypadek użycia: OCR

Format: Obraz

Liczyć: 12k

Adnotacja: Tak

X

Opis: Zestaw danych English & Chinese Handwriting Dataset zawiera próbki pisma odręcznego w języku angielskim i chińskim, prezentując różne style pisania i złożoność znaków. Jest on zazwyczaj używany do szkolenia i oceny modeli rozpoznawania pisma odręcznego, wspierania analizy tekstu wielojęzycznego i innych powiązanych badań. Zestaw danych obejmuje zróżnicowany zakres znaków, cyfr, słów i zdań w obu językach.

Zestaw danych znaków sklepowych w języku angielskim i chińskim

Pole ograniczające + tekst

Zestaw danych znaków sklepowych w języku angielskim i chińskim

Przypadek użycia: OCR

Format: Obraz

Liczyć: 30k

Adnotacja: Tak

X

Opis: Zestaw danych English & Chinese Shopsign Dataset zawiera obrazy szyldów sklepowych, które zawierają zarówno tekst w języku angielskim, jak i chińskim. Rejestruje różne elementy oznakowania, takie jak nazwy sklepów, reklamy, promocje i wskazówki, wyświetlane w różnych czcionkach, stylach i formatach. Ten zestaw danych jest używany do zadań, takich jak wykrywanie i rozpoznawanie tekstu, rozumienie wielojęzycznej sceny i ulepszanie modeli widzenia komputerowego w celu interpretowania dwujęzycznego oznakowania.

Zestaw danych tekstów specjalnych kątowych w języku angielskim i chińskim

Pole ograniczające + tekst

Zestaw danych tekstów specjalnych kątowych w języku angielskim i chińskim

Przypadek użycia: OCR

Format: Obraz

Liczyć: 50k

Adnotacja: Tak

X

Opis: Zestaw danych English & Chinese Special Angle Text Dataset zawiera obrazy tekstu wyświetlanego pod różnymi kątami i w różnych orientacjach zarówno w języku angielskim, jak i chińskim. Obejmuje tekst ze źródeł, takich jak znaki, reklamy i dokumenty, które nie są prezentowane w standardowych formatach poziomych. Ten zestaw danych jest używany do szkolenia i oceny modeli wykrywania i rozpoznawania tekstu, w szczególności tych, które są w stanie obsługiwać tekst w niestandardowych orientacjach i perspektywach.

Zestaw danych menu w języku angielskim

Pole ograniczające + tekst

Zestaw danych menu w języku angielskim

Przypadek użycia: OCR

Format: Obraz

Liczyć: 20k

Adnotacja: Tak

X

Opis: Zestaw danych English Menu Dataset zawiera obrazy lub próbki tekstu menu restauracji napisane w języku angielskim. Zawiera różnorodne czcionki, układy i style formatowania, a zawartość obejmuje nazwy dań, opisy i ceny. Ten zestaw danych jest często używany do zadań takich jak optyczne rozpoznawanie znaków (OCR), ekstrakcja tekstu i digitalizacja menu w aplikacjach związanych z żywnością.

Zestaw danych tekstowych scen angielskich

Pole ograniczające + tekst

Zestaw danych tekstowych scen angielskich

Przypadek użycia: OCR

Format: Obraz

Liczyć: 33k

Adnotacja: Tak

X

Opis: Zestaw danych English Scenes Text Dataset składa się z obrazów zawierających naturalne sceny z osadzonym tekstem angielskim. Tekst pojawia się w różnych formach, takich jak znaki, billboardy i plakaty, często w różnych czcionkach, rozmiarach i orientacjach. Ten zestaw danych jest powszechnie używany do trenowania i testowania modeli w zadaniach wykrywania tekstu, rozpoznawania i rozumienia scen.

Odręczny zbiór danych tekstowych

Odręczny zbiór danych tekstowych

Przypadek użycia: Dokument AI

Format: HEIC (obrazy) i .mov (filmy)

Liczyć: 94053

Adnotacja: Nie

X

Opis: Zdjęcia na żywo z odręcznym tekstem w języku japońskim, koreańskim i rosyjskim

Urządzenie rejestrujące: Aparat iPhone'a i iPada

Stan nagrywania: - Agresywne oświetlenie/odblask - Włączona lampa błyskowa - Kolorowe światło - Słabe oświetlenie, brak lampy błyskowej - Normalny

Zestaw danych języka japońskiego i koreańskiego

Pole ograniczające + tekst

Zestaw danych języka japońskiego i koreańskiego

Przypadek użycia: OCR

Format: Obraz

Liczyć: 40k

Adnotacja: Tak

X

Opis: Zestaw danych języka japońskiego i koreańskiego zawiera próbki tekstu zarówno w języku japońskim, jak i koreańskim. Zawiera szereg treści, takich jak zdania, frazy i słowa, obejmujące różne konteksty i style. Ten zestaw danych jest używany do zadań takich jak przetwarzanie języka naturalnego (NLP), tłumaczenie maszynowe i analiza tekstu w aplikacjach wielojęzycznych.