Rozpoznawanie tekstu

Rozpoznawanie tekstu

Definicja

Rozpoznawanie tekstu odnosi się do identyfikacji znaków tekstowych na obrazach lub zeskanowanych dokumentach. Obejmuje ono rozpoznawanie tekstu drukowanego i pisma odręcznego.

Cel

Celem jest udostępnienie tekstu w formatach wizualnych, który będzie dostępny i możliwy do przeszukiwania.

Znaczenie

  • Umożliwia digitalizację archiwów.
  • Istotne dla dostępności i automatyzacji.
  • Dokładność zależy od jakości obrazu.
  • Związane z technologiami OCR.

Jak to działa

  1. Przechwytywanie zeskanowanych lub sfotografowanych dokumentów.
  2. Poddaj obrazy wstępnemu przetwarzaniu w celu zwiększenia ich przejrzystości.
  3. Wykryj obszary tekstowe.
  4. Zastosuj modele rozpoznawania.
  5. Generuj tekst czytelny dla maszyny.

Przykłady (świat rzeczywisty)

  • Google Lens: rozpoznaje tekst na zdjęciach.
  • ABBYY FineReader: digitalizuje zeskanowane dokumenty.
  • Tesseract OCR: program do rozpoznawania tekstu o otwartym kodzie źródłowym.

Odniesienia / Dalsza lektura

  • Smith, R. „Przegląd silnika OCR Tesseract”. ICDAR.
  • Norma ISO/IEC 15938-4.
  • IEEE Transactions on Pattern Analysis and Machine Intelligence.

Powiedz nam, jak możemy pomóc w Twojej następnej inicjatywie AI.

Szaip
Przegląd prywatności

Ta strona korzysta z plików cookie, abyśmy mogli zapewnić Ci najlepszą możliwą obsługę. Informacje o plikach cookie są przechowywane w przeglądarce użytkownika i służą do wykonywania funkcji, takich jak rozpoznawanie użytkownika po powrocie do naszej witryny i pomaganie naszemu zespołowi w zrozumieniu, które sekcje witryny są dla niego najbardziej interesujące i użyteczne.