Definicja
Rozpoznawanie tekstu odnosi się do identyfikacji znaków tekstowych na obrazach lub zeskanowanych dokumentach. Obejmuje ono rozpoznawanie tekstu drukowanego i pisma odręcznego.
Cel
Celem jest udostępnienie tekstu w formatach wizualnych, który będzie dostępny i możliwy do przeszukiwania.
Znaczenie
- Umożliwia digitalizację archiwów.
- Istotne dla dostępności i automatyzacji.
- Dokładność zależy od jakości obrazu.
- Związane z technologiami OCR.
Jak to działa
- Przechwytywanie zeskanowanych lub sfotografowanych dokumentów.
- Poddaj obrazy wstępnemu przetwarzaniu w celu zwiększenia ich przejrzystości.
- Wykryj obszary tekstowe.
- Zastosuj modele rozpoznawania.
- Generuj tekst czytelny dla maszyny.
Przykłady (świat rzeczywisty)
- Google Lens: rozpoznaje tekst na zdjęciach.
- ABBYY FineReader: digitalizuje zeskanowane dokumenty.
- Tesseract OCR: program do rozpoznawania tekstu o otwartym kodzie źródłowym.
Odniesienia / Dalsza lektura
- Smith, R. „Przegląd silnika OCR Tesseract”. ICDAR.
- Norma ISO/IEC 15938-4.
- IEEE Transactions on Pattern Analysis and Machine Intelligence.