Existuje řada OCR čteček pro linux, které dokážou konvertovat z obrázku na text. Podívejte se na následující možnosti:
- GOCR:stránka Wikipedie
- Ocrad:stránka Wikipedie
- ocropus:stránka Wikipedie
- tesseract-ocr:stránka Wikipedie
Všechny výše uvedené položky, kromě ocropus, jsou přítomny v úložišti Ubuntu ve stejnojmenném balíčku.
Různé čtečky podporují různé formáty obrázků, takže můžete být ve svých možnostech omezeni formátem souboru, ve kterém je váš dokument. Případně můžete použít nástroj pro převod z ImageMagick ke změně formátu, pokud chcete použít konkrétní OCR čtečku.
Převzato z mé odpovědi zde.
Dálkově zapípněte počítač na vestavěný reproduktor
Jak zkombinovat hledání a grep pro komplexní hledání? ( GNU/linux, find, grep )