OCR: 2 Artikel gefunden

Shell Skript für ADF Scanner Fujitsu SP-1120

Geschrieben von Eric Scheibler am 03.07.2021

Kürzlich habe ich einen Fujitsu SP-1120 gekauft, um meinen alten und langsamen Flachbettscanner zu ersetzen. Der Fujitsu ist ein Scanner mit automatischem Dokumenteneinzug (ADF) und Duplex Unterstützung. Er scannt deutlich schneller, erfasst Vorer- und Rückseite auf einmal und liefert eine deutlich bessere Bildqualität und somit erheblich genauere OCR Ergebnisse.

Dieser Artikel enthält eine Installationsanleitung für Debian Linux und ein einfaches Shell Skript, welches einen Scan in eine durchsuchbare PDF Datei konvertiert.

Weiterlesen ›

Skript zum extrahieren von Text aus Bildern und gescannten PDF Dokumenten

Geschrieben von Eric Scheibler am 13.04.2015

Für die Freunde der Textkonsole habe ich ein kleines Shell Skript erstellt, welches mittels OCR Text aus Bildern und gescannten PDF Dateien extrahiert. Es können beliebig viele Quelldateien angegeben werden. Die Ergebnisse werden in einer einzelnen Textdatei gesammelt und im Texteditor der Wahl geöffnet oder nach stdout weitergeleitet. Für die Texterkennung kommt Tesseract zum Einsatz.

Weiterlesen ›