Text aus Bildern/PDFs extrahieren

Häufig hat man Dokumente nur in Papierform und möchte sie nachbearbeiten. Die meisten neuen Scanner unterstützen zwar von Haus aus OCR (Optical Character Recognition), jedoch gibt es einige die immernoch die Dokumente in diversen Bildformaten abspeichern.

Mögliche Imageformate: .tif, .bmp, .jpg, .png

Diese Dateiformate, lassen sich zwar problemlos wieder ausdrucken, doch ist eine Nachbearbeitung ohne zusätzliche Tools meist nicht möglich.

Abhilfe schafft hier das Tool FreeOCR.
FreeOCR
Mit diesem Freeware Tool ( kostenlos auch für gewerbliche Nutzung), lässt sich der gesamte Text extrahieren.

Der extrahierte Text, kann direkt in Word weiterbearbeitet, alternativ auch in einer Textdatei abgespeichert werden. FreeOCR braucht wenig Systemressourcen und kommt ganz ohne Adware und 3rd Party Programme.

Ausserdem ist es möglich, Text von PDF Dateien zu extrahieren. Dies funktioniert nur fehlerfrei, wenn keine Bilddateien in der PDF enthalten sind.

Den Download gibt es bei www.paperfile.net

You can leave a response, or trackback from your own site.

One Response to “Text aus Bildern/PDFs extrahieren”

  1. paul sagt:

    echt cooles tool, hat ein freund von mir lange gesucht

Leave a Reply

Powered by WordPress | Designed by: Premium Free WordPress Themes | Thanks to Download Premium WordPress Themes, wordpress 4 themes and Free Premium WordPress Themes