Wie funktioniert die Texterkennung (OCR)?

Bennet Conrads -

Wir versuchen immer die Qualität und die Geschwindigkeit von OCR zu verbessern und haben immer ein Auge darauf, wie wir die OCR Engine verbessern können.

OCR steht für Optical Character Recognition, also eine Texterkennung die den Text auf deinen Scans extrahieren kann.

Da der Prozess sehr komplex ist, hier einige Infos zur Texterkennung:

  • OCR wird nur lokal auf deinem Gerät vorgenommen. D.h., dass wir nichts an irgendeinen Server senden. Deine Daten bleiben nur auf deinem Gerät.
  • Momentan werden über 60 verschiedene Sprachen von der Scanbot erkannt.
  • Für das beste Ergebnis kombinieren wir verschiedene Technologien für unsere Texterkennung

 

Wie funktioniert OCR nun: Eine Grundvoraussetzung um die Texterkennung nutzen zu können ist, Pro User zu sein. Nachdem du Scanbot Pro gekauft hast werden dir in den Einstellungen weitere Optionen angeboten. Darunter auch “Texterkennung (OCR)”.

Durch tippen auf diese Schaltfläche, öffnet sich das OCR Menü. Oben kannst du die Texterkennung aktivieren und deaktivieren, darunter befindet sich die Auswahl für die Sprachen die Scanbot erkennen kann. Stelle sicher, dass die gewünschte Sprache aktiviert ist, beachte aber, dass das Ergebnis besser ist wenn möglichst wenig Sprachen ausgewählt werden.

 

Wenn du OCR aktiviert hast, wird jeder zukünftige Scan von der Texterkennung bearbeitet.

Es kann sein, dass nach dem Speichern des ersten Dokumentes eine Nachricht “Warte auf OCR Dateien…” erscheint. In diesem Schritt initialisiert Scanbot die Texterkennung und lädt die ausgewählten Sprachpakete herunter, was zu leichten Verzögerungen führen kann.

Als nächstes wird unter dem Dokument “In Bearbeitung…” angezeigt. Das ist der Moment indem OCR auf den Scan angewandt wird. Je nach Qualität des Bildes und der Anzahl an Wörtern, kann dieser Vorgang in seltenen Fällen bis zu 2-3 Minuten dauern. Meist ist Scanbot aber in 30-40 Sekunden damit fertig. Der Fortschritt wird in Prozent angezeigt.

Wenn die Texterkennung abgeschlossen ist, kannst du das Dokument öffnen und über die 3 Punkte oben rechts in der Ecke verschiedene Aktionen mit dem extrahierten Text vornehmen.

       

 

Der erkannte Text kann nun separat angezeigt, kopiert, geteilt oder durchsucht werden indem du auf Text oben unter dem Dateinamen tippst. Der Text kann außerdem von der Spotlight Suche erfasst werden.

Wenn das Dokument Informationen wie Telefonnummern, Email- oder Adressen beinhält, können diese mit nur einem Tap in einer zugehörigen App geöffnet werden indem du auf den Actions tippst. 

Ein paar generelle Tipps, um möglichst gute Resultate zu erzielen:

  • Je besser die Qualität des Scans, desto besser die Texterkennung
  • Sorge für ausreichend Licht auf dem Scan
  • Stelle sicher, dass du die richtige Sprache ausgewählt hast
  • Darüber hinaus muss der Scan im Porträt-Modus gemacht worden sein, OCR funktioniert derzeit nicht im Landschaftsmodus.

 

Manuelles OCR

Hast du noch alte Dokumente die noch nicht von der Texterkennung bearbeitet wurden?
So kannst du sie noch nachträglich bearbeiten lassen:

  1. Öffne das Dokument
  2. Tippe auf Text unter dem Dateinamen

Tippe auf OCR starten unter der Nachricht, dass kein Text gefunden werden konnte 

War dieser Beitrag hilfreich?
1 von 1 fanden dies hilfreich
Haben Sie Fragen? Anfrage einreichen
Powered by Zendesk