Papierloses Büro bewerkstelligen

Texte scannen und erkennen: OCR am Mac

Das papierlose Büro ist nach wie vor eher ein Mythos denn eine Realität – die meisten Dokumente liegen immer noch ausschließlich in Papierform vor. Wie Sie diese am Mac digitalisieren, erfahren Sie nachfolgend von uns. Wir zeigen Ihnen auch in ein paar kleinen Workshops Schritt für Schritt, wie Sie vorgehen müssen, um Inhalte mit dem iPhone zu digitalisieren und durchsuchbar zu machen.

Von   Uhr

Tag für Tag flattern viele Briefe oder Zeitungen und Zeitschriften in Ihren Briefkasten. Viel davon landet gleich im Papierkorb, zum Beispiel die unvermeidlichen Werbeprospekte. Anderes, wie berufliche Post oder Schreiben von Behörden, müssen Sie in jedem Fall aufbewahren oder sie sind für Sie aus anderen Gründen von Interesse.

Nicht immer ist es erforderlich und sinnvoll, diese Unterlagen in Papierform zu archivieren. Sie benötigen einerseits viel Stauraum und andererseits viel Zeit – zum Beispiel, wenn Sie ein bestimmtes Dokument suchen. Die allermeisten Briefe und Dokumente – Urkunden, Zeugnisse, Hochschulabschlüsse oder Versicherungsscheine ausgeschlossen – müssen nicht unbedingt im Original vorliegen, sondern können auch digitalisiert werden. Aber nicht nur zur Archivierung kann dies sinnvoll sein. Wenn Sie einen gedruckten Brief oder einen Zeitungs- beziehungsweise Zeitschriftenartikel in eine Textverarbeitung übernehmen und dort weiter bearbeiten möchten, konvertieren Sie ihn einfach in eine kompatible Datei. Mit dem Mac und Apps von Drittherstellern ist das ohne großen Aufwand machbar.

Was kann eine gute OCR-App?
  • Kontrastreiche und saubere Scans
  • Automatische Seiten- und Text-erkennung
  • Scans und Fotos bearbeiten
  • Unterstützung beim Archivieren
  • Anbindung an Cloud-Dienste
  • Gute Texterkennung auch problematischer Vorlagen

Wie Sie beim Digitalisieren vorgehen

Möchten Sie ein Dokument wie einen Brief oder eine Rechnung digitalisieren, so muss dieses natürlich gut lesbar und darf nicht gefaltet, geknickt, zerknüllt oder verschmutzt sein. Je sauberer die Vorlage, desto besser das spätere Ergebnis. Sorgen Sie etwa für Papierablagen; In die eine legen Sie alle Dokumente, die gescannt werden sollen und in die zweite kommen die bereits eingelesenen Dokumente. Größere Zeitungsartikel schneiden Sie passend zu. Achten Sie auf die richtige Reihenfolge der Textabschnitte und Seiten.

Nun scannen oder fotografieren Sie das Dokument und bearbeiten den Scan oder das Foto in der App Ihrer Wahl. Anschließend wird es im gewählten Format – in der Regel als PDF – gesichert. In diesem Fall können Sie, soweit möglich, wählen, ob die PDF-Datei durchsuchbar sein soll oder nicht.

Falls Sie den im Dokument enthaltenen Text in eine Textverarbeitung übernehmen möchten, müssen Sie die Datei an eine OCR-App (Optical Character Recognition) senden oder mit dieser öffnen. Was man unter OCR versteht, entnehmen Sie dem entsprechenden Kasten.

Systemvoraussetzungen

Je nach Ihren Ansprüchen benötigen Sie für das Digitalisieren von Dokumenten unterschiedliche Hardware und Apps. Neben einem Mac mit einer möglichst aktuellen macOS-Version ist für das schnelle und gelegentliche Digitalisieren eigentlich nur noch ein iPhone oder iPad erforderlich. Digitalisieren Sie hingegen öfter und – etwa aus beruflichen Gründen – regelmäßig Dokumente, so ist neben dem Mac ein Flachbettscanner oder ein Multifunktionsgerät erforderlich.

Bezüglich der Apps gilt dasselbe. Um ein einzelnes Dokument zu digitalisieren, reichen die Bordmittel von macOS und iOS. Soll ein durchsuchbares PDF-Dokument erzeugt oder gar die Texterkennung durchgeführt werden, sind Apps von Drittherstellern erforderlich. Diese müssen Sie nicht immer separat erwerben. Oft liegen sie einem hochwertigen Flachbettscanner oder Multifunktionsgerät bei.

Falls dies nicht der Fall ist, dann finden Sie im App Store und jenseits der offiziellen Apple-Quelle ein große Auswahl an unterschiedlichen Apps zum Scannen und zur Texterkennung (OCR). Am bekanntesten sind Finereader OCR Pro, Readiris Pro sowie Prizmo 3. Vom Finereader und Readiris sind auf den Webseiten der Hersteller Testversionen verfügbar. Im entsprechenden Workshop dieses Artikels kommt Readiris zum Einsatz.

Was ist OCR?

Bei der OCR (Optical Character Recognition) oder Texterkennung wird das gedruckte Textdokument in eine Bilddatei umgewandelt. Im zweiten Schritt erkennt die OCR-App vorhandene Textmuster und gibt diese als computerlesbaren Text aus. Hierbei ist eine gute Vorlage von großer Bedeutung. Ein undeutliches Schriftbild, gewelltes Papier und Knicke beziehungsweise ein unscharfes sowie nicht gleichmäßig belichtetes Foto führen zu Fehlern. In diesem Fall gibt es bei einigen Apps die Möglichkeit, nicht oder falsch erkannte Zeichen selbst zu verbessern. Der erkannte Text wird anschließend in einem verbreiteten Dateiformat gesichert und kann weiterbearbeitet werden.

Workshop: So scannen Sie mit Mac und iPhone oder iPad

Workshop: So scannen Sie Dokumente mit einem Scanner am Mac

Workshop: So führen Sie eine Texterkennung mit Readiris durch

Mehr zu diesen Themen:

Diskutiere mit!

Hier kannst du den Artikel "Texte scannen und erkennen: OCR am Mac" kommentieren. Melde dich einfach mit deinem maclife.de-Account an oder fülle die unten stehenden Felder aus.

Schön wärs. Ich habe nur Murks erlebt. Absolut unbrauchbar, da enorme Nacharbeit und Fehlerreparaturen nötig wurden. Beide finereader und readiris haben bei meinen Ansprüchen versagt. Forget it.

Die Kommentare für diesen Artikel sind geschlossen.