Top
PDFelement
PDFelement: PDF-Editor, Scanner
PDF bearbeiten, konvertieren, mit Anmerkungen versehen
PDF bearbeiten, mit Kommentaren versehen
Öffnen Öffnen
Startseite > Mac How-Tos > OCR für Text in PDF- und Bilddateien durchführen

OCR für Text in PDF- und Bilddateien durchführen

author name

2024-04-12 15:50:31 • Abgelegt unter: Mac How-Tos • Bewährte Lösungen

OCR oder optische Zeichenerkennung ist ein Computerverfahren, das bildbasierte Zeichen in bearbeitbaren oder durchsuchbaren Text umwandelt. Es wird in der Regel für PDF-Dateien verwendet, die mit einem Scanner erstellt wurden oder auch für Bilddateien, die Text enthalten. OCR ist sehr hilfreich bei der Konvertierung von physischen Dokumenten oder nicht bearbeitbaren digitalen Dateien in PDF-Dateien, mit denen Sie entweder mit einem PDF-Editor oder einem PDF-Reader arbeiten können. Einige typische Anwendungsfälle für OCR:

  • Umwandlung von Papierrechnungen in ein digitales Format
  • Scannen und Konvertieren handschriftlich ausgefüllter Formulare
  • Umwandlung von Inhalten aus einem nicht interaktiven Zustand in einen interaktiven Zustand, z.B. Umwandlung von Büchern in E-Books

Wie auch immer das Szenario aussieht, vergessen wir nicht, dass der wichtigste Aspekt bei der Auswahl eines OCR-Tools die Genauigkeit ist. Hierfür empfehlen wir Wondershare PDFelement - PDF Editor, das sowohl für Windows- als auch für Mac-Systeme verfügbar ist und eine der höchsten OCR-Genauigkeitsraten der Branche aufweist. Außerdem können Sie bildbasierten Text je nach Zweck der Konvertierung in ein durchsuchbares oder bearbeitbares Format umwandeln.

Teil 1. Wie man für ein Dokument oder ein Bild in PDFelement OCR durchführen kann

Die Durchführung von OCR auf einem Dokument ist buchstäblich ein Kinderspiel, denn PDFelement sagt Ihnen genau, was zu tun ist. Sobald Sie eine nicht bearbeitbare PDF-Datei öffnen oder die Funktion PDF erstellen verwenden, um ein Bild in eine PDF-Datei zu konvertieren, erkennt das Programm dies und fordert Sie auf, das OCR-Plugin zu installieren und die OCR durchzuführen. Das sehen Sie auf Ihrem Bildschirm:

1. Für Bilddateien verwenden Sie die Schaltfläche PDF erstellen auf der Startseite, um Ihre JPGs, PNGs, etc. hinzuzufügen und klicken Sie auf Erstellen, um sie in PDF zu konvertieren und in PDFelement zu öffnen. Für nicht bearbeitbare PDFs verwenden Sie einfach die Option Dateien öffnen, um die Datei aus ihrem Ordner zu holen.

ocr download

2. Sobald die Datei geöffnet ist, wird in der Benachrichtigungsleiste über dem Dokument die Aufforderung OCR durchführen angezeigt. Wenn Sie hierauf klicken, werden Sie aufgefordert, das OCR-Plugin herunterzuladen und zu installieren. Tun Sie das jetzt.

ocr durchführen

3. Nach der Installation sind Sie bereit, die PDF-Datei mit OCR zu bearbeiten. Klicken Sie auf die Benachrichtigungsschaltfläche, um OCR durchzuführen. Diesmal sehen Sie ein weiteres Fenster mit zwei Optionsbereichen: Wählen Sie im Bereich Scanoptionen zwischen bearbeitbar und durchsuchbar; wählen Sie im Seitenbereich die Option Alle, Aktuell oder geben Sie den Bereich der zu konvertierenden Seitenzahlen an. Wählen Sie schließlich die Ausgangssprache und klicken Sie auf Übernehmen.

ocr Seitenbereich

4. Ihre Datei wird nun entsprechend Ihren Einstellungen konvertiert.

ocr einstellung


Teil 2. So exportieren Sie das OCR-konvertierte Dokument

Jetzt, wo die Datei lesbar oder durchsuchbar ist, können Sie sie bearbeiten, Text extrahieren und verschiedene andere Aktionen durchführen. Aber wie exportiert man sie? Genau darum geht es in diesem Abschnitt.

1. Da es sich nun um eine PDF-Datei handelt, ist eine weitere Konvertierung nicht erforderlich. Sie können die Datei exportieren, indem Sie auf Datei → Speichern unter gehen. Wir verwenden diese Option, um das ursprüngliche bildbasierte PDF zu behalten und einen anderen Namen für die konvertierte Datei zu verwenden.

speichern-unter

2. Wenn Sie sie direkt per E-Mail weitergeben oder in einen Cloud-Speicherdienst hochladen möchten, können Sie das Symbol "Freigeben" oben verwenden oder über "Datei → Freigeben" auf die Funktion zugreifen. Dadurch wird Ihr Standard-E-Mail-Programm oder Ihr Browser aktiviert. Sie können die restlichen E-Mail-Felder ausfüllen oder sich bei Ihrem Cloud-Speicherdienst-Konto anmelden und die PDF-Datei dort speichern.

an E-Mail anhängen

3. Eine weitere Möglichkeit, ein OCR-PDF zu exportieren, ist der Druck. Verwenden Sie dazu die Option Datei → Drucken.

drucken

Sie können nun diese beiden Prozesse für jede bildbasierte PDF- oder Bilddatei, die Text enthält, durchführen. Aber wie können Sie mehrere Dateien gleichzeitig verarbeiten? Mit PDFelement Pro können Sie dies ebenfalls tun, wie im folgenden Abschnitt erläutert wird.


Teil 3. OCR für mehrere Dokumente im Stapel

PDFelement Pro bietet auch eine Stapelverarbeitungsfunktion für OCR und viele andere Funktionen. Um diese Funktion zu nutzen, befolgen Sie die hier beschriebenen Schritte.

1. Auf der Registerkarte Tool finden Sie die Option Stapelverarbeitung in der Multifunktionsleiste. Klicken Sie darauf, um das Stapelverarbeitungs Dialogfenster zu öffnen.

stapel ocr

2. Auf der linken Seite sehen Sie verschiedene Optionen wie Konvertieren, Erstellen und Optimieren. Klicken Sie in dieser Seitenleiste auf OCR.

3. Sie können die Dateien per Drag & Drop in dieses Fenster ziehen oder die Schaltfläche Dateien hinzufügen oben rechts verwenden.

4. Sobald Ihre Dateien importiert sind, können Sie die Sprache, den Seitenbereich und andere Parameter wie durchsuchbar/editierbar auswählen. Klicken Sie abschließend auf Übernehmen und alle Dateien werden entsprechend den von Ihnen festgelegten Einstellungen konvertiert.

Mit diesem Verfahren können Sie in kürzester Zeit Hunderte von Dateien mit OCR konvertieren und so Ihre Dokumenten-Workflows schnell digitalisieren.


Teil 4. Bearbeiten von gescannten Dokumenten mit OCR

Sobald OCR durchgeführt wurde und die Datei bearbeitbar ist, können Sie sie wie jede andere maschinenlesbare PDF-Datei bearbeiten. Das bedeutet, dass Sie jedes einzelne Element in der Datei kontrollieren können, egal ob es sich um Text, Bilder, Hyperlinks, eingebettete Objekte, Wasserzeichen, Kopf- und Fußzeilen, etc. handelt. So bearbeiten Sie ein gescanntes Dokument nach der OCR.

1. Wenn Sie die OCR bereits durchgeführt haben, können Sie nun oben auf die Registerkarte Bearbeiten klicken.

pdf-Text bearbeiten

2. Daraufhin werden die verschiedenen Bearbeitungstools für die einzelnen Komponenten angezeigt. Wenn Sie zum Beispiel einen Text bearbeiten möchten, klicken Sie auf das Symbol Text. Sie können den Text auch im Zeilen- oder Absatzmodus bearbeiten.

3. Sobald Sie sich im Textbearbeitungsmodus befinden, können Sie ein beliebiges Wort, eine Phrase, einen Satz oder einen Absatz im Dokument auswählen und es entweder löschen, ergänzen oder ändern.

4. Um Bilder zu bearbeiten, klicken Sie einfach auf das Bildsymbol und wählen das Bild aus. Sie haben die Möglichkeit, sie zu ersetzen, zu drehen, neu zu positionieren, etc.

5. Ebenso gibt es Optionen zum Hinzufügen oder Bearbeiten von Links, Wasserzeichen, Hintergründen und vielem mehr.


Wieso PDFelement?

Lassen Sie uns abschließend versuchen, diese sehr wichtige Frage zu beantworten. Der Grund dafür ist, dass Sie vielleicht einen anderen PDF-Editor mit OCR-Funktionalität verwenden, der aber möglicherweise nicht exakt ist oder Ihr Budget übersteigt. Hier sind einige der Gründe, die für einen Wechsel zu PDFelement sprechen:

  • Präzise - Hochpräzise OCR in über 20 Sprachen, mit Unterstützung für mehrsprachige OCR
  • Schnell - Die Konvertierungsgeschwindigkeiten gehören zu den besten in der Branche
  • Intuitiv - PDFelement ist für neue Benutzer leicht zu erlernen, was den Umstieg erleichtert.
  • Umfassend - Nahezu jede Funktion, die in den bekanntesten PDF-Editoren der Welt zu finden ist, findet sich in PDFelement
  • Up-to-date - PDFelement erhält ständig kleinere und größere Versions-Upgrades, die immer wieder neue Maßstäbe in Sachen Leistung und Benutzerfreundlichkeit setzen.

Lassen Sie uns zum Schluss versuchen, einige Fragen zu beantworten, die Sie vielleicht über OCR und verwandte Themen haben.


Frequently Asked Questions

Ist OCR 100 % genau?

Kein OCR Tool ist bei allen Arten von Textinhalten 100%ig genau. Wenn der Text zum Beispiel handschriftlich und kaum lesbar ist, ist es sehr schwer, ihn mit den Augen zu lesen, geschweige denn eine OCR durchzuführen. Bei gedrucktem Text ist die OCR jedoch so genau wie möglich. Es ist daher äußerst nützlich bei der Konvertierung gescannter Dateien, die gedruckten oder getippten Text und andere Zeichen enthalten.

Kann ich OCR für handschriftliche Notizen verwenden?

Wie bereits erwähnt, muss die Handschrift gut lesbar sein, damit die OCR korrekt arbeiten kann. Kursive Schrift ist am schwierigsten zu konvertieren, aber die Genauigkeit ist viel höher, wenn die Handschrift in Blockschrift geschrieben ist. Denken Sie daran, dass die OCR umso genauer ist, je deutlicher die Schrift ist und je besser sie für das menschliche Auge lesbar ist.

Kann ich ein Dokument direkt in eine bearbeitbare PDF-Datei scannen?

Ja, PDFelement bietet diese Funktion. Klicken Sie dazu auf Datei → Erstellen → Aus Scanner. Dadurch wird das Dialogfeld für die Scaneinstellungen geöffnet, in dem Sie eine Scannen Schaltfläche sehen. Klicken Sie darauf und der Scanner scannt das Dokument, woraufhin PDFelement es importiert und mit dem OCR-Plugin konvertiert.

Kostenlos Downloaden oder PDFelement kaufen jetzt sofort!

Kostenlos Downloaden oder PDFelement kaufen jetzt sofort!

PDFelement kaufen jetzt sofort!

PDFelement kaufen jetzt sofort!


author name

Noah Hofer

staff Editor

Sagen Sie Ihre Meinung

Registrieren / Anmelden dann schreiben Sie Ihre Bewertung
user
{{item.name || userName}}
{{item.time}}
{{item.message}}
{{item.likes}} Antwort abbrechen Antwort
Registrieren / Anmelden dann schreiben Sie Ihre Antwort
user
{{item1.type == 2 ? authName : item1.name ? item1.name : userName}}
{{item1.time}}
@{{item1.reply_to_type == 2 ? authName : item1.reply_to_name ? item1.reply_to_name : userName}} {{item1.message}}
{{item.likes}} Cancel Reply Antwort
Registrieren / Anmelden dann schreiben Sie Ihre Antwort