
PDF documents are essential in many business processes, often requiring programmatic access to their scanned content. Extracting text from scanned PDF files can be challenging, emphasizing the need for effective tools. In this tutorial, we will explore how to OCR PDF documents and extract text from PDF in C# using the reliable Aspose.OCR für .NET API, eine führende C# OCR PDF-Extraktionsbibliothek für kostenlose Bewertung verfügbar.
Was du lernen wirst
In diesem Artikel werden wir die folgenden Themen abdecken:
- Überblick über Aspose.OCR für .NET API
- Schritte zu OCR PDF und Text extrahieren
- Wie man OCR auf PDF durchführt und Text speichert
- Umwandeln OCR PDF in Word
- Umwandeln OCR PDF in JSON
berblick über Aspose.OCR für .NET API
We will utilize the Aspose.OCR für .NET API, **.
The API features the AsposeOcr class, which provides multiple methods for OCR operations. Notably, the RecognizePdf (String, DokumentRecognitionSettings) method is essential for extracting text from a specified PDF document. The DokumenterkennungSettings class allows customization of the recognition process, while the Erkennungsergebnis class encapsulates the results of the recognition.
You can Download der DLL der API or install it via Neugier:
PM> Install-Package Aspose.OCR
Schritte zu OCR PDF und Text in C#
Um OCR auf PDF-Dokumenten durchzuführen und den anerkannten Text zu extrahieren, folgen Sie diesen Schritten:
- Erstellen Sie ein Beispiel der AsposeOcr Klasse.
- Initialisieren Sie ein Objekt der Klasse **DocumentRecognitionSettings.
- Angeben Sie die Sprache für OCR.
- Obtain the RecognitionResult by invoking the RecognizePdf() method, passing the image path and the DokumenterkennungSettings object.
- Gehen Sie durch die RecognitionResult-Liste, um den identifizierten Text anzuzeigen.
Hier ist ein Beispiel, das illustriert wie OCR PDF-Dokumente und erkannte Text in C# extrahieren#**:
OCR PDF und Text aus PDF in C#
Wie OCR auf PDF durchführen und Text in C# speichern
Um OCR auf PDF-Dokumenten durchzuführen und den anerkannten Text zu speichern, folgen Sie diesen Schritten:
- Erstellen Sie ein Beispiel der AsposeOcr Klasse.
- Initialisieren Sie ein Objekt der Klasse **DocumentRecognitionSettings.
- Angeben Sie die Sprache für OCR.
- Rufen Sie die RecognizePdf() Methode an, um das RecognitionResult zu erhalten**.
- Save the text using the SaveMultipageDocument() method, which requires the output file path, the SaveFormat, and the Erkennungsergebnis object.
Hier ein Beispiel, das demonstriert wie zu OCR PDF-Dokumente und speichern Sie den anerkannten Text in C#:
OCR auf PDF ausführen und Text in C# speichern#
Konvertierung von OCR PDF in Word in C#
Um skannte PDF-Dokumente in Word zu konvertieren, folgen Sie den gleichen Schritten wie zuvor beschrieben, aber geben Sie im letzten Schritt SaveFormat.Docx an.
Hier ist ein Beispiel, das illustriert wie zu OCR PDF und speichern Sie den anerkannten Text als Word-Dokument in C#:
OCR PDF und Convert Scanned PDF in Word in C#
Konvertierung von OCR PDF in JSON in C#
Um erkannte Text aus PDF-Dokumenten in einer JSON-Datei zu speichern, folgen Sie den vorherigen Schritten mit der einzigen Änderung, um SaveFormat.Json im letzten Schritt zu angeben.
Hier ist ein Beispiel, das demonstriert wie zu OCR PDF und speichern Sie den anerkannten Text als JSON-Datei in C#:
Erhalten Sie eine kostenlose Bewertungslizenz
You can Erhalten Sie eine freie vorübergehende Lizenz to evaluate the Aspose.OCR for .NET API without any limitations.
Schlussfolgerungen
In this tutorial, we learned how to perform OCR on PDF documents and extract text from PDF in C#. We also explored how to save the recognized text as a TXT, DOCX, and JSON file. For more information on the Aspose.OCR for .NET API, check out its Dokumentation. If you have any questions, feel free to reach out to us on our Forum.
Sehen Sie auch
- Umwandeln Sie Screenshot in Text mit OCR in C#
- OCR Image to Text und Spelling Correction in C#
- Konvertieren Scanned PDF in Searchable PDF mit OCR in C#
Durch die Nutzung der Aspose.OCR für .NET API, können Sie eine hohe Genauigkeit PDF OCR in C# für verschiedene Anwendungen, einschließlich Rechnungsverarbeitung und Formularbehandlung implementieren. Diese anwendbare .Net PDF Ocr-Lösung ist perfekt für Entwickler, die die OCR PDF-Fähigkeiten in ihre Anwendung effizient integrieren möchten.
Darüber hinaus, wenn Sie PDF in Text in C#** konvertieren müssen, bietet diese API eine einfache Lösung. Für diejenigen, die an C# OCR PDF zu Text Fähigkeiten interessiert sind, ist die Integration unbequeme und ermöglicht eine effiziente Text-Extraktion aus verschiedenen Dokumentformaten. Sie können auch die Funktionalität C# Convert PDF to Text verwenden, um die Textextraction aus PDFs leicht zu handhaben, wodurch Ihr Entwicklungsverfahren sauberer wird.
Wenn Sie auf der Suche nach einem Aspose OCR C# Beispiel sind, dient dieser Leitfaden als umfassende Ressource. Zusätzlich, für intrikate Aufgaben wie C# O CR Rechnung Verarbeitung oder die Erfüllung einer S #OCR API, umfasst dieser Tutorial alle wesentlichen Elemente, die notwendig sind zu beginnen effizient.