Les documents PDF sont essentiels dans de nombreux processus d’affaires, qui nécessitent souvent un accès programmatique à leur contenu scanné. l’extraction du texte des fichiers PDF scannés peut être difficile, soulignant la nécessité de outils efficaces. Dans ce tutoriel, nous explorerons comment OCR PDF documents et extraire le texte de PDF en C# en utilisant le fiable Aspose.OCR pour .NET API, une bibliothèque d’extraction PDF de premier plan C# OCR disponible pour une évaluation gratuite.

Ce que vous apprendrez

Dans cet article, nous allons couvrir les sujets suivants :

Résumé de Aspose.OCR pour .NET API

Nous allons utiliser le Aspose.OCR pour .NET API, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

L’incendie contient le Aspoïdes classe, qui fournit plusieurs méthodes pour les opérations OCR. Notamment, la RecognizePdf(string, paramètres de reconnaissance de document) méthode est essentielle pour l’extraction du texte d’un document PDF spécifié. Documents de reconnaissance la classe permet de personnaliser le processus de reconnaissance, tandis que la ReconnaissanceRésultat La classe encapsule les résultats de la reconnaissance.

Vous pouvez Téléchargez le DLL de l’API ou l’installer par Nouveau:

PM> Install-Package Aspose.OCR

Étapes vers OCR PDF et Extrait du texte en C#

Pour effectuer l’OCR sur les documents PDF et extraire le texte reconnu, suivez les étapes suivantes:

  • Créez un exemple de la classe AsposeOcr.
  • Initialisez un objet de la classe DocumentRecognitionSettings.
  • Déterminer le langage pour OCR.
  • Obtenez le RécognitionRésultat en invocant la méthode RecognizePdf(), en passant la voie d’image et le Documents de reconnaissance L’objet
  • Passez à travers la liste RecognitionResult pour afficher le texte identifié.

Voici un exemple illustrant comment à OCR PDF documents et extraire le texte reconnu en C#:

OCR PDF et extraire le texte de PDF en C#

Comment réaliser OCR sur PDF et enregistrer le texte en C#

Pour effectuer l’OCR sur les documents PDF et enregistrer le texte reconnu, suivez les étapes suivantes :

  • Créez un exemple de la classe AsposeOcr.
  • Initialisez un objet de la classe DocumentRecognitionSettings.
  • Déterminer le langage pour OCR.
  • Appelez le RecognizePdf() pour obtenir le RecognitionResult.
  • Sauver le texte en utilisant la méthode SaveMultipageDocument(), qui nécessite la voie de fichier de sortie, le Sauvegarde, et le ReconnaissanceRésultat L’objet

Voici un exemple montrant comment faire des documents OCR PDF et enregistrer le texte reconnu en C#:

Exécutez OCR sur PDF et sauvegardez le texte en C#

Convertir OCR PDF à Word en C#

Pour convertir les documents PDF scannés en Word, suivez les mêmes étapes que celles indiquées ci-dessus, mais spécifiez SaveFormat.Docx dans la dernière étape.

Voici un exemple illustrant comment OCR PDF et sauvegarder le texte reconnu comme un document Word dans C#:

OCR PDF et Conversion Scanned PDF en Word en C#

Convertir OCR PDF à JSON en C#

Pour enregistrer le texte reconnu des documents PDF dans un fichier JSON, suivez les étapes précédentes avec le seul changement étant de spécifier SaveFormat.Json dans la dernière étape.

Voici un exemple montrant comment OCR PDF et sauvegarder le texte reconnu comme un fichier JSON dans C#:

Obtenez une licence d’évaluation gratuite

Vous pouvez obtenir une licence temporaire gratuite pour évaluer le Aspose.OCR pour .NET API sans aucune limitation.

Conclusion

Dans ce tutoriel, nous avons appris comment effectuer OCR sur les documents PDF et extraire le texte de PDF en C#. TXT, Docx, et JSON Pour plus d’informations sur le Aspose.OCR pour l’API .NET, consultez le La documentationSi vous avez des questions, soyez libre de nous rejoindre sur notre site. Forum.

Vedi anche

En utilisant Aspose.OCR pour API .NET, vous pouvez mettre en œuvre une précision élevée PDF OCR dans C# pour diverses applications, y compris le traitement et la manipulation des formulaires de C# Fiche de PDF. Cette solution de OCR PDF ** est parfaite pour les développeurs qui souhaitent intégrer efficacement les capacités d’ocr PDF*** dans leurs applications.

En outre, si vous avez besoin de convertir PDF en texte en C#, cette API fournit une solution simple. Pour ceux qui sont intéressés par C# OCR PDF à text capacités, l’intégration est sans signe, ce qui permet d’extraction efficace du texte de différents formats de document. Vous pouvez également utiliser la fonctionnalité Convert PDF to Text pour facilement gérer les extraits de texte des PDF, rendant votre processus de développement plus fluide.

Si vous cherchez un Aspose OCR C# Example, ce guide sert d’une ressource complète. En outre, pour les tâches compliquées telles que l’utilisation de C# API , ce tutoriel couvre tous les éléments essentiels nécessaires pour commencer efficacement.

Pour ceux qui cherchent à évaluer la société de logiciels de traitement PDF et de documents Aspose sur OCR PDF SDK, ce tutoriel sert d’un excellent point de départ pour comprendre ses capacités. Que vous ayez besoin d’un C# DLL pour l’intégration ou un ** C# O CR tutorel* pour la guidance, vous trouverez tout ce dont vous avez besoin pour utiliser efficacement l’API dans vos projets.

More in this category