Documentos PDF são essenciais em muitos processos de negócios, muitas vezes exigindo acesso programático ao seu conteúdo scannado. extrair texto de arquivos PDF scannados pode ser desafiador, enfatizando a necessidade de ferramentas eficazes. neste tutorial, vamos explorar como OCR PDF documentos e extrato de texto do PDF em C# usando o confiável ASPOSE.OCR para .NET API, uma biblioteca líder C# OCR PDF extração disponível para avaliação gratuita.

O que você vai aprender

Neste artigo abordaremos os seguintes tópicos:

Visão geral do Aspose.OCR para .NET API

Vamos utilizar o ASPOSE.OCR para .NET API, .

O fogo contém o AsposeOcr classe, que fornece múltiplos métodos para operações OCR RecognizePdf(string, DocumentRecognitionSettings) O método é essencial para extrair texto de um documento PDF especificado DocumentRecognitionSettings A classe permite a personalização do processo de reconhecimento, enquanto o RecognitionResult A classe encapsula os resultados do reconhecimento.

Você pode Descarregue o DLL da API Ou instale através de NuGet:

PM> Install-Package Aspose.OCR

Passos para OCR PDF e extrair texto em C#

Para executar OCR em documentos PDF e extrair o texto reconhecido, siga estas etapas:

  • Crie uma instância da classe AsposeOcr.
  • Iniciar um objeto da classe DocumentRecognitionSettings.
  • Especifique o idioma para o OCR.
  • Obtenha o RecognitionResult invocando o método Pdf(), passando pelo caminho da imagem e pela DocumentRecognitionSettings O Objeto.
  • Passe pela lista RecognitionResult para exibir o texto identificado.

Aqui está um exemplo ilustrando como obter documentos OCR PDF e extrair texto reconhecido em C#:

OCR PDF e extrair texto do PDF em C#

Como executar OCR em PDF e salvar texto em C#

Para executar OCR em documentos PDF e salvar o texto reconhecido, siga estas etapas:

  • Crie uma instância da classe AsposeOcr.
  • Iniciar um objeto da classe DocumentRecognitionSettings.
  • Especifique o idioma para o OCR.
  • Chame o método RecognizePdf() para obter o RecognitionResult.
  • Salve o texto usando o método SaveMultipageDocument(), que requer o caminho do arquivo de saída, o SaveFormat, e o RecognitionResult O Objeto.

Aqui está um exemplo mostrando como enviar documentos PDF e salvar o texto reconhecido em C#:

Execute OCR em PDF e salve texto em C#

Converter OCR PDF para Word em C#

Para converter documentos PDF escaneados em Word, siga os mesmos passos como indicado anteriormente, mas especifique SaveFormat.Docx na etapa final.

Aqui está um exemplo ilustrando como OCR PDF e salvar o texto reconhecido como um documento do Word em C#:

OCR PDF e Converter PDF Scanned para Word em C#

Converter OCR PDF para JSON em C#

Para salvar texto reconhecido de documentos PDF em um arquivo JSON, siga os passos anteriores com a única mudança sendo especificar SaveFormat.Json na etapa final.

Aqui está um exemplo mostrando como OCR PDF e salvar o texto reconhecido como um arquivo JSON em C#:

Obtenha uma licença de avaliação gratuita

Você pode Obtenha uma licença temporária gratuita para avaliar o Aspose.OCR para .NET API sem quaisquer limitações.

Conclusão

Neste tutorial, aprendemos como executar OCR em documentos PDF e extrair texto do PDF em C TXT, O DOCX, e JSON Para mais informações sobre o Aspose.OCR para .NET API, verifique o Documentação. Se você tiver alguma pergunta, sinta-se livre para chegar a nós em nosso Fórum.

Veja também

Ao utilizar o Aspose.OCR para .NET API, você pode implementar alta precisão PDF OCR em C# para várias aplicações, incluindo C# O CR Invoice processamento e manipulação de formulários. esta disponível solução .NET PDF Ocr é perfeita para os desenvolvedores que procuram integrar eficientemente OCR PDF capacidades em seus aplicativos.

Além disso, se você precisa converter PDF para texto em C#, esta API fornece uma solução simples.Para aqueles interessados em C# OCR PDF a texto capacidades, a integração é sem sentido, permitindo extração de texto eficiente de vários formatos de documento.

Se você está procurando um Aspose OCR C# Exemplo, este guia serve como um recurso abrangente. Além disso, para tarefas intrínsecas como o uso de C# API, esse tutorial cobre todos os elementos essenciais necessários para começar efetivamente.

Para aqueles que procuram avaliar o SDK PDF e a empresa de software de processamento de documentos Aspose em OCR PDFSDK, este tutorial serve como um excelente ponto de partida para entender as suas capacidades. Se você precisa de um C# DLL para integração ou um C # OCL tutorial para orientação, você encontrará tudo o que precisa para usar eficazmente a API em seus projetos.

Além disso, se você quiser aproveitar o reconhecimento de texto C# ou utilizar a biblioteca OCR para várias aplicações, você pode explorar as características que a Aspose oferece para suportar essas funcionalidades.A avaliação SDK PDF é uma ótima oportunidade para experimentar com as capacidades desta biblioteca, garantindo que você encontre as soluções certas para suas necessidades OCC.

Finalmente, se você precisar extrair texto do PDF em C#, ou usar um OCR API C # , as funcionalidades C# OCR PDF disponíveis irão simplificar o seu processo de desenvolvimento e melhorar a funcionalidade da sua aplicação.

More in this category