
Documentos PDF são essenciais em muitos processos de negócios, muitas vezes exigindo acesso programático ao seu conteúdo scannado. extrair texto de arquivos PDF scannados pode ser desafiador, enfatizando a necessidade de ferramentas eficazes. neste tutorial, vamos explorar como OCR PDF documentos e extrato de texto do PDF em C# usando o confiável ASPOSE.OCR para .NET API, uma biblioteca líder C# OCR PDF extração disponível para avaliação gratuita.
O que você vai aprender
Neste artigo abordaremos os seguintes tópicos:
- Visão geral de Aspose.OCR para .NET API
- Passos para OCR PDF e extrair texto
- Como executar OCR em PDF e salvar texto
- Converter OCR PDF para Word
- Converter OCR PDF para JSON
Visão geral do Aspose.OCR para .NET API
Vamos utilizar o ASPOSE.OCR para .NET API, .
O fogo contém o AsposeOcr classe, que fornece múltiplos métodos para operações OCR RecognizePdf(string, DocumentRecognitionSettings) O método é essencial para extrair texto de um documento PDF especificado DocumentRecognitionSettings A classe permite a personalização do processo de reconhecimento, enquanto o RecognitionResult A classe encapsula os resultados do reconhecimento.
Você pode Descarregue o DLL da API Ou instale através de NuGet:
PM> Install-Package Aspose.OCR
Passos para OCR PDF e extrair texto em C#
Para executar OCR em documentos PDF e extrair o texto reconhecido, siga estas etapas:
- Crie uma instância da classe AsposeOcr.
- Iniciar um objeto da classe DocumentRecognitionSettings.
- Especifique o idioma para o OCR.
- Obtenha o RecognitionResult invocando o método Pdf(), passando pelo caminho da imagem e pela DocumentRecognitionSettings O Objeto.
- Passe pela lista RecognitionResult para exibir o texto identificado.
Aqui está um exemplo ilustrando como obter documentos OCR PDF e extrair texto reconhecido em C#:
OCR PDF e extrair texto do PDF em C#
Como executar OCR em PDF e salvar texto em C#
Para executar OCR em documentos PDF e salvar o texto reconhecido, siga estas etapas:
- Crie uma instância da classe AsposeOcr.
- Iniciar um objeto da classe DocumentRecognitionSettings.
- Especifique o idioma para o OCR.
- Chame o método RecognizePdf() para obter o RecognitionResult.
- Salve o texto usando o método SaveMultipageDocument(), que requer o caminho do arquivo de saída, o SaveFormat, e o RecognitionResult O Objeto.
Aqui está um exemplo mostrando como enviar documentos PDF e salvar o texto reconhecido em C#:
Execute OCR em PDF e salve texto em C#
Converter OCR PDF para Word em C#
Para converter documentos PDF escaneados em Word, siga os mesmos passos como indicado anteriormente, mas especifique SaveFormat.Docx na etapa final.
Aqui está um exemplo ilustrando como OCR PDF e salvar o texto reconhecido como um documento do Word em C#:
OCR PDF e Converter PDF Scanned para Word em C#
Converter OCR PDF para JSON em C#
Para salvar texto reconhecido de documentos PDF em um arquivo JSON, siga os passos anteriores com a única mudança sendo especificar SaveFormat.Json na etapa final.
Aqui está um exemplo mostrando como OCR PDF e salvar o texto reconhecido como um arquivo JSON em C#:
Obtenha uma licença de avaliação gratuita
Você pode Obtenha uma licença temporária gratuita para avaliar o Aspose.OCR para .NET API sem quaisquer limitações.
Conclusão
Neste tutorial, aprendemos como executar OCR em documentos PDF e extrair texto do PDF em C TXT, O DOCX, e JSON Para mais informações sobre o Aspose.OCR para .NET API, verifique o Documentação. Se você tiver alguma pergunta, sinta-se livre para chegar a nós em nosso Fórum.
Veja também
- Converter imagens de tela para texto com OCR em C#
- OCR Imagem para Texto e Correção de Espelhos em C#
- Converter PDF escaneado para PDF procurável com OCR em C#
Ao utilizar o Aspose.OCR para .NET API, você pode implementar alta precisão PDF OCR em C# para várias aplicações, incluindo C# O CR Invoice processamento e manipulação de formulários. esta disponível solução .NET PDF Ocr é perfeita para os desenvolvedores que procuram integrar eficientemente OCR PDF capacidades em seus aplicativos.
Além disso, se você precisa converter PDF para texto em C#, esta API fornece uma solução simples.Para aqueles interessados em C# OCR PDF a texto capacidades, a integração é sem sentido, permitindo extração de texto eficiente de vários formatos de documento.
Se você está procurando um Aspose OCR C# Exemplo, este guia serve como um recurso abrangente. Além disso, para tarefas intrínsecas como o uso de C# API, esse tutorial cobre todos os elementos essenciais necessários para começar efetivamente.
Para aqueles que procuram avaliar o SDK PDF e a empresa de software de processamento de documentos Aspose em OCR PDFSDK, este tutorial serve como um excelente ponto de partida para entender as suas capacidades. Se você precisa de um C# DLL para integração ou um C # OCL tutorial para orientação, você encontrará tudo o que precisa para usar eficazmente a API em seus projetos.
Além disso, se você quiser aproveitar o reconhecimento de texto C# ou utilizar a biblioteca OCR para várias aplicações, você pode explorar as características que a Aspose oferece para suportar essas funcionalidades.A avaliação SDK PDF é uma ótima oportunidade para experimentar com as capacidades desta biblioteca, garantindo que você encontre as soluções certas para suas necessidades OCC.
Finalmente, se você precisar extrair texto do PDF em C#, ou usar um OCR API C # , as funcionalidades C# OCR PDF disponíveis irão simplificar o seu processo de desenvolvimento e melhorar a funcionalidade da sua aplicação.