
PDF 문서는 많은 비즈니스 프로세스에서 필수적이며, 종종 스캔 된 콘텐츠에 대한 프로그래밍 액세스를 필요로합니다. PDF 파일에서 텍스트를 추출하는 것은 도전적 일 수 있으며, 효과적인 도구의 필요성을 강조 할 수 있습니다.이 튜토리얼에서 우리는 OCR PDF 서류와 C#에서 PDF에서 문서를 추방하는 방법을 탐구 할 것입니다. .NET API를 위한 ASPOSE.OCR, 무료 평가를 위해 사용할 수있는 선도적 인 C# OCR PDF 추출 도서관.
무엇을 배울 것인가
이 기사에서는 다음과 같은 주제를 다루게 될 것입니다 :
- .NET API에 대한 Aspose.OCR의 개요
- OCR PDF 및 추출 텍스트에 대한 단계
- PDF에서 OCR를 실행하고 텍스트를 저장하는 방법
- OCR PDF를 Word로 변환
- OCR PDF를 JSON로 변환
.NET API를 위한 Aspose.OCR 개요
우리는 그것을 이용할 것이다 .NET API를 위한 ASPOSE.OCR, 강력한 .NET PDF OCR API는 스캔 된 이미지, 스마트 폰 사진 및 스크린 샷에서 텍스트를 인식하고 다양한 문서 형식으로 결과를 반환하도록 설계되었습니다.이 API는 이미지를 텍스트로 변환 할뿐만 아니라 스캔에서 검색 가능한 PDF를 만들고 인식 된 텍스트에서 녹음 오류를 수정하여 가장 빠른 C# PDF OCR 솔루션 중 하나입니다.
화재는 그것을 포함한다. AsposeOcr 클래스, OCR 작업을위한 여러 방법을 제공합니다. 인식 PDF(string, DocumentRecognitionSettings) 방법은 특정 PDF 문서에서 텍스트를 추출하는 데 필수적입니다. DocumentRecognitionSettings 클래스는 인식 프로세스를 사용자 정의 할 수 있지만, RecognitionResult 클래스는 인식의 결과를 캡슐화합니다.
당신은 할 수 API의 DLL 다운로드 또는 그것을 통해 설치 NuGet:
PM> Install-Package Aspose.OCR
OCR PDF 및 C#에서 텍스트를 추출하는 단계
PDF 문서에서 OCR를 수행하고 인식 된 텍스트를 추출하려면 다음 단계를 따르십시오 :
- AsposeOcr 클래스의 예를 만드십시오.
- DocumentRecognitionSettings 클래스의 개체를 시작합니다.
- OCR에 대한 언어를 지정합니다.
- RecognitionResult를 사용하여 Pdf() 방법을 호출하여 이미지 경로를 통과하고 DocumentRecognitionSettings 개체를 위한
- 확인된 텍스트를 표시하기 위해 RecognitionResult 목록을 통해 이동합니다.
다음은 OCR PDF 문서와 C#에서 인식 된 텍스트를 추출하는 방법을 보여주는 예입니다 :
OCR PDF 및 C#에서 PDF에서 텍스트 추출
PDF에서 OCR를 실행하고 C#에서 텍스트를 저장하는 방법
PDF 문서에서 OCR를 수행하고 인식 된 텍스트를 저장하려면 다음 단계를 따르십시오.
- AsposeOcr 클래스의 예를 만드십시오.
- DocumentRecognitionSettings 클래스의 개체를 시작합니다.
- OCR에 대한 언어를 지정합니다.
- RecognizePdf() 방법을 호출하여 RecognitionResult를 얻으십시오.
- SaveMultipageDocument() 방법을 사용하여 텍스트를 저장하여 출력 파일 경로가 필요합니다. SaveFormat그리고 그것은 RecognitionResult 개체를 위한
다음은 OCR PDF 문서를 저장하고 C#에서 인식 된 텍스트를 저장하는 방법을 보여주는 예입니다 :
PDF에서 OCR를 실행하고 C#에서 텍스트를 저장합니다.
OCR PDF를 C#로 Word로 변환
스캔된 PDF 문서를 Word로 변환하려면 이전에 언급한 것과 동일한 단계를 따르지만 최종 단계에서 SaveFormat.Docx를 지정합니다.
다음은 어떻게 OCR PDF를 저장하고 C#에서 Word 문서로 인식 된 텍스트를 저장하는 방법을 보여주는 예입니다:
OCR PDF 및 C#로 스캔된 PDF를 Word로 변환
OCR PDF를 C#로 JSON으로 변환
JSON 파일에서 PDF 문서에서 인식 된 텍스트를 저장하려면 최종 단계에서 SaveFormat.Json를 지정하는 유일한 변경 단계로 이전 단계를 따르십시오.
다음은 어떻게 OCR PDF를 저장하고 C#에서 JSON 파일로 인식 된 텍스트를 저장하는 방법을 보여주는 예입니다:
무료 평가 라이센스를 받으십시오.
당신은 할 수 무료 임시 라이센스를 받으십시오. .NET API에 대한 Aspose.OCR를 제한 없이 평가할 수 있습니다.
결론
이 튜토리얼에서 우리는 PDF 문서에서 OCR를 수행하고 C#에서 PDF에서 텍스트를 추출하는 방법을 배웠습니다. 텍스트, 도크스그리고, 그리고 JSON .NET API의 Aspose.OCR에 대한 자세한 내용은 해당 API를 확인하십시오. 문서화당신이 어떤 질문이 있다면, 우리에게 도달 할 수있는 자유를 느끼십시오. 포럼.
또한 보기
Aspose.OCR for .NET API를 사용하면 다양한 응용 프로그램을 위해 C#에서 높은 정확도를 구현할 수 있습니다. C# OCR Invoice 처리 및 양식 처리 등.이 가용 가능한 .Net PDF 오크라 솔루션은 개발자가 효율적으로 OCR PDF 기능을 애플리케이션에 통합하려는 데 완벽합니다.
또한, PDF를 C#로 텍스트로 변환할 필요가 있다면, 이 API는 간단한 솔루션을 제공합니다. C# OCR PDF to text 기능에 관심이 있는 사람들을 위해, 통합은 다양한 문서 형식에서 효율적인 테스트 추출을 허용하는 무제한입니다.
Aspose OCR C# 예제를 찾고 있다면, 이 가이드는 포괄적 인 자원으로 제공됩니다. C# O CR API 사용과 같은 흥미로운 작업을 위해이 튜토리얼은 효과적으로 시작하는 데 필요한 모든 필수 요소를 다루고 있습니다.
PDF SDK 및 문서 처리 소프트웨어 회사 Aspose를 평가하고자하는 사람들을 위해, 이 튜토리얼은 그것의 능력을 이해하기위한 훌륭한 출발점입니다. 통합을 위해 C# OCR DLL 또는 가이드에 대한 C# 오크루트가 필요하든, 당신은 당신의 프로젝트에서 API를 효과적으로 사용하는 데 필요한 모든 것을 찾을 수 있습니다.
또한, C# 텍스트 인식을 활용하거나 다양한 응용 프로그램을 위해 C# OCR 라이브러리를 사용하려면 Aspose가 제공하는 기능을 탐구할 수 있습니다. c# oCR PDF SDK 평가는이 도서관의 능력을 실험 할 수있는 훌륭한 기회입니다.
마지막으로, C#에서 PDF에서 텍스트를 추출하거나 OCR API C #를 사용해야 하는 경우, 사용 가능한 C# OCR PDF 기능은 개발 과정을 단순화하고 응용 프로그램의 기능을 향상시킬 것입니다.