
PDF документи са от съществено значение в много бизнес процеси, които често изискват програмиран достъп до скенираното им съдържание. Извличането на текст от сканираните PDF файлове може да бъде предизвикателство, подчертавайки необходимостта от ефективни инструменти. В този урок ще разгледаме как да OCR PDF документите и да извлечем текстът от PDF в C# с помощта на надеждно ASPOSE.OCR за .NET API, водеща C# OCR PDF екстракционна библиотека достъпна за безплатна оценка.
Какво ще научите
В тази статия ще обхванем следните теми:
- Преглед на Aspose.OCR за .NET API
- Стъпки към OCR PDF и извличане на текст
- Как да изпълняваме OCR на PDF и да съхраняваме текст
- Конвертиране на OCR PDF в Word
- Конвертиране на OCR PDF в JSON
Aspose.OCR за .NET API
Ние ще използваме ASPOSE.OCR за .NET API, Този API не само конвертира изображения в текст, но и създава търсещи PDF файлове от сканиране и коригира всяка грешка в записването в признатия текст и го прави един от най-бързите C# PDF OCR решения достъпни за само $99.
Огънят се характеризира с AsposeOcr клас, който осигурява няколко метода за операциите на OCR RecognizePdf(string, ДокументRecognitionSettings) Методът е от съществено значение за извличане на текст от определен PDF документ DocumentRecognitionSettings клас позволява персонализиране на процеса на разпознаване, докато RecognitionResult Класа инкапсулира резултатите от признаването.
Можете да Изтеглете DLL на API или го инсталирате чрез NuGet:
PM> Install-Package Aspose.OCR
OCR PDF и Извличане на текст в C# {# стъпки-на-ocr-pdf-and-extract-text-in-c}
За да изпълните OCR на PDF документи и да извлечете признатия текст, следвайте следните стъпки:
- Създайте инстанция от класа AsposeOcr.
- Иницијализирайте обект от класата DocumentRecognitionSettings.
- Определете езика на OCR.
- Получете RecognitionResult, като позовавате метода Pdf() и преминавате пътя на изображението DocumentRecognitionSettings на обекта.
- Преминавайте през списъка RecognitionResult, за да видите идентифицирания текст.
Ето един пример, който илустрира как да OCR PDF документи и извлича признат текст в C#:
OCR PDF и извличане на текст от PDF в C#
OCR на PDF и да съхранявате текст в C#
За да изпълните OCR на PDF документи и да запазите признатия текст, следвайте следните стъпки:
- Създайте инстанция от класа AsposeOcr.
- Иницијализирайте обект от класата DocumentRecognitionSettings.
- Определете езика на OCR.
- Използвайте метода RecognizePdf(), за да получите резултата Reflex.
- Съхраняване на текста чрез SaveMultipageDocument() метод, който изисква изходния път на файла SaveFormat, и на RecognitionResult на обекта.
Ето един пример, който показва как да получите OCR PDF документи и да запазите признатия текст в C#:
Извършване на OCR в PDF и съхранение на текст в C#
OCR PDF в Word в C#
За да конвертирате скенираните PDF документи в Word, следвайте същите стъпки, както е посочено по-рано, но в последния етап посочете SaveFormat.Docx.
Ето един пример, който илюстрира как да OCR PDF и да съхранява признатия текст като документ на Word в C#:
OCR PDF и конвертиране на сканирания PDF в Word в C#
OCR PDF в JSON в C#
За да запазите разпознатия текст от PDF документи в JSON файл, следвайте предходните стъпки с единствената промяна е да посочите SaveFormat.Json в последния етап.
Ето един пример, който показва как да OCR PDF и да съхранява признатия текст като JSON файл в C#:
Получете безплатна лиценза за оценка
Можете да Получете безплатна временна лиценза за оценка на Aspose.OCR за .NET API без никакви ограничения.
заключение
В този урок научихме как да изпълняваме OCR на PDF документи и да извличаме текст от PDF в C ТГТ, Докс, и JSON За повече информация относно Aspose.OCR за .NET API, проверете Документация. Ако имате някакви въпроси, се чувствайте свободни да стигнете до нас на нашия Форумът.
Вижте също
- Конвертирайте снимка на екрана в текст с OCR в C#
- OCR Image to Text и Spelling Correction в C#
- PDF в търсещ PDF с OCR в C#
Чрез използването на Aspose.OCR за .NET API, можете да прилагате висока точност PDF OCR в C# за различни приложения, включително C# ОCR Invoice обработка и обработване на формуляри. Това достъпно .NET PDF O CR решение е перфектно за разработчиците, които искат да интегрират OCR PDF възможности в своите приложения ефективно.
Освен това, ако трябва да конвертирате PDF в текст в C#, тази API осигурява едноставно решение.За тези, които се интересуват от C# OCR PDF до текст възможности, интеграцията е безсилна, позволяваща ефективно извличане на текст от различни формати на документ. Можете също така да използвате функцията Convert PDF to Text за лесно да се справят с извлечението на текста от PDFs, което прави процеса на разработване по-лесно.
Ако търсите Aspose OCR C# Пример, този ръководство служи като цялостен ресурс. Освен това, за интриктивни задачи като C# ОCR API използване, настоящият урок обхваща всички основни елементи, необходими за ефективно стартиране.
За тези, които искат да оценят PDF SDK и софтуер за обработка на документи компанията Aspose на OCR PDFSDK, този урок служи като отлична отправна точка, за да разберете неговите възможности. Независимо дали се нуждаете от C# ОCR DLL за интеграция или Ц # ОКР Урок за ръководство, ще намерите всичко, което трябва да използвате ефективно API в вашите проекти.
Освен това, ако искате да използвате C# текстово разпознаване или да се възползвате от Ц# OCR библиотека за различни приложения, можете да проучите функциите, които Aspose предлага, за да поддържате тези функции. Оценката на PDF SDK е отлична възможност да експериментирате с възможностите на тази библиотеки, като се гарантира, че ще намерите правилните решения за нуждите на вашата ОCR.
И накрая, ако трябва да извличате текст от PDF в C# или да използвате OCR API C #, наличните функции на C# OCR PDF ще улеснят процеса на разработване и ще подобрят функционалността на приложението.