PDF-документы необходимы для многих бизнес-процессов, часто требующих программатического доступа к скенируемому контенту. Экстракция текста из сканированных файлов PDF может быть сложной, подчеркивая потребность в эффективных инструментах. В этом учебном заведении мы исследуем как получить OCR PDF документы и экстрактировать текст из PDF в C# с помощью надежных инструментов ASPOSE.OCR для .NET API, ведущая C# OCR PDF экстракционная библиотека доступна для бесплатной оценки.

Что вы научитесь

В этой статье мы обсудим следующие темы:

Обзор Aspose.OCR для .NET API

Мы будем использовать ASPOSE.OCR для .NET API, .

Огонь характеризуется AsposeOcr класс, который обеспечивает многочисленные методы для операций OCR RecognizePdf(string, DocumentRecognitionSettings) метод необходим для извлечения текста из определенного PDF-документа DocumentRecognitionSettings класс позволяет персонализировать процесс распознавания, в то время как RecognitionResult Класс инкапсулирует результаты признания.

Вы можете Скачать DLL API или установить через NuGet:

PM> Install-Package Aspose.OCR

Шаги к OCR PDF и Экстракт текста в C#

Чтобы выполнить OCR на PDF-документах и извлечь признанный текст, выполните следующие шаги:

  • Создайте инстанцию класса AsposeOcr.
  • Инициализуйте объект класса DocumentRecognitionSettings.
  • Определите язык для OCR.
  • Получите RecognitionResult путем обращения к методу Pdf(), проходя дорогу изображения и DocumentRecognitionSettings Объект.
  • Пройдите через список RecognitionResult, чтобы показать идентифицированный текст.

Вот пример, иллюстрирующий как получить OCR PDF-документы и извлечь признанный текст в C#:

OCR PDF и экстракт текста из PDF в C#

Как выполнить OCR на PDF и сохранить текст в C#

Чтобы выполнить OCR на PDF-документах и сохранить признанный текст, выполните следующие шаги:

  • Создайте инстанцию класса AsposeOcr.
  • Инициализуйте объект класса DocumentRecognitionSettings.
  • Определите язык для OCR.
  • Назовите RecognizePdf() метод, чтобы получить RecognitionResult.
  • Сохранить текст с помощью метода SaveMultipageDocument(), который требует источника файла SaveFormat, И в том, что RecognitionResult Объект.

Вот пример, демонстрирующий как получить OCR PDF-документы и сохранить признанный текст в C#:

Выполните OCR на PDF и сохраните текст в C#

Конвертирование OCR PDF в Word в C#

Чтобы конвертировать сканированные PDF-документы в Word, выполните те же шаги, что и выше, но в заключительном шаге указать SaveFormat.Docx.

Вот пример, иллюстрирующий как получить OCR PDF и сохранить признанный текст как документ Word в C#:

OCR PDF и конвертировать сканированный PDF в Word в C#

Конвертирование OCR PDF в JSON в C#

Чтобы сохранить признанный текст из PDF-документов в JSON-файле, следуйте предыдущим шагам с единственным изменением, чтобы указать SaveFormat.Json в последнем шаге.

Вот пример, демонстрирующий как получить OCR PDF и сохранить признанный текст в качестве файла JSON в C#:

Получите бесплатную лицензию на оценку

Вы можете Получить бесплатную временную лицензию Для оценки Aspose.OCR для .NET API без каких-либо ограничений.

Заключение

В этом уроке мы узнали, как выполнять ОКР на PDF-документах и извлечь текст из PDF в C ТКТ, Докс, и JSON Для получения дополнительной информации о Aspose.OCR для .NET API, ознакомьтесь с его Документация. Если у вас есть какие-либо вопросы, будьте свободны дойти до нас на нашем сайте Форум.

Смотреть также

Используя Aspose.OCR для .NET API, вы можете внедрить высокую точность PDF OCR в C# для различных приложений, в том числе C# ОCR Invoice обработка и обрабатывание форм. Это доступное решение о ОЦР PDF идеально подходит для разработчиков, которые стремятся эффективно интегрировать ОКР pdf возможности в свои приложения.

Кроме того, если вам нужно конвертировать PDF в текст в C#, это API обеспечивает простое решение. Для тех, кто заинтересован в C# OCR PDF к тексту возможностях, интеграция беспроницаема, позволяя эффективному текстовому извлечению из различных форматов документов. Вы также можете использовать функциональность Convert PDF to Text для легкого обращения с текстовым экстракцией из PDF, что делает ваш процесс разработки более гладким.

Если вы ищете Aspose OCR C# Example, это руководство служит всесторонним ресурсом. Кроме того, для интересных задач, таких как C# API использование, этот учебник охватывает все важные элементы, необходимые для эффективного начала.

Для тех, кто хочет оценить PDF SDK и программное обеспечение для обработки документов компании Aspose на OCR PDFSDK, этот учебник служит отличным пунктом начала для понимания его возможностей. Нужно ли вам C# ОCR DLL для интеграции или Ц # ОКР учебника для руководства, вы найдете все, что вам нужно, чтобы эффективно использовать API в ваших проектах.

Кроме того, если вы хотите использовать C# текстовое распознавание или использовать библиотеку OCR для различных приложений, вы можете исследовать функции, которые Aspose предлагает для поддержки этих функций. Ц# ОКР PDF SDK оценка является отличной возможностью экспериментировать с возможностями этой библиотеки, чтобы убедиться в том, что вы найдете правильные решения для ваших потребностей.

В конечном счете, если вам нужно экстрактировать текст из PDF в C#, или использовать OCR API С#, доступные C# OCR PDF функции упростят процесс разработки и улучшат функциональность вашего приложения.

More in this category