
PDF-документи є необхідними в багатьох бізнес-процесах, часто вимагаючи програмного доступу до їх сканованого контенту. Екстракція тексту з скенерних файлів PDF може бути складною, підкреслюючи необхідність ефективних інструментів. У цьому уроці ми будемо досліджувати як до OCR PDF документи і екстрактувати текст з PDF в C# за допомогою надійного Завантажити ASPOSE.OCR для .NET API, провідна C# OCR PDF екстракційна бібліотека доступна для безкоштовної оцінки.
Що ви дізнаєтеся
У цій статті ми розглянемо наступні теми:
- Огляд Aspose.OCR для .NET API
- Крок до OCR PDF і екстракт тексту
- Як виконати OCR на PDF і зберегти текст
- Конвертувати OCR PDF в Word
- Конвертувати OCR PDF в JSON
Огляд Aspose.OCR для .NET API
Ми будемо використовувати Завантажити ASPOSE.OCR для .NET API, .
Пожежа включає в себе AsposeOcr класу, яка забезпечує кілька методів для операцій OCR RecognizePdf(string, DocumentRecognitionSettings) Метод необхідний для вилучення тексту з конкретного PDF-документу DocumentRecognitionSettings класу дозволяється адаптація процесу визнання, в той час як RecognitionResult Класи в капсулізують результати визнання.
Ви можете Завантажити DLL API або встановити через NuGet:
PM> Install-Package Aspose.OCR
Крок до OCR PDF і Екстракт тексту в C#
Щоб виконати OCR на PDF-документах і витягнути визнаний текст, слід дотримуватися наступних кроків:
- Створіть приклад класу AsposeOcr.
- Ініціалізуйте об’єкт класу DocumentRecognitionSettings.
- Визначте мову для OCR.
- Отримати RecognitionResult за допомогою методу RegognizePdf(), проходячи шлях зображення та DocumentRecognitionSettings Об’єкт.
- Перейдіть через список RecognitionResult, щоб показати ідентифікований текст.
Ось приклад ілюстрації як до ОКР PDF-документи і екстракт визнаного тексту в C#:
ОКР PDF і екстракт тексту з PDF в C#
Як виконати OCR на PDF і зберегти текст в C#
Щоб виконати OCR на PDF-документах і зберегти визнаний текст, слід дотримуватися наступних кроків:
- Створіть приклад класу AsposeOcr.
- Ініціалізуйте об’єкт класу DocumentRecognitionSettings.
- Визначте мову для OCR.
- Зателефонуйте до RecognizePdf() для отримання RecognitionResult.
- Зберегти текст за допомогою SaveMultipageDocument() методу, який вимагає вихідного файлового шляху SaveFormat, І те, що RecognitionResult Об’єкт.
Ось приклад, який показує як довести OCR PDF-документи і зберегти визнаний текст в C#:
Виконання OCR на PDF і збереження тексту в C#
Конвертувати OCR PDF в Word в C#
Щоб конвертувати скановані PDF-документи в Word, виконайте ті ж самі кроки, що і раніше, але в кінцевому кроці вкажіть SaveFormat.Docx.
Ось приклад ілюстрації як отримати OCR PDF і зберегти визнаний текст як документ Word в C#:
OCR PDF і конвертувати сканований PDF в Word в C#
Конвертувати OCR PDF в JSON в C#
Щоб зберегти визнаний текст з PDF-документів у файлі JSON, слідкуйте за попередніми кроками з єдиною зміною, щоб вказати SaveFormat.Json в кінцевому кроці.
Ось приклад, який показує як отримати OCR PDF і зберегти визнаний текст як JSON-файл в C#:
Отримайте безкоштовну ліцензію
Ви можете Отримайте безкоштовну тимчасову ліцензію для оцінки Aspose.OCR для .NET API без будь-яких обмежень.
Заключення
У цьому уроці ми дізналися, як виконувати OCR на PDF-документах і витягувати текст з PDF в C ТКТ, Докс, і JSON Для отримання додаткової інформації про Aspose.OCR для .NET API, перевірте його Документація. Якщо у вас є якісь запитання, будьте вільними, щоб дістатися до нас на нашому сайті Форум.
Дивіться також
- Конвертувати зображення екрану в текст з OCR в C#
- OCR Image to Text and Spelling Correction в C#
- Конвертувати сканований PDF в пошуковий PDF з OCR в C#
Використовуючи Aspose.OCR для .NET API, ви можете реалізувати високу точність PDF OCR в C# для різних додатків, в тому числі C# ОCR Invoice обробки та обміну формами.Це доступне рішення .NET PDF O CR ідеально підходить для розробників, які прагнуть ефективно інтегрувати OCR PDF можливості в свої додатки.
Крім того, якщо вам потрібно конвертувати PDF в текст в C#, цей API забезпечує простий варіант. Для тих, хто цікавиться C# OCR PDF у текст можливостями, інтеграція безперервна, що дозволяє ефективне видобуток тексту з різних форматів документа. Ви також можете використовувати функцію Convert PDF to Text для легкого обробки текстового вилучення з PDF, роблячи ваш процес розробки більш гладким.
Якщо ви шукаєте Aspose OCR C# Example, цей посібник служить всеосяжним ресурсом. Крім того, для цікавих завдань, таких як C# API використання, це навчальний заклад охоплює всі важливі елементи, необхідні для ефективного початку.
Для тих, хто прагне оцінити PDF SDK і програмне забезпечення для обробки документів компанія Aspose на OCR PDFSDK, цей навчальний заклад служить відмінною початковою точкою для розуміння його можливостей. Незалежно від того, чи потрібен вам C# ОCR DLL для інтеграції або C# OCC урочистості для керівництва, ви знайдете все, що вам потрібно, щоб ефективно використовувати API у ваших проектах.
Крім того, якщо ви хочете скористатися C# текстовим розпізнаванням або використовувати бібліотеку ** C# OCR** для різних додатків, ви можете вивчити функції, які Aspose пропонує для підтримки цих функцій. Ц# ОКР PDF SDK оцінка є чудовою можливістю експериментувати з можливостями цієї бібліотеки, щоб забезпечити, що ви знайдете правильні рішення для ваших потреб.
Нарешті, якщо вам потрібно витягти текст з PDF в C#, або скористатися OCR API C # , доступні функції C# OCR PDF ускладнить ваш процес розробки і поліпшити функціональність вашої програми. Ви також можете використовувати C # O CR Бібліотека для різних завдань ОКР, в тому числі Свідомість тексту з зображення і Ц # ОCR Шаблон реалізації для подальшого покращення ваших проектів.