
Dokumenty PDF są niezbędne w wielu procesach biznesowych, często wymagające programowego dostępu do ich skanowanego treści. Ekstrakcja tekstu z skanych plików PDF może być trudna, podkreślając potrzebę skutecznych narzędzi. W tym tutorial, będziemy zbadać jak do dokumentów OCR PDF i ekstrakcji tekst z PDF w C# za pomocą wiarygodnego ASPOSE.OCR dla .NET API, wiodąca C# OCR PDF ekstrakcja biblioteka dostępna do bezpłatnej oceny.
Co się nauczysz
W tym artykule omówimy następujące tematy:
- Przegląd Aspose.OCR dla .NET API
- Krok do OCR PDF i ekstrakcja tekstu
- Jak wykonać OCR w PDF i zapisać tekst
- Konwersja OCR PDF do Word
- Konwersja OCR PDF do JSON
Przegląd Aspose.OCR dla .NET API
Będziemy wykorzystywać ASPOSE.OCR dla .NET API, solidny .NET PDF OCR API zaprojektowany do rozpoznawania tekstu z skanowanych obrazów, zdjęć smartfonów i zdjęć ekranu, zwracając wyniki w różnych formach dokumentów. ta API nie tylko konwertuje obrazy do tekstu, ale także tworzy wyszukiwalne PDF z skanowania i poprawia wszelkie błędy odtwarzania w rozpoznawanym tekście, co czyni go jednym z najszybszych C# PDF OCR rozwiązań dostępnych tylko $99.
Ogień zawiera AsposeOcr Klasy, które zapewniają wiele metod operacji OCR RecognizePdf(string, ustawienia identyfikacji dokumentów) Metoda jest niezbędna do ekstrakcji tekstu z określonego dokumentu PDF DocumentRecognitionSettings klas umożliwia dostosowanie procesu rozpoznawania, podczas gdy RecognitionResult Klasa wciela wyniki uznania.
Możesz Pobierz DLL API lub zainstalować przez NuGet:
PM> Install-Package Aspose.OCR
Krok do OCR PDF i ekstrakcja tekstu w C#
Aby wykonać OCR na dokumentach PDF i wyciągnąć uznany tekst, postępuj zgodnie z następującymi krokami:
- Stwórz przykład klasy AsposeOcr.
- Inicjalizuj obiekt klasy DocumentRecognitionSettings.
- Wyznacz język dla OCR.
- Uzyskaj RecognitionResult poprzez zastosowanie metody RekognizePdf(), przechodząc przez ścieżkę obrazu i DocumentRecognitionSettings i obiektów.
- Przejdź przez listę RecognitionResult, aby wyświetlić zidentyfikowany tekst.
Oto przykład przedstawiający jak do dokumentów OCR PDF i wydobyć uznany tekst w C#:
OCR PDF i ekstrakcja tekstu z PDF w C#
Jak wykonać OCR w PDF i zapisać tekst w C#
Aby wykonać OCR na dokumentach PDF i zapisać uznany tekst, postępuj zgodnie z następującymi krokami:
- Stwórz przykład klasy AsposeOcr.
- Inicjalizuj obiekt klasy DocumentRecognitionSettings.
- Wyznacz język dla OCR.
- Zadzwoń do metody RecognizePdf(), aby uzyskać RecognitionResult.
- Przechowywać tekst za pomocą metody SaveMultipageDocument(), która wymaga wyjściowej ścieżki pliku SaveFormat, a w tym RecognitionResult i obiektów.
Oto przykład, który pokazuje jak do dokumentów OCR PDF i przechowywać uznany tekst w C#:
Wykonaj OCR na pliku PDF i przechowuj tekst w C#
Konwertowanie OCR PDF do Word w C#
Aby przekonwertować skanowane dokumenty PDF do programu Word, postępuj zgodnie z powyższymi krokami, ale w ostatnim kroku określ SaveFormat.Docx.
Oto przykład przedstawiający jak do OCR PDF i przechowywać uznany tekst jako dokument Word w C#:
OCR PDF i Konwersja skanowanego PDF do Word w C#
Konwertowanie OCR PDF do JSON w C#
Aby zapisać rozpoznawany tekst z dokumentów PDF w pliku JSON, postępuj zgodnie z poprzednimi krokami z jedyną zmianą, aby określić SaveFormat.Json w ostatnim kroku.
Oto przykład, który pokazuje jak do OCR PDF i przechowywać uznany tekst jako plik JSON w C#:
Uzyskaj darmową licencję oceny
Możesz Zdobądź darmową licencję Aby ocenić Aspose.OCR dla .NET API bez żadnych ograniczeń.
konkluzja
W tym podręczniku dowiedzieliśmy się, jak wykonać OCR na dokumentach PDF i wyciągnąć tekst z PDF w C TXT, DOCX, i JSON Aby uzyskać więcej informacji na temat Aspose.OCR dla .NET API, sprawdź jego dokumentacja. Jeśli masz jakiekolwiek pytania, czuj się wolny, aby dotrzeć do nas na naszej stronie Forum.
Zobacz również
- Konwertuj zdjęcie ekranu do tekstu z OCR w C#
- OCR Image to Text i Spelling Correction w C#
- Konwertuj skanowany PDF do wyszukiwanego PDF z OCR w C#
Korzystając z Aspose.OCR dla .NET API, można wdrożyć wysoką precyzję PDF OCR w C# dla różnych aplikacji, w tym C# Opakowanie i przetwarzanie formularzy. To odpowiednie rozwiązanie .NET PDF O CR jest idealnym rozwiązaniem dla deweloperów, którzy chcą efektywnie włączyć OCR PDF funkcje do swoich zastosowań.
Dodatkowo, jeśli potrzebujesz konwertować PDF do tekstu w C#, ten API zapewnia proste rozwiązanie. Dla tych, którzy są zainteresowani C# OCR PDF na tekst możliwości, integracja jest bezprzewodna, umożliwiając efektywne ekstrakcje tekstu z różnych formatów dokumentów. Możesz również użyć funkcji Convert PDF to Text do łatwego obsługi ekstraktów tekstowych z PDF, dzięki czemu proces rozwoju jest gładki.
Jeśli szukasz przykładu Aspose OCR C# Example, ten przewodnik służy jako wszechstronny zasób. Ponadto, dla ciekawych zadań, takich jak C# API użytkowanie, tutorial ten obejmuje wszystkie niezbędne elementy potrzebne do skutecznego rozpoczęcia.
Dla tych, którzy chcą ocenić firmę PDF SDK i oprogramowania do przetwarzania dokumentów Aspose na OCR PDFSDK, ten tutorial służy jako doskonały punkt wyjścia, aby zrozumieć jego zdolności. Niezależnie od tego, czy potrzebujesz C# DLL do integracji lub C# O CR tutorial dla wskazówek, znajdziesz wszystko, co potrzebne do skutecznego wykorzystania API w swoich projektach.
Ponadto, jeśli chcesz skorzystać z rozpoznawania tekstu C# lub użyć biblioteki OCR dla różnych zastosowań, możesz zbadać funkcje oferowane przez Aspose w celu wsparcia tych funkcji. ocena SDK PDF jest doskonałą okazją do eksperymentu z możliwościami tej Biblioteki, aby upewnić się, że znajdziesz odpowiednie rozwiązania dla Twoich potrzeb OCC.
Wreszcie, jeśli potrzebujesz ekstrakcji tekstu z pliku PDF w C#, lub korzystać z OCR API C # , dostępne funkcje C# OCR PDF ułatwią proces rozwojowy i poprawiają funkcjonalność aplikacji. Możesz również użyć Biblioteki C_OCR do różnych zadań OKR, w tym Poznać tekst z obrazu i Wzorek OKRA wdrażania w celu dalszego poprawy swoich projektów.