Dokładna rozpoznawanie charakteru optycznego (OCR) zaczyna się od doskonale zharmonizowanych obrazów. skierowane lub obrotowe skanowanie może znacząco zmniejszyć dokładność OCR, co sprawia, że ręczne strzyżenie jest nieśmiałą i czasochłonne zadań - zwłaszcza w przypadku zajmowania się dużym zestawem dokumentów . Aby upraszczać ten proces, możemy wykorzystać moc Aspose.Imaging dla .NET do automatycznego rozkładu skanej obrazu przed dostarczaniem ich do silnika oCR.
Problem świata rzeczywistego
Silniki OCR wymagają dobrze zharmonizowanych obrazów, aby osiągnąć wysoką dokładność w rozpoznawaniu tekstu. skanowanie z krookiem często prowadzi do pominiętych znaków lub błędów podczas procesu oCR. Ręczne strzyżenie każdego obrazu jest niepraktyczne i nieskuteczne, zwłaszcza dla dużych ilości dokumentów.
Przegląd rozwiązania
Używając Aspose.Imaging dla .NET, możemy zautomatyzować proces odbioru skanowanych obrazów. To gwarantuje, że wszystkie obrazy wejściowe są doskonale zharmonizowane przed przetwarzaniem przez zewnętrzny narzędzie OCR, takie jak Tesseract lub Asposa.OCR. Zdjęcia wyjścia będą przechowywane w bez stratowym formacie, takim jak PNG lub TIFF, aby zachować jakość.
Warunki
Aby zacząć, musisz:
- Visual Studio 2019 lub później
- .NET 6.0 lub nowszy (lub .NET Framework 4.6.2+)
- Aspose.Imaging dla .NET z NuGet
- skanowany dokument lub plik obrazu (JPEG, PNG, TIFF itp.)
Pakiet Aspose.Imaging można zainstalować za pośrednictwem konsoli NuGet Package Manager:
Przykład kodu: Automatyzacja odblokowania skanowanych obrazów dla
Poniżej znajduje się kompleksowy przykład kodu C#, który pokazuje, jak wyłączyć skanowane obrazy za pomocą Aspose.Imaging dla .NET.
Zaawansowane opcje deskewingu
Wykrywanie kąta nachylenia
Aspose.Imaging udostępnia filtr DeskewFilter, który automatycznie analizuje obraz, wyznacza kąt nachylenia i koryguje go w jednym kroku. Dzięki temu nie musisz ręcznie definiować wartości kąta. Przykład użycia:
Automatyczne przycinanie i korekta kontrastu
Po deskewingu często przydatne jest przycięcie pustych marginesów oraz zwiększenie kontrastu, aby zapewnić jeszcze lepsze wyniki OCR. Można to osiągnąć łącząc kilka filtrów:
Najczęstsze pytania i rozwiązania
Czy mogę przetworzyć obrazy w partiach?
Tak. Aspose.Imaging jest zoptymalizowany pod kątem przetwarzania wsadowego. Wystarczy przejść po katalogu i zastosować filtr do każdego pliku. Przykład:
Jak obsługiwać obrazy wielostronicowe (TIFF)?
Wielostronicowy plik TIFF jest otwierany jako Image z wieloma ramkami. Można iterować po image.Frames i zastosować filtr do każdej ramki osobno, a następnie zapisać wynik jako nowy wielostronicowy TIFF.
Czy Aspose.Imaging obsługuje przyspieszenie GPU?
Obecna wersja biblioteki nie wykorzystuje GPU do przetwarzania obrazów, ale wszystkie operacje są wysoce zoptymalizowane pod kątem CPU i działają efektywnie nawet przy dużych wolumenach danych. Jeśli wymagana jest akceleracja GPU, można rozważyć integrację z zewnętrznymi rozwiązaniami po przetworzeniu obrazu przez Aspose.Imaging.
Dzięki tym zaawansowanym technikom możesz zautomatyzować nie tylko podstawowy deskew, ale także pełen łańcuch przygotowawczy obrazu, co znacząco podnosi skuteczność i szybkość rozpoznawania OCR w praktycznych scenariuszach biznesowych.