Accurate Optical Character Recognition (OCR) starter med perfekt alignede billeder. Skewed eller roterede scans kan signifikant reducere OCR nøjagtighed, hvilket gør manuel strækning en kedelig og tidskrævende opgave - især når man håndterer store pakker af dokumenter. For at forenkle denne proces, kan vi udnytte kraften af Aspose.Imaging for .NET til automatisk at deskew scanned billeder, før de fodres i en OCC motor.

Det virkelige problem

OCR-motorer kræver velalignede billeder for at opnå høj nøjagtighed i tekstgenkendelse. Crooked scans fører ofte til savnede tegn eller fejl under OCC-processen. Manuelt strækning af hvert billede er impractical og inefficient, især for store mængder dokumenter.

Oversigt over løsning

Ved hjælp af Aspose.Imaging for .NET kan vi automatisere opløsningsprocessen for scannede billeder. Dette sikrer, at alle inputbilleder er perfekt tilpasset, før de behandles af et eksternt OCR-værktøj som Tesseract eller Aspos.OCR. Udgående billeder vil blive gemt i et tabløst format som PNG eller TIFF for at bevare kvaliteten.

Forudsætninger

For at komme i gang, skal du:

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .NET Framework 4.6.2+)
  • Aspose.Imaging for .NET fra NuGet
  • En scannet dokument eller billedfil (JPEG, PNG, TIFF osv.)

Du kan installere Aspose.Imaging-pakken via NuGet Package Manager Console:

PM> Install-Package Aspose.Imaging

Kodeeksempel: Automatisk afvisning af scannede billeder for

Nedenfor er et omfattende eksempel på C#-kode, der viser, hvordan man afskæver scannede billeder ved hjælp af Aspose.Imaging for .NET.

More in this category