Accurate Optical Character Recognition (OCR) starter med perfekt tilpassede bilder. Skewed eller roterte skanninger kan redusere OCR nøyaktigheten betydelig, noe som gjør manuell stråling en sliten og tidskonserende oppgave - spesielt når du håndterer store pakker av dokumenter. For å raskere denne prosessen, kan vi utnytte kraften av Aspose.Imaging for .NET å automatisk dekke skannet bilder før de føres inn i en oCR-motor.

Real-verdens problem

OCR-motorer krever godt tilpassede bilder for å oppnå høy nøyaktighet i tekst gjenkjenning. Crooked skanninger fører ofte til savnede tegn eller feil under OCC-prosessen. Manuell stråling av hvert bilde er umulig og ineffektiv, spesielt for store volum av dokumenter.

Oversikt over løsning

Ved hjelp av Aspose.Imaging for .NET kan vi automatisere avkjøpsprocessen for skannede bilder. Dette sikrer at alle inngangsbilder er perfekt tilpasset før de blir behandlet av et eksternt OCR-verktøy som Tesseract eller Asposa.OCR. Utgangsbilder vil bli lagret i et tapfritt format som PNG eller TIFF for å bevare kvaliteten.

Prerequisites

For å begynne, trenger du:

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.Imaging for .NET fra NuGet
  • En skannet dokument eller bildefil (JPEG, PNG, TIFF, etc.)

Du kan installere Aspose.Imaging-pakken via NuGet Package Manager Console:

PM> Install-Package Aspose.Imaging

Kodeeksempel: Automatisering av skannede bilder for

Nedenfor er et omfattende eksempel på C#-koden som viser hvordan du kan skanne skannede bilder ved hjelp av Aspose.Imaging for .NET.

More in this category