Precīza optisko rakstura atpazīšana (OCR) sākas ar pilnīgi saskaņotiem attēliem. izkropļoti vai rotēti skenējumi var ievērojami samazināt OCR precizitāti, padarot manuālo apgriezumu aizraujošu un ilgstošu uzdevumu - it īpaši, kad mēs nodarbojamies ar lieliem dokumentu komplektiem. Lai vienkāršotu šo procesu, mēs varam izmantot Aspose.Imaging .NET spēku, lai automātiski atšķaidītu skenētos attēlus, pirms tos barojot ar OCR motoru.

Reālā pasaules problēma

OCR dzinēji prasa labi saskaņotus attēlus, lai sasniegtu augstu precizitāti teksta atpazīšanā. Crooked skenēšana bieži noved pie pazudušiem rakstzīmēm vai kļūdām, kad OCC process. Manuāli izstiept katru attēlu ir nepraktiski un neefektīvi, it īpaši lieliem dokumentu apjomiem.

Risinājumu pārskats

Izmantojot Aspose.Imaging .NET, mēs varam automatizēt skenēto attēlu izslēgšanas procesu. tas nodrošina, ka visas ieejas attēli ir pilnīgi saskaņoti, pirms tos apstrādā ar ārēju OCR rīku, piemēram, Tesseract vai Asposa.OCR. Izveidotā attēla tiks glabāta bez zaudējumiem formātā kā PNG vai TIFF, lai saglabātu kvalitāti.

Prerequisites

Lai sāktu, jums ir nepieciešams:

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.Imaging par .NET no NuGet
  • Skanēts dokuments vai attēla fails (JPEG, PNG, TIFF utt.)

Jūs varat instalēt Aspose.Imaging paketi, izmantojot NuGet Package Manager Console:

PM> Install-Package Aspose.Imaging

Koda piemērs: automātiskā skenēto attēlu izslēgšana

Zemāk ir visaptverošs C# koda piemērs, kas parāda, kā izslēgt skenētos attēlus, izmantojot Aspose.Imaging .NET.

More in this category