Optimointi kuvan ennalta käsittelyn on kriittinen askel parantamalla tarkkuutta optisen luonteen tunnistaminen (OCR) järjestelmät. Tässä opetusohjelmassa, tutkitaan, miten parantaa OCR suorituskykyä käyttämällä Aspose.ocR .NET soveltamalla erilaisia kuvata edeltävä tekniikoita. Nämä teknikot sisältävät melun vähentäminen, kontrastin sopeutuminen, kirkkauden normalisointi, kiihottaminen, piilotuksen havaitseminen ja korjaus, näkökulman korjaaminen ja binaryys. Tämän oppaan lopussa, sinulla on kattava ymmärrys siitä, kuinka käsitellä kuvia tehokkaasti varmistaa optimaalinen oCR tulokset.

Täydellinen esimerkki

Vaihe 1: Lataa kuva

Ensimmäinen askel OCR: n kuvan ennalta käsittelemisessä on ladata se sovelluksellasi. Käytä Aspose.OCR:ää kuvatiedoston lukemiseen ja käsittelyyn.

Vaihe 2: Noudata melun vähentämistä

Ääni voi merkittävästi vaikuttaa OCR: n tarkkuuteen. soveltaa melun vähentämisen tekniikoita, kuten median suodatin tai Gaussian blur puhdistaa kuvan ennen jatkokäsittelyä.

// Step 1: Load the Image
using (var ocrEngine = new AsposeOcr())
{
    var image = new Bitmap("path/to/image.png");
}

Vaihe 3: Muokkaa kontrastia ja kirkkautta

Kontrastin ja kirkkauden sopeutuminen auttaa tekemään tekstistä erottavamman tausta. Käytä Aspose.OCR: n menetelmiä kuvan näiden ominaisuuksien parantamiseksi.

// Step 2: Apply Noise Reduction using Median Filtering
ocrEngine.PreprocessingFilter.AddMedianFilter();

Vaihe 4: Käytä kuvaa

Sharpening voi tehdä merkkien reunat selkeämmiksi, mikä on hyödyllistä OCR-moottoreille. Soveltaa tiivistävä suodatin kuviin käyttämällä Aspose.OCR:tä.

// Step 3: Adjust Contrast and Brightness
var imageProcessing = new ImageProcessing(ocrEngine);
imageProcessing.SetContrast(20); // Adjust contrast level
imageProcessing.SetBrightness(10); // Adjust brightness level

Vaihe 5: Löydä ja korjata Skew

OCR-järjestelmien väärä tulkinta voi johtaa tekstin poistoon. soveltaa poiston havaitsemista ja korjaamista algoritmeja varmistaakseen, että teksti on sopivasti yhdenmukaistettu.

// Step 4: Sharpen the Image
using (var image = Aspose.Ocr.ImageProcessing.Image.Load("input.jpg"))
{
    var sharpenFilter = new SharpenFilter();
    sharpenFilter.Apply(image);
    image.Save("sharpened.jpg");
}

Vaihe 6: Perspektiivinen korjaus

Perspektiivinen vääristyminen voi tehdä tekstin näyttävän kääntyneen tai hajallaan, mikä vaikuttaa OCR: n tarkkuuteen.

// Step 5: Detect and Correct Skew
var preprocessingFilter = new PreprocessingFilter(PreprocessingFilterType.SkewCorrection);
ocrEngine.PreprocessingFilters.Add(preprocessingFilter);

Vaihe 7: Binarisoi kuvan

Binarisaatio muuntaa kuvan mustaksi ja valkoiseksi muodoksi, joka on ihanteellinen OCR-käsittelyyn.

Parhaat käytännöt

Loppujen lopuksi tehokas kuvan käsittely on ratkaisevan tärkeää korkean tarkkuuden saavuttamiseksi OCR-tehtävissä. Noudattamalla edellä kuvattuja vaiheita voit merkittävästi parantaa sisällön kuvien laatua ja lisätä OCC-järjestelmän suorituskykyä. Muista kokeilla eri ennalta käsittelyn tekniikoita löytääksesi paras yhdistelmä tiettyyn käyttötapaan.

Joitakin muita vinkkejä:

  • Aina testata ennakkoprosessointiputki erilaisilla kuvan tyypeillä luotettavuuden varmistamiseksi.
  • Pidä silmällä liiallista käsittelyä, koska ylikuormitus tai kontrastin säätely voi tuoda esineitä, jotka voivat sekoittaa OCR-moottoria.
  • Päivitä Aspose.OCR -kirjastosi säännöllisesti hyödyntääkseen uusimpia parannuksia ja optimointeja.

Noudattamalla näitä parhaita käytäntöjä, olet hyvin varustettu käsittelemään monenlaisia OCR-haasteita ja toimittaa tarkkoja tuloksia sovelluksissasi.

More in this category