Automaattinen asiakirjojen käsittely voi merkittävästi parantaa tuottavuutta ja tarkkuutta eri teollisuuden aloilla, oikeudellisista ja rahoituspalveluista terveydenhuollon ja valmistus. Yksi voimakas työkalu tähän tehtävään on Aspose.OCR for .NET, joka mahdollistaa kehittäjien poistaa tekstiä skannattujen asiakastietojen ja kuvien kanssa erittäin tarkka. Tämä opetusohjelma osoittaa, miten asentaa ja käyttää Asposa.OCR for …

Täydellinen esimerkki

Alla on täydellinen esimerkki (hostettu kotona) osoittaen, miten käyttää Aspose.OCR for .NET suorittaa OCR useilla kuvilla direktiivissä ja tallentaa tuotetun tekstin vastaaviin tekstitiedostoihin.

Vaiheittainen opas

Vaihe 1: Aloita OCR-moottori

Luo ja asettaa OCR-moottori. Aseta haluttu kieli (Englanti tässä esimerkissä).

// Step 1: Initialize the OCR Engine
using Aspose.Ocr;

using (Ocr ocrEngine = new Ocr())
{
    // Set language and other configurations if needed
    ocrEngine.Language = Language.English;

    // (Continue with steps below inside this using block)
}

Vaihe 2: Kuvan lataaminen käsittelyyn

Määritä tulos- ja lähtötiedostoja, varmista, että tulostaulukko on olemassa, ja luetella kuvan tiedostot.

// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";

if (!Directory.Exists(outputDirectory))
{
    Directory.CreateDirectory(outputDirectory);
}

// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
    inputDirectory,
    "*.*",
    SearchOption.TopDirectoryOnly
);

Vaihe 3: suorittaa OCR kussakin kuvassa

Iterata tiedostoja ja tunnistaa tekstin käyttämällä RecognizeImage(string path).

// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
    try
    {
        // Recognize text from the image (exactly as in the gist)
        string recognizedText = ocrEngine.RecognizeImage(imageFile);

        // Proceed to Step 4: save text to disk...
    }
    catch (Exception ex)
    {
        Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
    }
}

Vaihe 4: Tallenna poistettu teksti tiedostoihin

Luo vastaava .txt tiedostoja kunkin käsittelemän kuvan.

// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
    outputDirectory,
    Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);

File.WriteAllText(outputFilePath, recognizedText);

Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");

Vinkkejä & Tweaks

  • Filter-muodot: Käytä mallia kuten "*.png" tai "*.jpg" Poistaa ei-kuva tiedostoja.
  • Pohjattu subfolders: muutos SearchOption.TopDirectoryOnly että SearchOption.AllDirectories.
  • Lennon tyhjä uloskuljetus: Jos string.IsNullOrWhiteSpace(recognizedText)Lataa ja jatka.
  • Parallel batches: Käytä Parallel.ForEach(imageFiles, file => { ... }) nopeampien juoksujen (minne I/O ja lisensointi).

Seuraamalla näitä vaiheita voit automaattisesti yhdistää OCR: n kanssa Aspose.OCR .NET ja viedä puhtaita tekstitiedostoja alhaiseen käsittelyyn.

More in this category