Automaattinen asiakirjojen käsittely voi merkittävästi parantaa tuottavuutta ja tarkkuutta eri teollisuuden aloilla, oikeudellisista ja rahoituspalveluista terveydenhuollon ja valmistus. Yksi voimakas työkalu tähän tehtävään on Aspose.OCR for .NET, joka mahdollistaa kehittäjien poistaa tekstiä skannattujen asiakastietojen ja kuvien kanssa erittäin tarkka. Tämä opetusohjelma osoittaa, miten asentaa ja käyttää Asposa.OCR for …
Täydellinen esimerkki
Alla on täydellinen esimerkki (hostettu kotona) osoittaen, miten käyttää Aspose.OCR for .NET suorittaa OCR useilla kuvilla direktiivissä ja tallentaa tuotetun tekstin vastaaviin tekstitiedostoihin.
Vaiheittainen opas
Vaihe 1: Aloita OCR-moottori
Luo ja asettaa OCR-moottori. Aseta haluttu kieli (Englanti tässä esimerkissä).
// Step 1: Initialize the OCR Engine
using Aspose.Ocr;
using (Ocr ocrEngine = new Ocr())
{
// Set language and other configurations if needed
ocrEngine.Language = Language.English;
// (Continue with steps below inside this using block)
}
Vaihe 2: Kuvan lataaminen käsittelyyn
Määritä tulos- ja lähtötiedostoja, varmista, että tulostaulukko on olemassa, ja luetella kuvan tiedostot.
// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";
if (!Directory.Exists(outputDirectory))
{
Directory.CreateDirectory(outputDirectory);
}
// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
inputDirectory,
"*.*",
SearchOption.TopDirectoryOnly
);
Vaihe 3: suorittaa OCR kussakin kuvassa
Iterata tiedostoja ja tunnistaa tekstin käyttämällä RecognizeImage(string path)
.
// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
try
{
// Recognize text from the image (exactly as in the gist)
string recognizedText = ocrEngine.RecognizeImage(imageFile);
// Proceed to Step 4: save text to disk...
}
catch (Exception ex)
{
Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
}
}
Vaihe 4: Tallenna poistettu teksti tiedostoihin
Luo vastaava .txt
tiedostoja kunkin käsittelemän kuvan.
// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
outputDirectory,
Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);
File.WriteAllText(outputFilePath, recognizedText);
Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");
Vinkkejä & Tweaks
- Filter-muodot: Käytä mallia kuten
"*.png"
tai"*.jpg"
Poistaa ei-kuva tiedostoja. - Pohjattu subfolders: muutos
SearchOption.TopDirectoryOnly
ettäSearchOption.AllDirectories
. - Lennon tyhjä uloskuljetus: Jos
string.IsNullOrWhiteSpace(recognizedText)
Lataa ja jatka. - Parallel batches: Käytä
Parallel.ForEach(imageFiles, file => { ... })
nopeampien juoksujen (minne I/O ja lisensointi).
Seuraamalla näitä vaiheita voit automaattisesti yhdistää OCR: n kanssa Aspose.OCR .NET ja viedä puhtaita tekstitiedostoja alhaiseen käsittelyyn.