Otomatik belge işleme çeşitli endüstrilerde verimliliği ve doğruluğunu önemli ölçüde artırabilir, yasal ve finansal hizmetlerden sağlık ve üretimine kadar. bu görevin güçlü bir aracı Aspose.OCR .NET için, geliştiricilerin taramalı belgelerden ve görüntülerden yüksek hassasiyetle metin çıkarmalarını sağlar. Bu öğretici, doküman işlemlerini otomatikleştirmek ve üçüncü taraf sistemleri ile entegrasyon da dahil olmak üzere, Belge İşleme görevlerini nasıl ayarlayacağınızı ve kullanabileceğinizi gösterir.
Tam örnek
Aşağıda, bir dizinde birden fazla görüntüde OCR’yi gerçekleştirmek için .NET için Aspose.OCR’u nasıl kullanacağınızı gösteren tam bir örnek (host olarak) ve alınan metni ilgili metin dosyalarına kaydetmek.
adım adım rehber
Adım 1: OCR motoru başlatın
OCR motoru oluşturun ve ayarlayın. istediğiniz dili ayarlar (bu örnekte İngilizce).
// Step 1: Initialize the OCR Engine
using Aspose.Ocr;
using (Ocr ocrEngine = new Ocr())
{
// Set language and other configurations if needed
ocrEngine.Language = Language.English;
// (Continue with steps below inside this using block)
}
Adım 2: İşleme için resim yükleme
Giriş/çıkış dizinleri ayarlayın, çıkış klasörünün var olduğundan emin olun ve görüntü dosyalarını listeleyin.
// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";
if (!Directory.Exists(outputDirectory))
{
Directory.CreateDirectory(outputDirectory);
}
// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
inputDirectory,
"*.*",
SearchOption.TopDirectoryOnly
);
Adım 3: Her resimde OCR’yi gerçekleştirin
Dosyaları inceleyin ve metni kullanarak tanımlayın RecognizeImage(string path)
.
// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
try
{
// Recognize text from the image (exactly as in the gist)
string recognizedText = ocrEngine.RecognizeImage(imageFile);
// Proceed to Step 4: save text to disk...
}
catch (Exception ex)
{
Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
}
}
Adım 4: Çekilen metni dosyaya kaydedin
Bir Karşılaştırma oluşturun .txt
Her işlenmiş görüntü için dosya.
// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
outputDirectory,
Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);
File.WriteAllText(outputFilePath, recognizedText);
Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");
İpuçları & Tweaks
- Filter biçimleri: Örneğin örnekleri kullanın
"*.png"
veya"*.jpg"
Görüntüleme olmayan dosyaları kaydırmak. - Rekurse subfolders: Değişim
SearchOption.TopDirectoryOnly
içinSearchOption.AllDirectories
. - Gemi boş çıkışlar: Eğer
string.IsNullOrWhiteSpace(recognizedText)
Log ve devam edin. - ** Paralel çubuklar**: Kullanım
Parallel.ForEach(imageFiles, file => { ... })
Daha hızlı koşu için (mind I / O ve lisans).
Bu adımları takip ederek .NET için Aspose.OCR ile OCR paketini otomatikleştirebilir ve aşağı akışlı işleme temiz metin dosyalarını ihraç edebilirsiniz.