اتوماسیون پردازش اسناد می تواند به طور قابل توجهی بهره وری و دقت را در صنایع مختلف، از خدمات قانونی و مالی به مراقبت های بهداشتی و تولید افزایش دهد. یکی از ابزارهای قدرتمند برای این کار Aspose.OCR برای .NET است که به توسعه دهندگان اجازه می دهد تا با دقت بالا متن را از اسناید و تصاویر اسکن شده استخراج کنند. این آموزش ها نشان می دهند که چگونه برای تنظیم و استفاده از ASPOSE.OCR برای …
نمونه کامل
در زیر یک مثال کامل (به عنوان میزبان) نشان می دهد که چگونه از Aspose.OCR برای .NET برای انجام OCR در چندین تصویر در یک دایرکتوری استفاده کنید و متن استخراج شده را به فایل های متن مربوطه ذخیره کنید.
راهنمای گام به گام
مرحله اول: موتور OCR را شروع کنید
ایجاد و تنظیم موتور OCR. تنظیم زبان مورد نظر (انگلیسی در این مثال).
// Step 1: Initialize the OCR Engine
using Aspose.Ocr;
using (Ocr ocrEngine = new Ocr())
{
// Set language and other configurations if needed
ocrEngine.Language = Language.English;
// (Continue with steps below inside this using block)
}
مرحله دوم: تصاویر را برای پردازش بارگذاری کنید
دایرکتوری های ورودی/خروج را تعریف کنید، مطمئن شوید که پوشه خروجی وجود دارد و فایل های تصویر را فهرست کنید.
// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";
if (!Directory.Exists(outputDirectory))
{
Directory.CreateDirectory(outputDirectory);
}
// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
inputDirectory,
"*.*",
SearchOption.TopDirectoryOnly
);
مرحله 3: انجام OCR بر روی هر تصویر
از فایل ها عبور کنید و متن را با استفاده از RecognizeImage(string path)
.
// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
try
{
// Recognize text from the image (exactly as in the gist)
string recognizedText = ocrEngine.RecognizeImage(imageFile);
// Proceed to Step 4: save text to disk...
}
catch (Exception ex)
{
Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
}
}
مرحله 4: ذخیره متن استخراج شده به فایل ها
ایجاد یک پاسخگویی .txt
فایل برای هر تصویر پردازش شده
// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
outputDirectory,
Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);
File.WriteAllText(outputFilePath, recognizedText);
Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");
بایگانی برچسب ها & Tweaks
- فرمت های فیلتر: از الگوهای مانند
"*.png"
یا"*.jpg"
برای حذف فایل های غیر تصویری - تغییر زیرنویس ها: تغییر
SearchOption.TopDirectoryOnly
برایSearchOption.AllDirectories
. - خروجی های خالی کشتی *: اگر
string.IsNullOrWhiteSpace(recognizedText)
وارد شوید و ادامه دهید.
- خروجی های خالی کشتی *: اگر
- تغییرمسیرهای موازی: استفاده
Parallel.ForEach(imageFiles, file => { ... })
برای رانندگی سریع تر (فکر I / O و مجوز).
با پیروی از این مراحل شما می توانید اتوماتیک بسته بندی OCR با Aspose.OCR برای .NET و صادرات فایل های متن تمیز برای پردازش پایین.