اتوماسیون پردازش اسناد می تواند به طور قابل توجهی بهره وری و دقت را در صنایع مختلف، از خدمات قانونی و مالی به مراقبت های بهداشتی و تولید افزایش دهد. یکی از ابزارهای قدرتمند برای این کار Aspose.OCR برای .NET است که به توسعه دهندگان اجازه می دهد تا با دقت بالا متن را از اسناید و تصاویر اسکن شده استخراج کنند. این آموزش ها نشان می دهند که چگونه برای تنظیم و استفاده از ASPOSE.OCR برای …

نمونه کامل

در زیر یک مثال کامل (به عنوان میزبان) نشان می دهد که چگونه از Aspose.OCR برای .NET برای انجام OCR در چندین تصویر در یک دایرکتوری استفاده کنید و متن استخراج شده را به فایل های متن مربوطه ذخیره کنید.

راهنمای گام به گام

مرحله اول: موتور OCR را شروع کنید

ایجاد و تنظیم موتور OCR. تنظیم زبان مورد نظر (انگلیسی در این مثال).

// Step 1: Initialize the OCR Engine
using Aspose.Ocr;

using (Ocr ocrEngine = new Ocr())
{
    // Set language and other configurations if needed
    ocrEngine.Language = Language.English;

    // (Continue with steps below inside this using block)
}

مرحله دوم: تصاویر را برای پردازش بارگذاری کنید

دایرکتوری های ورودی/خروج را تعریف کنید، مطمئن شوید که پوشه خروجی وجود دارد و فایل های تصویر را فهرست کنید.

// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";

if (!Directory.Exists(outputDirectory))
{
    Directory.CreateDirectory(outputDirectory);
}

// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
    inputDirectory,
    "*.*",
    SearchOption.TopDirectoryOnly
);

مرحله 3: انجام OCR بر روی هر تصویر

از فایل ها عبور کنید و متن را با استفاده از RecognizeImage(string path).

// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
    try
    {
        // Recognize text from the image (exactly as in the gist)
        string recognizedText = ocrEngine.RecognizeImage(imageFile);

        // Proceed to Step 4: save text to disk...
    }
    catch (Exception ex)
    {
        Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
    }
}

مرحله 4: ذخیره متن استخراج شده به فایل ها

ایجاد یک پاسخگویی .txt فایل برای هر تصویر پردازش شده

// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
    outputDirectory,
    Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);

File.WriteAllText(outputFilePath, recognizedText);

Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");

بایگانی برچسب ها & Tweaks

  • فرمت های فیلتر: از الگوهای مانند "*.png" یا "*.jpg" برای حذف فایل های غیر تصویری
  • تغییر زیرنویس ها: تغییر SearchOption.TopDirectoryOnly برای SearchOption.AllDirectories.
    • خروجی های خالی کشتی *: اگر string.IsNullOrWhiteSpace(recognizedText)وارد شوید و ادامه دهید.
  • تغییرمسیرهای موازی: استفاده Parallel.ForEach(imageFiles, file => { ... }) برای رانندگی سریع تر (فکر I / O و مجوز).

با پیروی از این مراحل شما می توانید اتوماتیک بسته بندی OCR با Aspose.OCR برای .NET و صادرات فایل های متن تمیز برای پردازش پایین.

More in this category