يمكن أن يعزز تلقائي معالجة المستندات بشكل كبير الإنتاجية والدقة في مختلف الصناعات ، من الخدمات القانونية والمالية إلى الرعاية الصحية والتصنيع.أداة قوية لهذا المهمة هي Aspose.OCR ل .NET ، والتي تسمح للمطورين باستخراج النص من الوثائق التي تم فحصها والصور بدقة عالية.هذا الدليل يظهر كيفية إعداد واستخدام ASPOSE.OCR ل.NET لتحقيق أوتوماتيكية المهام المعالجية للوثائق ، بما في ذلك عمليات مجموعة OCR والاندماج مع أنظمة الطرف الثالث.

نموذج كامل

وفيما يلي مثال كاملا (مستضيفًا كقلم) يظهر كيفية استخدام Aspose.OCR لـ .NET لتنفيذ OCR على العديد من الصور في دليل وتخزين النص المستخرج إلى ملفات النص المقابلة.

دليل خطوة بخطوة

الخطوة 1: إطلاق محرك OCR

إنشاء وتكوين محرك OCR. إعداد اللغة المطلوبة (الإنجليزية في هذا المثال).

// Step 1: Initialize the OCR Engine
using Aspose.Ocr;

using (Ocr ocrEngine = new Ocr())
{
    // Set language and other configurations if needed
    ocrEngine.Language = Language.English;

    // (Continue with steps below inside this using block)
}

الخطوة 2: تحميل الصور لمعالجة

حدد الدليلات الإدخال/الخروج، وتأكد من وجود مجلد الإنتاج، وقم بتصنيف ملفات الصورة.

// Step 2: Load Images for Processing
string inputDirectory = @"path\to\input\images";
string outputDirectory = @"path\to\output\text";

if (!Directory.Exists(outputDirectory))
{
    Directory.CreateDirectory(outputDirectory);
}

// Get all files from the input directory (same pattern as the gist)
// TIP: to restrict to specific formats, replace "*.*" with "*.png" or "*.jpg"
string[] imageFiles = Directory.GetFiles(
    inputDirectory,
    "*.*",
    SearchOption.TopDirectoryOnly
);

الخطوة 3: أداء OCR على كل صورة

تصفح الملفات وتحديد النص باستخدام RecognizeImage(string path).

// Step 3: Perform OCR on Each Image
foreach (string imageFile in imageFiles)
{
    try
    {
        // Recognize text from the image (exactly as in the gist)
        string recognizedText = ocrEngine.RecognizeImage(imageFile);

        // Proceed to Step 4: save text to disk...
    }
    catch (Exception ex)
    {
        Console.WriteLine($"Error processing {imageFile}: {ex.Message}");
    }
}

الخطوة 4: حفظ النص المستخرج إلى الملفات

إرسال رسالة مرجعية .txt ملف لكل صورة معالجة.

// Step 4: Save Extracted Text to Files
string outputFilePath = Path.Combine(
    outputDirectory,
    Path.GetFileNameWithoutExtension(imageFile) + ".txt"
);

File.WriteAllText(outputFilePath, recognizedText);

Console.WriteLine($"Processed: {imageFile} -> {outputFilePath}");

نصائح & Tweaks

  • ** تنسيقات الفلتر**: استخدم النماذج مثل "*.png" أو "*.jpg" إلغاء ملفات غير الصورة.
  • الخلايا الخضراء: التغيير SearchOption.TopDirectoryOnly إلى SearchOption.AllDirectories.
  • الخروج الفارغ من السفينة: إذا string.IsNullOrWhiteSpace(recognizedText)تسجيل الدخول والاستمرار.
  • الموازنات الموازية: استخدام Parallel.ForEach(imageFiles, file => { ... }) للركض السريع (مفهوم I / O والترخيص).

من خلال اتباع هذه الخطوات يمكنك تلقائي مجموعة OCR مع Aspose.OCR ل .NET وتصدير ملفات النص النقي لمعالجة الأسفل.

More in this category