استخراج جدول ها از تصاویر می تواند یک وظیفه چالش برانگیز باشد، اما با Aspose.OCR برای .NET، آن را بسیار قابل مدیریت تر می شود. این کتابخانه قدرتمند به توسعه دهندگان اجازه می دهد تا فرآیند تبدیل تصاویر حاوی داده های جدول به فرمت های ساختار یافته مانند اکسل، CSV، و یا متن مسطح را اتوماتیک. در این آموزش، ما از طریق مراحل مورد نیاز برای تنظیم و استفاده از ASPOSE.OKR به منظور برداشتن جدول از تصویر به طور موثر.

نمونه کامل

برای شروع، شما نیاز به Aspose.OCR برای .NET در پروژه خود نصب شده است.هنگامی که این کار انجام می شود، می توانید مراحل زیر را دنبال کنید تا جدول ها را از یک تصویر استخراج کنید و آنها را به فرمت مورد نظر صادر کنید.

مرحله اول: موتور OCR را شروع کنید

قبل از اینکه شروع به استخراج جدول کنید، باید موتور OCR را با تنظیمات لازم آغاز کنید.این شامل تنظیم زبان شناسایی و هر تنظیم خاص دیگری است که برای مورد استفاده شما مورد نیاز است.

مرحله دوم: تصویر را شارژ کنید

تصویر حاوی داده های جدول را به موتور OCR بارگذاری کنید اطمینان حاصل کنید که تصویر روشن است و متن درون آن قابل خواندن است تا استخراج دقیق را تضمین کند.

// Step 1: Initialize the OCR Engine
using (AsposeOcr ocrEngine = new AsposeOcr())
{
    // Set recognition language and other configurations as needed
    ocrEngine.Language = RecognitionLanguages.English;
}

مرحله 3: تنظیم تنظیمات تشخیص جدول

این شامل تنظیم پارامترها مانند تشخیص سلول، تشخیص خط و سایر گزینه های پیشرفته برای تمیز کردن فرآیند استخراج است.

// Step 2: Load the Image
using (var imageStream = new FileStream("table_image.png", FileMode.Open, FileAccess.Read))
{
    var image = new OcrInputStream(imageStream);
}

مرحله چهارم: فرآیند استخراج را اجرا کنید

با تمام تنظیمات تنظیم شده، شما اکنون می توانید فرآیند استخراج جدول را اجرا کنید. Aspose.OCR تصویر را تجزیه و تحلیل می کند و داده های جدول به یک فرمت ساختار یافته کشیده می شود.

// Step 3: Configure Table Recognition Settings
ocrEngine.TableRecognitionSettings = new TableRecognitionSettings
{
    CellDetection = true,
    LineDetection = true,
    AdvancedOptions = new AdvancedTableRecognitionOptions { MinCellWidth = 50, MinCellHeight = 20 }
};

مرحله پنجم: اطلاعات را وارد کنید

در نهایت، داده های استخراج شده را به فرمت مورد علاقه خود مانند اکسل، CSV یا متن مسطح صادر کنید.این مرحله شامل ذخیره کردن داده ها در یک فایل یا دستکاری مستقیم آن در برنامه شما است.

// Step 4: Run the Extraction Process
var extractionResult = ocrEngine.RecognizeTable("path/to/image.png");
Console.WriteLine("Table extracted successfully!");

بهترین شیوه‌ها

هنگام کار با Aspose.OCR برای .NET برای استخراج جدول از تصاویر، چندین بهترین شیوه ای وجود دارد که باید در نظر بگیرید:

  • کیفیت تصویر را تضمین کنید: کیفیت تصویر ورودی برای استخراج دقیق جدول بسیار مهم است و مطمئن شوید که متن در تصویر روشن و مشخص است.
  • Fine-Tune Settings: آزمایش با تنظیمات مختلف برای بهینه سازی فرآیند استخراج. تنظیم پارامترها مانند حساسیت تشخیص سلول می تواند به طور قابل توجهی بهبود نتایج.
  • **تعامل با خطا: **استفاده از مدیریت خطای قوی برای مدیریت موارد که در آن موتور OCR ممکن است با تصاویر پیچیده یا با کیفیت پایین مبارزه کند.

نتیجه گیری

با پیروی از این دستورالعمل ها، شما می توانید به طور موثر از Aspose.OCR برای .NET برای اتوماسیون فرآیند استخراج جدول ها از تصاویر و تبدیل آنها به فرمت های داده های ساختار یافته استفاده کنید.این قابلیت در سناریوهای زمانی که ورودی دستی داده ها غیر عملی یا ناکارآمد است، ارزشمند نیست.

More in this category