Extract Text from PDF C#

استخراج متن از فایل های PDF یک الزام رایج در کارهای پردازش اسناد است.این مقاله یک راهنمای عمیق در مورد استفاده از Aspose.PDF Text Extractor Plugin برای استخراج متن کارآمد و متنوع در C# فراهم می کند.اگر شما نیاز به استخراج متن از یک سند کامل، صفحات خاص، و یا مناطق تعریف شده، پلاگین Aspose تسهیل استخراج متن PDF با عملکرد بالا با کمترین تلاش.

ویژگی های کلیدی پلاگین استخراج کننده متن Aspose.PDF

بررسی پلاگین استخراج متن Aspose.PDF

Aspose.PDF Text Extractor Plugin for .NET یک راه حل قوی برای استخراج متن از اسناد PDF است که به طور خاص برای توسعه دهندگان طراحی شده است که با برنامه های .NET کار می کنند و از هر دو .NET Framework و .NET Core برای استخراج متن PDF پشتیبانی می کنند:

  • حالت خالص: در حالی که فرمت و ساختار اصلی را حفظ می کند، متن را استخراج می کند.
  • Raw Mode: بدون فرمت، متن را استخراج می کند.
  • حالت برنامه: متن را استخراج می کند و تمام فرمت ها و کاراکترهای خاص را حذف می کند.

مزایای استفاده از Aspose.PDF

  • Batch Processing: پردازش چندین فایل PDF به طور همزمان.
  • تنظیمات سفارشی: تنظیمات استخراج را برای نیازهای خاص شما تنظیم کنید.
  • Seamless Integration: به طور مستقیم با برنامه های .NET برای جریان های کار صاف ادغام می شود.
  • عملکرد با سرعت بالا: بهینه سازی شده برای استخراج سریع و دقیق متن با حداقل مصرف منابع.

شروع با C# PDF استخراج متن

در این Aspose.PDF برای .NET کتابخانه یک ابزار جامع برای توسعه دهندگان .NET است که به دنبال راه حل های با عملکرد بالا C# PDF Extract هستند:

PM> Install-Package Aspose.PDF

در غیر این صورت شما می توانید دانلود DLL برای ادغام آن به طور مستقیم در پروژه شما، ارائه یک راه حل قابل اعتماد C# PDF به متن.

استخراج متن از یک PDF کامل در C#

برای استخراج تمام متن از یک PDF، این مراحل را دنبال کنید:

  • PDF را با استفاده از اسناد کلاس ها.
  • ایجاد A TextAbsorber موضوع است.
  • برای هر صفحه از آن استفاده کنید.
  • متن استخراج شده را به یک فایل ذخیره کنید.

مثال کد

استخراج متن از صفحات خاص در PDF

برای استخراج متن از یک صفحه با استفاده از C#، این مراحل را دنبال کنید:

  • PDF را دانلود کنید.
  • ایجاد A TextAbsorber.
  • این ابزار را روی صفحه مورد نظر قرار دهید.
  • متن استخراج شده را ذخیره کنید.

مثال کد

استخراج متن از مناطق خاص در PDF

برای استخراج متن از مناطق خاص یک صفحه، هماهنگی های مستطیل را تعریف کنید:

  • PDF را دانلود کنید.
  • تنظیمات TextSearchOptions برای منطقه تعیین شده.
  • اعمال می شود TextAbsorber به منطقه.
  • متن استخراج شده را ذخیره کنید.

مثال کد

جستجو و استخراج متن با استفاده از Regex

برای استخراج متن مطابقت با یک الگوی خاص با استفاده از عبارات منظم:

  • PDF را دانلود کنید.
  • یک الگوی Regex را تعریف کنید.
  • با استفاده از الگوی استفاده کنید TextAbsorber.
  • نکات متن متن مطابقت دارد.

مثال کد

استخراج داده های جدول به عنوان متن در C#

برای استخراج محتوا از جدول ها، از مراحل زیر استفاده کنید:

  • PDF را دانلود کنید.
  • استفاده TableAbsorber برای ناوبری از طریق ساختارهای میز.
  • استخراج سلول های متن به سلول.

مثال کد

استخراج متن برجسته در PDF

برای استخراج متن برجسته:

  • از طریق یادداشت ها استفاده کنید.
  • فیلتر TextMarkupAnnotation.
  • بازگرداندن و ذخیره تکه های برجسته.

مثال کد

بهینه سازی استخراج متن با استفاده از حافظه کم

ب) استفاده از **** و ****:

  • تماس absorber.Reset() پس از پردازش هر صفحه.
  • حافظه ای که از صفحات استفاده می شود page.FreeMemory().

۲) استفاده از MemorySaving مد:

تنظیمات TextExtractionOptions.TextFormattingMode برای بهینه سازی استفاده از حافظه در طول استخراج متن PDF.

مثال کد

مجانی C# PDF کتابخانه استخراج متن {# مجانی- مجوز}

دریافت کنید A مجوز موقت رایگان برای دسترسی نامحدود به Aspose.PDF برای .NET و باز کردن پتانسیل کامل آن برای راه حل های بهره وری C# PDF Text Extraction. شما همچنین می توانید گزینه هایی مانند C# تبدیل PDF به متن و c# خواندن متن از PDF را برای روش های سفارشی، از جمله c# استخراج متن در PDF و c # خواندن متن PDF رایگان، بررسی کنید.

نتیجه گیری

Aspose.PDF از پلاگین استخراج متن برای .NET ارائه می دهد یک راه حل متنوع و کارآمد برای وظایف به دست آوردن متن قابل اطمینان است. از عصاره متن از کل اسناد به صفحات و یا مناطق خاص، آن را به سرعت فرآیند با دقت و سرعت. این باعث می شود که یکی از بهترین کتابخانه های C# PDF Extracte Text در دسترس. امروز سعی کنید برای ساده تر کردن جریان های کار استخاری متن PDF خود را برای فقط $99!

More in this category