
اسناد PDF در بسیاری از فرآیندهای کسب و کار ضروری هستند، اغلب نیاز به دسترسی برنامه نویسی به محتوای اسکن شده خود را. استخراج متن از فایل های اسکان شده PDF می تواند چالش برانگیز باشد، تاکید بر ضرورت برای ابزارهای موثر است. در این راهنمای، ما بررسی چگونه به سند های PDF OCR و استخراهن متن با استفاده از PDF قابل اعتماد در C ASPOSE.OCR برای API .NET, یک کتابخانه استخراج PDF پیشرو C# OCR در دسترس برای ارزیابی رایگان است.
چه چیزی یاد خواهید گرفت
در این مقاله موضوعات زیر را پوشش خواهیم داد:
- بررسی Aspose.OCR برای .NET API
- گام ها به OCR PDF و استخراج متن
- چگونه به انجام OCR در PDF و ذخیره متن
- تبدیل OCR PDF به Word
- تبدیل OCR PDF به JSON
بررسی Aspose.OCR برای .NET API
ما از آن استفاده خواهیم کرد ASPOSE.OCR برای API .NET, .
آتش سوزی به این معنی است که AsposeOcr کلاس، که روش های چندگانه برای عملیات OCR را فراهم می کند آشنایی با PDF (String، DocumentRecognitionSettings) روش برای استخراج متن از یک سند PDF خاص ضروری است DocumentRecognitionSettings کلاس اجازه می دهد تا سفارشی سازی فرایند شناخت، در حالی که RecognitionResult کلاس ها نتایج شناخت را در بر می گیرند.
شما می توانید دانلود DLL از API یا آن را از طریق NuGet:
PM> Install-Package Aspose.OCR
قدم به OCR PDF و استخراج متن در C#
برای انجام OCR بر روی اسناد PDF و استخراج متن شناخته شده، این مراحل را دنبال کنید:
- یک مثال از کلاس AsposeOcr ایجاد کنید.
- یک موضوع را از کلاس DocumentRecognitionSettings شروع کنید.
- زبان را برای OCR مشخص کنید.
- به دست آوردن RecognitionResult با استفاده از روش Pdf()، عبور از مسیر تصویر و DocumentRecognitionSettings موضوع است.
- از لیست RecognitionResult عبور کنید تا متن شناسایی شده را مشاهده کنید.
در اینجا یک مثال نشان می دهد چگونه به OCR اسناد PDF و استخراج متن شناخته شده در C#:
OCR PDF و استخراج متن از PDF در C#
چگونه OCR را در PDF انجام دهیم و متن را در C# ذخیره کنیم
برای انجام OCR در اسناد PDF و ذخیره متن شناخته شده، این مراحل را دنبال کنید:
- یک مثال از کلاس AsposeOcr ایجاد کنید.
- یک موضوع را از کلاس DocumentRecognitionSettings شروع کنید.
- زبان را برای OCR مشخص کنید.
- روش RecognizePdf() را برای دریافت RecognitionResult تماس بگیرید.
- متن را با استفاده از روش SaveMultipageDocument() ذخیره کنید، که نیاز به مسیر فایل خروجی دارد SaveFormat, و در آن RecognitionResult موضوع است.
در اینجا یک مثال نشان می دهد چگونه به اسناد OCR PDF و ذخیره متن شناخته شده در C#:
OCR را در PDF اجرا کنید و متن را در C# ذخیره کنید#
تبدیل OCR PDF به Word به C#
برای تبدیل اسناد PDF اسکن شده به Word، همان قدم هایی را که قبلاً ذکر شد، دنبال کنید، اما در مرحله نهایی SaveFormat.Docx را مشخص کنید.
در اینجا یک مثال نشان می دهد چگونه به OCR PDF و ذخیره متن شناخته شده به عنوان یک سند Word در C#:
OCR PDF و تبدیل اسکن شده PDF به Word در C#
تبدیل OCR PDF به JSON به C#
برای ذخیره متن شناخته شده از اسناد PDF در یک فایل JSON، مراحل قبلی را دنبال کنید و تنها تغییر این است که SaveFormat.Json را در مرحله نهایی مشخص کنید.
در اینجا یک مثال نشان می دهد چگونه به OCR PDF و ذخیره متن شناخته شده به عنوان یک فایل JSON در C#:
دریافت مجوز ارزیابی رایگان
شما می توانید دریافت مجوز موقت رایگان برای ارزیابی Aspose.OCR برای .NET API بدون هیچ محدودیتی.
نتیجه گیری
در این آموزش، ما یاد گرفتیم که چگونه OCR را بر روی اسناد PDF انجام دهیم و متن را از PDF در C# استخراج کنیم TXT, داکس, و JSON برای اطلاعات بیشتر در مورد Aspose.OCR برای .NET API، آن را بررسی کنید مستندات. اگر سوالی دارید، آزاد باشید تا به ما برسید انجمن.
همچنین ببینید
- تبدیل تصویر صفحه نمایش به متن با OCR به C#
- OCR Image to Text and Spelling Correction در C#
- تبدیل PDF اسکن شده به PDF قابل جستجو با OCR در C#
با استفاده از Aspose.OCR برای API .NET، شما می توانید دقت بالا PDF OCR را در C# برای برنامه های مختلف، از جمله پردازش C# O CR صورتحساب و پردازنده فرم ها، اجرا کنید. این پرداخت قابل دسترس .NET PDF OKR ایده آل برای توسعه دهندگان است که می خواهند توانایی های OKR PDF به طور موثر در برنامه خود ادغام کنند.
علاوه بر این، اگر شما نیاز به تبدیل PDF به متن به C#، این API یک راه حل ساده را فراهم می کند.برای کسانی که علاقه مند به C# OCR PDF برای متن توانایی ها، ادغام بی سیم است، اجازه می دهد تا استخراج متن موثر از فرمت های مختلف اسناد.شما همچنین می توانید از عملکرد c# Convert PDF to Text استفاده کنید برای به راحتی به دست آوردن تخلیه متن از PDF، فرآیند توسعه خود را صاف تر.
اگر شما به دنبال یک Aspose OCR C# نمونه، این راهنمای به عنوان یک منبع جامع خدمت می کند. علاوه بر این، برای وظایف پیچیده مانند استفاده از C# API، در این آموزش تمام عناصر ضروری مورد نیاز برای شروع به طور موثر را پوشش می دهد.
برای کسانی که به دنبال تقييم SDK PDF و نرم افزار پردازش اسناد Aspose در OCR PDFSDK هستند، این راهنمای به عنوان یک نقطه شروع عالی برای درک توانایی های آن عمل می کند.اگر شما نیاز به C# DLL برای یکپارچه سازی یا یک **Tutorial ** برای راهنمایی دارید، همه چیزهایی را پیدا خواهید کرد که برای استفاده موثر از API در پروژه های خود نیاز دارید.
علاوه بر این، اگر می خواهید از شناسایی متن C# استفاده کنید یا از کتابخانه OCR برای برنامه های مختلف استفاده نمایید، می توانید ویژگی هایی را که Aspose برای پشتیبانی از این ویژگی ها ارائه می دهد، بررسی کنید. ارزیابی SDK PDF C # یک فرصت عالی برای آزمایش با قابلیت های این کتابچه است و اطمینان حاصل می کند که راه حل های مناسب را برای نیازهای شما پیدا خواهید کرد.
در نهایت، اگر شما نیاز به استخراج متن از PDF در C#، و یا استفاده از یک OCR API C #، ویژگی های C# OCR PDF در دسترس خواهد روند توسعه خود را آسان تر و بهبود عملکرد برنامه شما.