PDF فایل ها محبوب هستند زیرا آنها از متن، تصاویر، انیمیشن ها، ویدئوها و یادداشت های مختلف پشتیبانی می کنند. با این حال، برای بسیاری از اسناد، متن مهم ترین بخش است. این مقاله توضیح می دهد که چگونه برای تبدیل فایل های PDF به فایل TXT و، به نوبه خود، فایلهای TXT به PDF با استفاده از C# .NET این تبدیل به خصوص مفید است زمانی که شما نیاز به استخراج و یا تمرکز فقط بر محتوای متن از یک سند PDF، مانند هنگام انجام تجزیه و تحلیل متن یا آماده سازی محتوا برای اصلاح.
موضوعات پوشش داده شده در این راهنمای شامل:
- C# TXT به PDF یا PDF به TXT تبدیل API
- C# تبدیل PDF به TXT بدون فرمت
- تبدیل فایل PDF به TXT با استفاده از C# یا VB.NET
- تبدیل فایل TXT به PDF با استفاده از C# یا VB.NET
نکته: شما ممکن است علاقه مند به یک رایگان باشید متن به GIF Converter که به شما اجازه می دهد تا GIF های متحرک را از متن ایجاد کنید.
C# TXT به PDF یا PDF به TXT Converter
تبدیل بین فرمت های PDF و TXT ضروری است هنگامی که علاقه اصلی شما در داده های متنی در یک سند قرار دارد.اگر شما نیاز به حذف تمام قالب برای تجزیه و تحلیل متن ساده و یا حفظ برخی از طرح های ساختاری، این فرآیند را می توان با چند مرحله ساده با استفاده از Aspose.PDF برای .NET این API متنوع است و از C# و VB.NET پشتیبانی می کند و به راحتی می تواند در برنامه های .NET شما ادغام شود.
برای نصب API در برنامه شما می توانید فایل های DLL را از دانلود یا از آن استفاده کنید نوکیا به عنوان مثال، آن را از طریق کنسول مدیریت بسته نصب کنید:
PM> Install-Package Aspose.PDF
هنگامی که API نصب شده است، شما می توانید فرآیند تبدیل را با چندین رویکرد سفارشی برای نیازهای مختلف آغاز کنید.
C# تبدیل PDF به TXT بدون فرمت
گاهی اوقات، شما فقط نیاز به متن خام از یک سند PDF بدون هیچ فرمت اضافی. این روش استخراج متن دقیقا همانطور که در سند ظاهر می شود، بدون حفظ فونت ها، فضاهای، و یا سبک. آن را به خصوص مفید برای تجزیه و تحلیل متن، فهرست جستجو، و یا زمانی که طرح بی اهمیت است.
راهکارهایی برای استخراج متن خام
تولید ورودی فایل PDF: از API برای بارگذاری فایل PDF به یک اشیاء مستند استفاده کنید.
شروع یک StringBuilder: برای ایجاد یک مثال از StringBuilder کلاس برای به طور موثر جمع آوری داده های متن.
نمایش از طریق هر صفحه PDF: برای هر صفحه در هر صفحه در هر صفحه:
استفاده TextDevice برای استخراج متن
کارگر را استخدام کنید حالت خام تا اطمینان حاصل شود که فرمت استفاده نمی شود.
تصویری از متن خروجی را ذخیره کنید: متن جمع آوری شده را به یک فایل TXT بنویسید.
کد زیر نشان می دهد که چگونه یک فایل PDF را با استفاده از روش استخراج خام به یک فایل TXT تبدیل کنیم:
دیدگاه های اضافی
- عملکرد و سادگی : استخراج متن خام معمولا سریع تر است زیرا سعی نمی کند هیچ قواعد فرمت را از بین ببرد یا اعمال کند.
- استفاده از موارد : ایده آل برای استخراج سوابق، فهرست جستجو و یا سناریوهایی که فقط محتوای متنی مورد نیاز است.
تبدیل فایل PDF به TXT با استفاده از C# یا VB.NET
در سایر سناریوهای، حفظ فرمت متن (مانند پاراگراف ها، شاخص ها و ستون ها) حیاتی است.این روش برای فرمت کردن روال ها برای نشان دادن طرح سند در فایل TXT حاصل می شود.
مراحل برای استخراج متن با فرمت
فایلهای PDF منبع را دانلود کنید: همانطور که قبلا، فایل PDF را در برنامه خود بارگذاری کنید.
تغییر خطی را شروع کنید: یک نوار برای جمع آوری خروجی متن فرمت شده آماده کنید.
تصویب متن با استفاده از حالت فرمت: برای هر صفحه از آن استفاده کنید بایگانی برچسب ها: خالص این حالت تلاش می کند تا فرمت اصلی را تا جایی که ممکن است تکرار کند.
تصویر متن فرمت شده را ذخیره کنید: متن جمع آوری شده را به یک فایل TXT خارج کنید که فرمت های ساختاری مانند شکاف های خطی، شاخص ها و فاصله های دایره ای را حفظ می کند.
مثال کد زیر نشان می دهد که چگونه یک PDF را به یک فایل TXT با فرمت متن با استفاده از C# تبدیل کنیم:
مقایسه بین RAW و Pure Extraction
تصویر زیر یک مقایسه بصری از دو حالت استخراج را فراهم می کند.در سمت چپ، متن PDF با فرمت اصلی آن (در حالت خالص) ظاهر می شود، در حالی که در سمت راست، متن خام بدون هیچ فرمت نمایش داده می شود.این مقایسه می تواند به شما کمک کند تا تصمیم بگیرید که کدام روش برای نیازهای شما مناسب تر است.

تبدیل فایل TXT به PDF با استفاده از C# یا VB.NET
تبدیل یک فایل TXT به یک PDF مفید است زمانی که شما نیاز به تولید یک سند پوشیده از محتوای متن صاف. این فرآیند شامل خواندن متن و سپس استفاده از فرمت PDF برای ایجاد یک سند است که بصری جذاب و آماده برای توزیع است.
مراحل برای TXT به PDF تبدیل
ایجاد یک متن خواننده: استفاده از متن خواندن کلاس برای خواندن محتوا از فایل TXT.
یک سند PDF جدید را راه اندازی کنید و یک صفحه سفید اضافه کنید: برای ایجاد یک مثال از اسناد کلاس و اضافه کردن یک صفحه جدید.
تولید یک TextBuilder Object: استفاده از متن سازنده برای ساخت پاراگراف های متن با فرمت مورد نظر مانند فونت، اندازه و رنگ.
خواندن و اضافه کردن هر خط متن: از طریق خطوط در فایل TXT عبور کنید و هر خط را به اشیاء TextBuilder اضافه کنید.
نمایش PDF را ذخیره کنید: استفاده از بایگانی برچسب ها: String روش نوشتن فایل PDF نهایی به دیسک.
کد زیر نشان می دهد که چگونه یک فایل TXT را به یک سند PDF با استفاده از C# تبدیل کنید:
در نظر گرفتن هنگام تبدیل TXT به PDF
- طرح و سبک : ممکن است نیاز به تنظیم محدوده ها، محدوده خط و سایر ویژگی های متن داشته باشید تا اطمینان حاصل شود که PDF به خوبی فرمت شده و قابل خواندن است.
- تصمیم گیری اشتباه : اجرای بررسی خطا در هنگام خواندن فایل و نوشتن عملیات برای مقابله با سناریوهای مانند مشکلات دسترسی به فایل و یا رمزگذاری اشتباهات.
نتیجه گیری
در این مقاله، ما تکنیک های تبدیل فایل های PDF به TXT و tXT به PDF با استفاده از C# یا VB.NET در .NET Framework را نشان دادیم.اگر شما انتخاب کنید برای استخراج متن خام برای سرعت و سادگی و یا نیاز به متن فرمت شده برای حفظ طرح اسناد، Aspose.PDF برای .NET API ها راه حل های قابل اعتماد و انعطاف پذیر را ارائه می دهند.این روش های تبدیل برای پردازش داده ها، آرشیو اسناد و بازسازی محتوا ارزشمند نیستند.
اگر سوالی دارید یا نیاز به کمک بیشتر دارید، لطفا به ما مراجعه کنید. انجمن پشتیبانی رایگان یا به بررسی مستندات محصول.