PDF קבצים הם פופולריים כי הם תומכים בטקסט, תמונות, אנימציות, קטעי וידאו, ומגוון של הערות.עם זאת, עבור מסמכים רבים, הטקסט הוא החלק החשוב ביותר.המאמר הזה מסביר כיצד להמיר קובץ PDF לקבצי TXT, ולהיפך, קביצים TXT ל- PDF באמצעות C# .NET.השינוי הזה הוא שימושי במיוחד כאשר אתה צריך להוציא או להתמקד רק על התוכן של טקסט במסמך PDF, כגון בעת ביצוע ניתוח טקס או הכנת תוכן לשינוי.

הנושאים המפורטים במדריך זה כוללים:

טיפים: ייתכן שגם אתם מעוניינים בחינם תגית: GIF Converter זה מאפשר לך ליצור GIFים אנמיה מן הטקסט.

C# TXT ל- PDF או PDF ל- TXT Converter

ההמרה בין פורמטים PDF ו- TXT היא חיונית כאשר האינטרס העיקרי שלך נמצא בנתונים הטקסט בתוך מסמך.לא משנה אם אתה צריך להסיר את כל הפורמט עבור ניתוח טקסט פשוט או לשמור על כמה הפריסה מבנית, התהליך ניתן להשלים עם כמה צעדים פשוטים באמצעות דפדפן PDF עבור .NET API זה הוא מגוון ותומך בשני C# ו- VB.NET, מה שהופך אותו קל לשלב באפליקציות .NET שלך.

כדי להתקין את ה- API באפליקציה שלך, באפשרותך להוריד את קבצי DLL מ הורדות או להשתמש ב נוגט לדוגמה, להתקין אותו באמצעות הקונסולת מנהל החבילות:

PM> Install-Package Aspose.PDF

ברגע שה-API מותקן, אתה יכול להתחיל את תהליך ההמרה עם מספר גישות מותאמות לצרכים שונים.

C# להמיר PDF ל- TXT ללא הצורה

לפעמים, אתה רק צריך את הטקסט הירוק מסמך PDF ללא כל הצורה נוספת.שיטה זו מוציאה את הטקסט בדיוק כפי שהוא מופיע במסמך, ללא שמירה על טקסטים, שטח, או סגנונות.

צעד אחר צעד לחלץ טקסט ירוק

  • להורדה של מסמך PDF: השתמש ב- API כדי להעלות את קובץ PDF לתוך אובייקט מסמך.

  • התחלה של StringBuilder: יצירת דוגמה של StringBuilder שיעור כדי לאסוף באופן יעיל נתונים טקסט.

  • הצג דרך כל דף PDF: לחצו על כל הדפים של המסמך עבור כל דף:

  • שימוש TextDevice להוציא את הטקסט.

  • מעסיקים את אופנה Raw כדי להבטיח כי פורמט אינו מיושם.

  • שמור את טקסט היציאה: כתוב את הטקסט המצטבר לקובץ TXT.

הסריפט הקוד למטה מראה כיצד להמיר קובץ PDF לקובץ TXT באמצעות שיטת החילוץ Raw:

השקפות נוספות

  • ביצועים ופשטות: מיצוי טקסט ירוק הוא בדרך כלל מהיר יותר כי הוא לא מנסה לחתוך או ליישם כללים של עיצוב.
  • מקרים של שימוש: אידיאלי עבור רכישת יומנים, אינדקס חיפוש, או סקרינרים שבהם רק תוכן טקסט נדרש.

להמיר קובץ PDF ל- TXT באמצעות שיטות הצורה באמצעות C# או VB.NET

בסצנות אחרות, שמירה על הצורה של הטקסט (כגון פסוקים, תוויות, עמודים) היא חיונית.שיטה זו מתייחסת לצורה של שיטות כדי להדביק את הפריסה של המסמך בקובץ TXT התוצאה.

צעד אחר צעד ב- Text Extraction with Formatting

  • הורד את מקור הקובץ PDF: כמו בעבר, להעלות את המסמך PDF לתוך היישום שלך.

  • התחל עם משתנה קשת: להכין רצועה כדי לאסוף יצוא טקסט פורמט.

  • הצגת טקסט באמצעות מצב הפורמט: עבור כל דף, השתמשו טופס טופס טופס מצב זה מנסה לשחזר את הפורמט המקורי היטב ככל האפשר.

  • שמור את הטקסט הפורמט: יצא את הטקסט שנאסף לתוך קובץ TXT שמחזיק בפורמט מובנה כגון פריצות שורה, פריצות, ופינוי שורות.

הדוגמה הבאה של קוד מראה כיצד להמיר קובץ PDF לקובץ TXT עם עיצוב טקסט באמצעות C#:

השוואה חזותית בין RAW ו- Pure Extraction

התמונה למטה מספקת השוואה חזותית בין שני מצבי החילוץ.לשמאל, הטקסט של PDF מופיע עם הצורה המקורית שלה (מצב טהור), בעוד שהצד הימני מראה טקסט ירוק ללא הצורה כלשהי.השוואה זו יכולה לעזור לך להחליט איזה שיטה מתאימה הכי טוב לצרכים שלך.

Convert PDF TXT csharp

להמיר קובץ TXT ל- PDF באמצעות C# או VB.NET

ההמרה של קובץ TXT בחזרה ל- PDF היא שימושית כאשר אתה צריך לייצר מסמך מעודכן מתוך תוכן טקסט שטוח.תהליך זה כולל קריאת הטקסט ולאחר מכן יישום פורמט PDF כדי ליצור מסמך אשר הוא אטרקטיבי ויזואלי ומוכן לשיתוף.

שלבים עבור TXT ל- PDF Conversion

  • יצירת יישום של TextReader: השתמשו ב טקסטריידר לקרוא את התוכן מהקובץ TXT.

  • התחל מסמך PDF חדש ולהוסיף דף לבן: יצירת דוגמה של מסמך שיעורים ולהוסיף דף חדש.

  • להגדיר אובייקט TextBuilder: השתמשו ב TextBuilder לבנות פרקים טקסט עם הצורה הרצויה, כגון טופס, גודל וצבע.

  • קרא ולהוסיף כל שורה של טקסט: לעבור את השורות בקובץ TXT, להוסיף כל שורה לאובייקט TextBuilder.

  • שמור את היציאה PDF: השתמשו ב ארכיון הכתבות על Save (String) שיטת הכתיבה של קובץ PDF הסופי לדיסק.

הסריפט הקוד למטה מראה כיצד להמיר קובץ TXT לתוך מסמך PDF באמצעות C#:

שיקולים כאשר להמיר TXT ל- PDF

  • סגנון וסגנון: ייתכן שתצטרך להתאים את הגבולות, שטח הקו ותכונות טקסט אחרות כדי להבטיח שה- PDF יהיה מעוצב היטב וקריא.
  • טעות בניהול: יישום בדיקת שגיאות במהלך קריאת קבצים וכתוב פעולות כדי להתמודד עם סקרינרים כגון בעיות גישה לקבצים או קוד שגיאות.

מסקנה

במאמר זה, הוכחנו את הטכניקות להמיר קבצים PDF ל- TXT ו- PDF באמצעות C# או VB.NET ב- .NET Framework. בין אם אתה בוחר לחלץ טקסט ירוק עבור מהירות ופשטות או דורש טקס פורמט כדי לשמור על הפריסה של המסמך, דפדפן PDF עבור .NET API מציעה פתרונות אמינים וגמישים.שיטות ההמרה האלה הן חסרות ערך לעיבוד נתונים, ארכיון מסמכים, ושיקום תוכן.

אם יש לך שאלות או זקוק לעזרה נוספת, בבקשה לבקר שלנו פורום תמיכה חינם או לבחון את תיעוד המוצר.

ראה גם

More in this category