מסמכי PDF הם חיוניים בתהליכים עסקיים רבים, לעתים קרובות דורשים גישה מתוכננת לתוכן הסורק שלהם.יצוא טקסט מתוך קבצי PDF סורקים יכול להיות מאתגר, הדגש על הצורך בכלים יעילים.במדריך זה, אנו נחקור איך להוריד את המסמכים PDF ולהוציא את הטקסט מ- PDF ב- C# באמצעות האמינות ASPOSE.OCR עבור .NET API, ספרייה מובילה C# OCR PDF תמצית זמינה עבור הערכה חינם.

מה אתם תלמדו

במאמר זה נדון בנושאים הבאים:

סקירה כללית של Aspose.OCR עבור .NET API

אנחנו נשתמש ב ASPOSE.OCR עבור .NET API, .

האש מציינת את AsposeOcr בכיתה, אשר מספקת שיטות מרובות עבור פעולות OCR זיהוי PDF (String, DocumentRecognitionSettings) שיטה היא חיונית כדי להוציא את הטקסט ממסמך PDF מסוים DocumentRecognitionSettings הקורס מאפשר התאמה של תהליך ההכרה, בעוד RecognitionResult הקורס מכסה את התוצאות של ההכרה.

אתה יכול הורד את DLL של ה- API או להתקין אותו באמצעות NuGet:

PM> Install-Package Aspose.OCR

צעד ל- OCR PDF ו- Extract Text in C#

כדי לבצע OCR על מסמכים PDF ולהוציא את הטקסט המוכר, לעקוב אחר השלבים הבאים:

  • יצירת דוגמה של הכיתה AsposeOcr.
  • התחל את האובייקט בקטגוריה DocumentRecognitionSettings.
  • להגדיר את השפה עבור OCR.
  • להשיג את RecognitionResult על ידי הזמנת השיטה Pdf(), לעבור את מסלול התמונה ואת DocumentRecognitionSettings אובייקט.
  • לחצו על רשימת RecognitionResult כדי להציג את הטקסט המותאם.

הנה דוגמה שמציגה איך להעביר מסמכים PDF OCR ולהוציא טקסט מוכר ב- C#:

OCR PDF ו- Extract Text from PDF in C#

כיצד לבצע OCR ב- PDF ולשמור את הטקסט ב- C#

כדי לבצע OCR על מסמכים PDF ולשמור את הטקסט המוכר, לעקוב אחר השלבים הבאים:

  • יצירת דוגמה של הכיתה AsposeOcr.
  • התחל את האובייקט בקטגוריה DocumentRecognitionSettings.
  • להגדיר את השפה עבור OCR.
  • התקשר לשיטה RecognizePdf() כדי לקבל את RecognitionResult.
  • שמור את הטקסט באמצעות שיטת SaveMultipageDocument(), אשר דורשת את מסלול הקובץ היציאה SaveFormat, אבל, ואת RecognitionResult אובייקט.

הנה דוגמה להראות איך להעביר מסמכים PDF OCR ולשמור את הטקסט המוכר ב- C#:

לבצע OCR ב- PDF ולשמור את הטקסט ב- C#

להמיר OCR PDF ל- Word ב- C#

כדי להמיר מסמכי PDF שנבדקו ל- Word, בצע את אותם צעדים כפי שהוזכר קודם לכן, אך קבע SaveFormat.Docx בשלב האחרון.

הנה דוגמה שמציגה איך להעביר OCR PDF ולשמור את הטקסט המוכר כמסמך Word ב- C#:

OCR PDF ו- Convert Scanned PDF to Word in C#

להמיר OCR PDF ל- JSON ב- C#

כדי לשמור את הטקסט המוכר מסמכים PDF בקובץ JSON, לעקוב אחר השלבים הקודמים עם השינוי היחיד הוא לציין SaveFormat.Json בשלב האחרון.

הנה דוגמה להראות איך להעביר את OCR PDF ולשמור את הטקסט המוכר כקובץ JSON ב- C#:

קבל רישיון הערכה חינם

אתה יכול קבלת רישיון זמני חינם כדי להעריך את Aspose.OCR עבור .NET API ללא הגבלות כלשהן.

מסקנה

במדריך זה למדנו כיצד לבצע OCR על מסמכים PDF ולהוציא טקסט מ- PDF ב- C TXT, דוקס, ו JSON לקבלת מידע נוסף על Aspose.OCR עבור .NET API, בדוק את מסמכים. אם יש לך שאלות, להרגיש חופשי להגיע אלינו על ידי פורום.

ראה גם

על ידי שימוש Aspose.OCR עבור .NET API, אתה יכול ליישם דיוק גבוה PDF OCR ב- C# עבור יישומים שונים, כולל עיבוד C# O CR חשבונית וניהול טפסים. הפתרון הנחוץ הזה של .NET PDF OCC הוא מושלם עבור מפתחים שרוצים לשלב את יכולות OCR PDF ביישומיהם ביעילות.

יתר על כן, אם אתה צריך להמיר PDF לטקסט ב- C#, API זה מספק פתרון פשוט. עבור אלה המעוניינים C# OCR PDF לטקסט יכולות, האינטגרציה היא חסרת תועלת, המאפשרת לחלץ טקסט יעיל ממגוון פורמטים של מסמכים.

בנוסף, עבור משימות אינטנסיביות כגון C# API שימוש, מדריך זה מכסה את כל האלמנטים החיוניים הדרושים כדי להתחיל ביעילות.

עבור אלה שרוצים להעריך את חברת התוכנה לעיבוד מסמכים ו- PDF SDK Aspose על OCR PDFSDK, מדריך זה משמש כנקודת התחלה מצוינת כדי להבין את היכולות שלה.

יתר על כן, אם ברצונך לנצל את זיהוי הטקסט C# או להשתמש בספריה C# OCR עבור יישומים שונים, באפשרותך לחקור את התכונות שאספוס מציעה כדי לתמוך בפונקציות אלה.

לבסוף, אם אתה צריך להוציא את הטקסט מ- PDF ב- C#, או להשתמש באפליקציית ה- API של OCR (C#), התכונות של PDF של C # יגדילו את תהליך הפיתוח שלך ולשפר את הפונקציונליות של היישום שלך.

More in this category