ไฟล์ PDF เป็นสิ่งสําคัญในกระบวนการธุรกิจจํานวนมากมักจะต้องเข้าถึงการสแกนเนื้อหาของพวกเขา การสกปรกข้อความจากไฟล์ pdf ที่สกรีนอาจเป็นเรื่องยากเน้นความต้องการของเครื่องมือที่มีประสิทธิภาพ ในบทเรียนนี้เราจะสํารวจ วิธีการที่จะ OCR เอกสาร PDF และสกัดข้อความจากการ PDF ใน C# โดยใช้ที่เชื่อถือได Aspose.OCR สําหรับ API .NET, หลัก C# OCR PDF สารสกัดห้องสมุด สามารถใช้ได้สําหรับการประเมินฟร.

สิ่งที่คุณจะเรียนร

ในบทความนี้เราจะครอบคลุมหัวข้อต่อไปน:

รีวิว Aspose.OCR สําหรับ API .NET

เราจะใช Aspose.OCR สําหรับ API .NET, .

ปลั๊กไฟประกอบด้วย AsposeOcr ประเภทซึ่งให้วิธีการหลายสําหรับการดําเนินงาน OCR หมายความว่า RecognizePdf(String, DocumentRecognitionSettings) วิธีการเป็นสิ่งสําคัญสําหรับการสกัดข้อความจากเอกสาร PDF ที่กําหนด DocumentRecognitionSettings คลาสช่วยให้การปรับแต่งของกระบวนการรับรู้ในขณะท RecognitionResult คลาส encapsulates ผลของการรับร.

คุณสามารถ ดาวน์โหลด DLL ของ API หรือติดตั้งผ่าน NuGet:

PM> Install-Package Aspose.OCR

ขั้นตอนไป OCR PDF และสกัดข้อความใน C#

เพื่อดําเนินการ OCR บนเอกสาร PDF และสกัดข้อความที่ได้รับการยอมรับทําตามขั้นตอนต่อไปน:

  • สร้างตัวอย่างของคลาส AsposeOcr.
  • เริ่มต้นวัตถุในหมวดหมู่ DocumentRecognitionSettings.
  • รายละเอียดภาษาสําหรับ OCR.
  • รับ RecognitionResult โดยการเรียกใช้ Pdf() วิธีการผ่านเส้นทางภาพและ DocumentRecognitionSettings วัตถ.
  • ผ่านรายการ RecognitionResult เพื่อแสดงข้อความที่ระบุไว.

นี่คือตัวอย่างที่แสดงให้เห็น วิธีการเข้าถึงเอกสาร PDF OCR และสกัดข้อความที่ได้รับการยอมรับใน C#:

OCR PDF และสกัดข้อความจาก PDF ใน C#

วิธีการดําเนินการ OCR บน PDF และบันทึกข้อความใน C#

เพื่อดําเนินการ OCR บนเอกสาร PDF และบันทึกข้อความที่ได้รับการยอมรับทําตามขั้นตอนต่อไปน:

  • สร้างตัวอย่างของคลาส AsposeOcr.
  • เริ่มต้นวัตถุในหมวดหมู่ DocumentRecognitionSettings.
  • รายละเอียดภาษาสําหรับ OCR.
  • ติดต่อ RecognizePdf() เพื่อรับ RecognitionResult.
  • การบันทึกข้อความโดยใช้วิธีการ SaveMultipageDocument() ซึ่งต้องใช้เส้นทางไฟล์ออก SaveFormat, และ The RecognitionResult วัตถ.

นี่คือตัวอย่างที่แสดงให้เห็น วิธีการเข้าถึงเอกสาร OCR PDF และบันทึกข้อความที่ได้รับการยอมรับใน C#:

ทํา OCR บน PDF และบันทึกข้อความใน C#

การแปลง OCR PDF ไปยัง Word ใน C#

เพื่อแปลงเอกสาร PDF ที่สแกนเป็น Word ทําตามขั้นตอนเดียวกันที่ระบุไว้ก่อนหน้านี้ แต่ระบุ SaveFormat.Docx ในขั้นตอนสุดท้าย.

นี่คือตัวอย่างที่แสดงให้เห็น วิธีการ OCR PDF และบันทึกข้อความที่ได้รับการยอมรับเป็นเอกสาร Word ใน C#:

OCR PDF และแปลงสแกน PDF ไปยัง Word ใน C#

การแปลง OCR PDF ไปยัง JSON ใน C#

เพื่อบันทึกข้อความที่ได้รับการยอมรับจากเอกสาร PDF ในไฟล์ JSON โปรดทําตามขั้นตอนก่อนหน้านี้ด้วยการเปลี่ยนแปลงเท่านั้นเพื่อระบุ SaveFormat.Json ในขั้นตอนสุดท้าย.

นี่คือตัวอย่างที่แสดงให้เห็น วิธีการ OCR PDF และบันทึกข้อความที่ได้รับการยอมรับเป็นไฟล์ JSON ใน C#:

รับใบอนุญาตการประเมินฟร

คุณสามารถ รับใบอนุญาตชั่วคราวฟร เพื่อประเมิน Aspose.OCR สําหรับ API .NET โดยไม่มีข้อ จํากัด.

ข้อสรุป

ในบทเรียนนี้เราได้เรียนรู้วิธีการดําเนินการ OCR บนเอกสาร PDF และสกัดข้อความจาก PDF ใน C# นอกจากนี้เรายังสํารวจวิธีการบันทึกข้อความที่ได้รับการยอมรับเป็น TXT, DOCX, และ JSON สําหรับข้อมูลเพิ่มเติมเกี่ยวกับ Aspose.OCR สําหรับ API .NET โปรดดูท การรับรอง. หากคุณมีคําถามใด ๆ รู้สึกอิสระที่จะมาถึงเราบนเว็บไซต์ของเรา โพสต.

ดูเพิ่มเติม

โดยใช้ Aspose.OCR สําหรับ API .NET คุณสามารถนําไปใช้ความแม่นยําสูง PDF OCR ใน C# สําหรับแอพต่างๆรวมถึงการประมวลผลและจัดการแบบฟอร์ม C# Ocr Invoice โซลูชันนี้ เป็นไปได้สําหรับผู้พัฒนาที่ต้องการที่จะรวมความสามารถ OCR PDF เข้ากับแอปพลิเคชันของพวกเขาได้อย่างมีประสิทธิภาพ ด้วยห้องสมุด C # สําหรับ O CR PDF และสกัดข้อความคุณสามารถให้ผลลัพธ์ที่ถูกต้องในโครงการของคุณได.

นอกจากนี้ถ้าคุณต้องการแปลง PDF ไปยังข้อความใน C# API นี้ให้โซลูชันที่เรียบง่าย สําหรับผู้ที่สนใจใน C# OCR PDF เพื่อข้อความ ความสามารถการบูรณาการนั้นไร้รอยต่อซึ่งช่วยให้การสกัดข้อความได้อย่างมีประสิทธิภาพจากรูปแบบเอกสารต่างๆ คุณยังสามารถใช้ฟังก์ชั่นการแปลง C# PDF เป็นข้อความ เพื่อจัดการได้อย่างง่ายดายกับการสกปรกข้อความจาก PDF ทําให้กระบวนการพัฒนาของคุณราบรื่นขึ้น.

หากคุณกําลังมองหา Aspose OCR C# ตัวอย่าง คู่มือนี้ให้บริการเป็นทรัพยากรที่ครอบคลุม นอกจากนี้สําหรับงานที่ซับซ้อนเช่นการใช้ C# API เคล็ดลับนี้รวมถึงองค์ประกอบที่สําคัญทั้งหมดที่จําเป็นในการเริ่มต้นได้อย่างมีประสิทธิภาพ นอกจากนี้หากคุณต้องการ สกัดข้อความจาก PDF โดยใช้ C # คุณสมบัติของ API ของ ASPOSO จะปรับปรุงการทํางานของคุณอย่างมีนัยสําคัญ.

สําหรับผู้ที่ต้องการ ประเมิน SDK PDF และซอฟต์แวร์การประมวลผลเอกสาร Aspose บน OCR PDF SDk คู่มือนี้เป็นจุดเริ่มต้นที่ยอดเยี่ยมในการเข้าใจความสามารถของมัน ไม่ว่าคุณต้องใช้ C# oCR DLL สําหรับการบูรณาการหรือคําแนะนํา c # ocr คืนมือ คุณจะพบทุกสิ่งที่คุณต้องการที่จะใช้ API ในโครงการของคุณได้อย่างมีประสิทธิภาพ.

นอกจากนี้ถ้าคุณต้องการใช้การรับรู้ข้อความ C# หรือใช้ห้องสมุด OCR สําหรับแอพต่างๆคุณสามารถสํารวจคุณสมบัติที่ Aspose มีเพื่อสนับสนุนฟังก์ชั่นเหล่านี้ การประเมิน SDK PDF เป็นโอกาสที่ยอดเยี่ยมในการทดลองกับความสามารถของตารางนี้เพื่อให้แน่ใจว่าคุณจะพบโซลูชั่นที่เหมาะสมสําหรับความต้องการของคุณ.

สุดท้ายถ้าคุณต้องการ การสกัดข้อความจาก PDF ใน C# หรือใช้ API OCR C # คุณสมบัติของ C# O CR PDF ที่ใช้จะทําให้กระบวนการพัฒนาของคุณเรียบง่ายและปรับปรุงฟังก์ชั่นของแอพพลิเคชันของคุณ นอกจากนี้คุณยังสามารถใช้ห้องสมุด OCC สําหรับงาน OCDต่างๆรวมถึงการยอมรับข้อความใน Image และการประยุกต์ใช้ตัวอย่าง OCS เพื่อปรับแต่งโครงการของคุณได้มากขึ้น.

More in this category