
ไฟล์ PDF เป็นสิ่งสําคัญในกระบวนการธุรกิจจํานวนมากมักจะต้องเข้าถึงการสแกนเนื้อหาของพวกเขา การสกปรกข้อความจากไฟล์ pdf ที่สกรีนอาจเป็นเรื่องยากเน้นความต้องการของเครื่องมือที่มีประสิทธิภาพ ในบทเรียนนี้เราจะสํารวจ วิธีการที่จะ OCR เอกสาร PDF และสกัดข้อความจากการ PDF ใน C# โดยใช้ที่เชื่อถือได Aspose.OCR สําหรับ API .NET, หลัก C# OCR PDF สารสกัดห้องสมุด สามารถใช้ได้สําหรับการประเมินฟร.
สิ่งที่คุณจะเรียนร
ในบทความนี้เราจะครอบคลุมหัวข้อต่อไปน:
- รายละเอียดของ Aspose.OCR สําหรับ API .NET
- ขั้นตอนไป OCR PDF และสกัดข้อความ
- วิธีการดําเนินการ OCR บน PDF และบันทึกข้อความ
- การแปลง OCR PDF ไปยัง Word
- การแปลง OCR PDF ไปยัง JSON
รีวิว Aspose.OCR สําหรับ API .NET
เราจะใช Aspose.OCR สําหรับ API .NET, .
ปลั๊กไฟประกอบด้วย AsposeOcr ประเภทซึ่งให้วิธีการหลายสําหรับการดําเนินงาน OCR หมายความว่า RecognizePdf(String, DocumentRecognitionSettings) วิธีการเป็นสิ่งสําคัญสําหรับการสกัดข้อความจากเอกสาร PDF ที่กําหนด DocumentRecognitionSettings คลาสช่วยให้การปรับแต่งของกระบวนการรับรู้ในขณะท RecognitionResult คลาส encapsulates ผลของการรับร.
คุณสามารถ ดาวน์โหลด DLL ของ API หรือติดตั้งผ่าน NuGet:
PM> Install-Package Aspose.OCR
ขั้นตอนไป OCR PDF และสกัดข้อความใน C#
เพื่อดําเนินการ OCR บนเอกสาร PDF และสกัดข้อความที่ได้รับการยอมรับทําตามขั้นตอนต่อไปน:
- สร้างตัวอย่างของคลาส AsposeOcr.
- เริ่มต้นวัตถุในหมวดหมู่ DocumentRecognitionSettings.
- รายละเอียดภาษาสําหรับ OCR.
- รับ RecognitionResult โดยการเรียกใช้ Pdf() วิธีการผ่านเส้นทางภาพและ DocumentRecognitionSettings วัตถ.
- ผ่านรายการ RecognitionResult เพื่อแสดงข้อความที่ระบุไว.
นี่คือตัวอย่างที่แสดงให้เห็น วิธีการเข้าถึงเอกสาร PDF OCR และสกัดข้อความที่ได้รับการยอมรับใน C#:
OCR PDF และสกัดข้อความจาก PDF ใน C#
วิธีการดําเนินการ OCR บน PDF และบันทึกข้อความใน C#
เพื่อดําเนินการ OCR บนเอกสาร PDF และบันทึกข้อความที่ได้รับการยอมรับทําตามขั้นตอนต่อไปน:
- สร้างตัวอย่างของคลาส AsposeOcr.
- เริ่มต้นวัตถุในหมวดหมู่ DocumentRecognitionSettings.
- รายละเอียดภาษาสําหรับ OCR.
- ติดต่อ RecognizePdf() เพื่อรับ RecognitionResult.
- การบันทึกข้อความโดยใช้วิธีการ SaveMultipageDocument() ซึ่งต้องใช้เส้นทางไฟล์ออก SaveFormat, และ The RecognitionResult วัตถ.
นี่คือตัวอย่างที่แสดงให้เห็น วิธีการเข้าถึงเอกสาร OCR PDF และบันทึกข้อความที่ได้รับการยอมรับใน C#:
ทํา OCR บน PDF และบันทึกข้อความใน C#
การแปลง OCR PDF ไปยัง Word ใน C#
เพื่อแปลงเอกสาร PDF ที่สแกนเป็น Word ทําตามขั้นตอนเดียวกันที่ระบุไว้ก่อนหน้านี้ แต่ระบุ SaveFormat.Docx ในขั้นตอนสุดท้าย.
นี่คือตัวอย่างที่แสดงให้เห็น วิธีการ OCR PDF และบันทึกข้อความที่ได้รับการยอมรับเป็นเอกสาร Word ใน C#:
OCR PDF และแปลงสแกน PDF ไปยัง Word ใน C#
การแปลง OCR PDF ไปยัง JSON ใน C#
เพื่อบันทึกข้อความที่ได้รับการยอมรับจากเอกสาร PDF ในไฟล์ JSON โปรดทําตามขั้นตอนก่อนหน้านี้ด้วยการเปลี่ยนแปลงเท่านั้นเพื่อระบุ SaveFormat.Json ในขั้นตอนสุดท้าย.
นี่คือตัวอย่างที่แสดงให้เห็น วิธีการ OCR PDF และบันทึกข้อความที่ได้รับการยอมรับเป็นไฟล์ JSON ใน C#:
รับใบอนุญาตการประเมินฟร
คุณสามารถ รับใบอนุญาตชั่วคราวฟร เพื่อประเมิน Aspose.OCR สําหรับ API .NET โดยไม่มีข้อ จํากัด.
ข้อสรุป
ในบทเรียนนี้เราได้เรียนรู้วิธีการดําเนินการ OCR บนเอกสาร PDF และสกัดข้อความจาก PDF ใน C# นอกจากนี้เรายังสํารวจวิธีการบันทึกข้อความที่ได้รับการยอมรับเป็น TXT, DOCX, และ JSON สําหรับข้อมูลเพิ่มเติมเกี่ยวกับ Aspose.OCR สําหรับ API .NET โปรดดูท การรับรอง. หากคุณมีคําถามใด ๆ รู้สึกอิสระที่จะมาถึงเราบนเว็บไซต์ของเรา โพสต.
ดูเพิ่มเติม
- แปลงภาพหน้าจอเป็นข้อความด้วย OCR ใน C#
- OCR Image to Text and Spelling Correction ใน C#
- แปลงไฟล์ PDF ที่สแกนเป็นไฟล์ PDF ที่สามารถค้นหาได้ด้วย OCR ใน C#
โดยใช้ Aspose.OCR สําหรับ API .NET คุณสามารถนําไปใช้ความแม่นยําสูง PDF OCR ใน C# สําหรับแอพต่างๆรวมถึงการประมวลผลและจัดการแบบฟอร์ม C# Ocr Invoice โซลูชันนี้ เป็นไปได้สําหรับผู้พัฒนาที่ต้องการที่จะรวมความสามารถ OCR PDF เข้ากับแอปพลิเคชันของพวกเขาได้อย่างมีประสิทธิภาพ ด้วยห้องสมุด C # สําหรับ O CR PDF และสกัดข้อความคุณสามารถให้ผลลัพธ์ที่ถูกต้องในโครงการของคุณได.
นอกจากนี้ถ้าคุณต้องการแปลง PDF ไปยังข้อความใน C# API นี้ให้โซลูชันที่เรียบง่าย สําหรับผู้ที่สนใจใน C# OCR PDF เพื่อข้อความ ความสามารถการบูรณาการนั้นไร้รอยต่อซึ่งช่วยให้การสกัดข้อความได้อย่างมีประสิทธิภาพจากรูปแบบเอกสารต่างๆ คุณยังสามารถใช้ฟังก์ชั่นการแปลง C# PDF เป็นข้อความ เพื่อจัดการได้อย่างง่ายดายกับการสกปรกข้อความจาก PDF ทําให้กระบวนการพัฒนาของคุณราบรื่นขึ้น.
หากคุณกําลังมองหา Aspose OCR C# ตัวอย่าง คู่มือนี้ให้บริการเป็นทรัพยากรที่ครอบคลุม นอกจากนี้สําหรับงานที่ซับซ้อนเช่นการใช้ C# API เคล็ดลับนี้รวมถึงองค์ประกอบที่สําคัญทั้งหมดที่จําเป็นในการเริ่มต้นได้อย่างมีประสิทธิภาพ นอกจากนี้หากคุณต้องการ สกัดข้อความจาก PDF โดยใช้ C # คุณสมบัติของ API ของ ASPOSO จะปรับปรุงการทํางานของคุณอย่างมีนัยสําคัญ.
สําหรับผู้ที่ต้องการ ประเมิน SDK PDF และซอฟต์แวร์การประมวลผลเอกสาร Aspose บน OCR PDF SDk คู่มือนี้เป็นจุดเริ่มต้นที่ยอดเยี่ยมในการเข้าใจความสามารถของมัน ไม่ว่าคุณต้องใช้ C# oCR DLL สําหรับการบูรณาการหรือคําแนะนํา c # ocr คืนมือ คุณจะพบทุกสิ่งที่คุณต้องการที่จะใช้ API ในโครงการของคุณได้อย่างมีประสิทธิภาพ.
นอกจากนี้ถ้าคุณต้องการใช้การรับรู้ข้อความ C# หรือใช้ห้องสมุด OCR สําหรับแอพต่างๆคุณสามารถสํารวจคุณสมบัติที่ Aspose มีเพื่อสนับสนุนฟังก์ชั่นเหล่านี้ การประเมิน SDK PDF เป็นโอกาสที่ยอดเยี่ยมในการทดลองกับความสามารถของตารางนี้เพื่อให้แน่ใจว่าคุณจะพบโซลูชั่นที่เหมาะสมสําหรับความต้องการของคุณ.
สุดท้ายถ้าคุณต้องการ การสกัดข้อความจาก PDF ใน C# หรือใช้ API OCR C # คุณสมบัติของ C# O CR PDF ที่ใช้จะทําให้กระบวนการพัฒนาของคุณเรียบง่ายและปรับปรุงฟังก์ชั่นของแอพพลิเคชันของคุณ นอกจากนี้คุณยังสามารถใช้ห้องสมุด OCC สําหรับงาน OCDต่างๆรวมถึงการยอมรับข้อความใน Image และการประยุกต์ใช้ตัวอย่าง OCS เพื่อปรับแต่งโครงการของคุณได้มากขึ้น.