
ในฐานะนักเขียนโปรแกรมคุณมักจะต้อง استخراجเนื้อหาจากไฟล์ PDF เป็นข้อความเรียบสําหรับการประมวลผลเพิ่มเติมเช่นการวิเคราะห์และการ استخراجข้อมูล การประมวลผลไฟล์ PDF และแปลงไฟล์ PDF ทั้งหมดเป็นรูปแบบ TXT เป็นงานที่ผิดปกติเมื่อคุณไม่มีเครื่องมือที่เหมาะสม ดังนั้นในบล็อกนี้เราจะสํารวจวิธีการแปลงไฟล์ PDF เป็นรูปแบบ TXT โดยโปรแกรมใน C#
C# Library for PDF to TXT การแปลง
[Aspose.Words for .NET][1] เป็น API การประมวลผลเอกสารที่น่าตื่นตาตื่นใจที่ช่วยให้ผู้พัฒนาสามารถทํางานกับเอกสาร Word เช่นเดียวกับรูปแบบอื่น ๆ รวมถึง PDF ด้วยคุณสมบัติที่กว้างขวาง Aspose.Words ช่วยให้การจัดการเอกสารการแปลงและการสร้างงานได้ง่าย เราจะใช้ห้องสมุดนี้เพื่อแปลงไฟล์ PDF เป็นรูปแบบ TXT ในแอพ .NET
คุณสามารถติดตั้งห้องสมุดจาก [NuGet][5] โดยใช้คําสั่งต่อไปนี้ หรือดาวน์โหลด DLL จากส่วน [Releases][6]
PM> Install-Package Aspose.Words
แปลงไฟล์ PDF ไปยัง TXT ใน C#
Aspose.Words for .NET ซ่อนทุกขั้นตอนที่ซับซ้อนของการสกัดข้อความจากไฟล์ PDF และช่วยให้คุณสามารถทําการแปลง PDF ไปยัง TXT ในขั้นตอนสองขั้นตอนตามที่กล่าวไว้ด้านล่าง
- ดาวน์โหลดไฟล์ PDF
- แปลงไฟล์ PDF ไปยังรูปแบบ TXT ด้วยการเรียกใช้ฟังก์ชั่นเดียว
ดังนั้นด้วยสายรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัดรัด
- ก่อนหน้านี้โหลดไฟล์ PDF โดยใช้คลาส Document
- จากนั้นบันทึกเอกสารเป็นไฟล์ TXT โดยใช้วิธีการ Document.Save(filePath)
รหัส C# ต่อไปนี้จะแปลงรูปแบบ PDF ไปยัง TXT
รับใบอนุญาต API ฟรี
คุณสามารถได้รับ [อิสระใบอนุญาตชั่วคราว][2] เพื่อแปลงไฟล์ PDF ไปยังรูปแบบ TXT โดยไม่ต้อง จํากัด การประเมิน
ข้อสรุป
ในโพสต์บล็อกนี้เราได้สํารวจวิธีการแปลง PDF ไปยัง TXT ใน C# โดยใช้ Aspose.Words สําหรับห้องสมุด .NET. ตามคําแนะนําและใช้รหัส snippet คุณสามารถประมวลผลไฟล์ PDF ขนาดใหญ่ได้อย่างง่ายดายและแปลงเป็นข้อความที่เรียบง่าย Aspose.Words ทําให้การประมวลผลเอกสารเป็นเครื่องมือที่มีค่าสําหรับนักพัฒนาที่ทํางานกับรูปแบบเอกสารต่างๆในแอพลิเคชันของพวกเขา คุณสามารถเยี่ยมชม [dokumentation][3] ของห้องสมุดประมวลผลคํา .NET นี้เพื่อสํารวจคุณสมบัติที่น่าตื่นเต้นของมัน ในกรณีที่คุณจะมีคําถามใด ๆ รู้สึกฟรีที่จะแจ้งให้เราทราบผ่าน [forum][4]