คู่มือ PDF ไฟล์เป็นที่นิยมเพราะพวกเขาสนับสนุนข้อความภาพภาพวิดีโอและบันทึกต่างๆ อย่างไรก็ตามสําหรับเอกสารจํานวนมากข้อความเป็นส่วนที่สําคัญที่สุด บทความนี้อธิบายวิธีการแปลงไฟล์ PDF ไปยังไฟล์ TXT และในทางกลับกันไฟล์TXT ไปเป็น PDF โดยใช้ C# .NET การแปลงนี้เป็นประโยชน์โดยเฉพาะอย่างยิ่งเมื่อคุณต้องการที่จะสกัดหรือมุ่งเน้นเฉพาะกับเนื้อหาข้อความของเอกลักษณ์ PDF เช่นการดําเนินการวิเคราะห์ข้อความหรือการเตรียมข้อมูลสําหรับการปรับปรุง

ธีมที่ครอบคลุมในคู่มือนี้รวมถึง:

เคล็ดลับ: คุณอาจมีความสนใจในฟรี หมายเลขรุ่น GIF Converter ซึ่งช่วยให้คุณสามารถสร้าง GIF ที่เคลื่อนไหวจากข้อความ

C# TXT ไปยัง PDF หรือ PDF ไปยัง TXT Converter

การแปลงระหว่างรูปแบบ PDF และ TXT เป็นสิ่งสําคัญเมื่อความสนใจหลักของคุณอยู่ในข้อมูลข้อความภายในเอกสาร ไม่ว่าคุณต้องลบรูปแบบทั้งหมดสําหรับการวิเคราะห์ข้อความเรียบง่ายหรือรักษาโครงสร้างบางอย่างกระบวนการสามารถทําได้โดยใช้ขั้นตอนง่ายๆ Aspose.PDF สําหรับ .NET API นี้มีความหลากหลายและสนับสนุนทั้ง C# และ VB.NET ทําให้ง่ายต่อการรวมเข้ากับแอพ .NET ของคุณ

ในการติดตั้ง API ในแอพของคุณคุณสามารถดาวน์โหลดไฟล์ DLL จาก ดาวน์โหลด หรือใช้ ปริศนา แกลเลอรี่ ตัวอย่างเช่นติดตั้งผ่านแพคเกจผู้จัดการคอนโซล:

PM> Install-Package Aspose.PDF

เมื่อ API ติดตั้งแล้วคุณสามารถเริ่มต้นกระบวนการแปลงด้วยวิธีการหลายวิธีที่กําหนดเองเพื่อความต้องการที่แตกต่างกัน

C# แปลงไฟล์ PDF ไปยัง TXT โดยไม่มีการจัดรูปแบบ

บางครั้งคุณเพียงแค่ต้องการข้อความดิบจากเอกสาร PDF โดยไม่มีการจัดรูปแบบเพิ่มเติม วิธีนี้จะสกัดข้อความตามที่ปรากฏในเอกสารโดยไม่มีการรักษาอักษรพื้นที่หรือรูปแบบ มันเป็นประโยชน์โดยเฉพาะอย่างยิ่งสําหรับการวิเคราะห์ข้อความการระบุการค้นหาหรือเมื่อการจัดรูปแบบไม่เกี่ยวข้อง

ขั้นตอนสําหรับการ استخراجข้อความดิบ

  • ดาวน์โหลดเอกสารป้อน PDF: ใช้ API เพื่อโหลดไฟล์ PDF ในวัตถุเอกสาร

  • เริ่มต้น StringBuilder: สร้างตัวอย่างของ StringBuilder คลาสเพื่อเก็บรวบรวมข้อมูลข้อความได้อย่างมีประสิทธิภาพ

  • จดหมายผ่านแต่ละหน้า PDF: ผ่านหน้าทั้งหมดในเอกสาร สําหรับแต่ละหน้า:

  • ใช้ วีดีโอ สําหรับการสกัดข้อความ

  • การจ้างงาน โหมด Raw เพื่อให้แน่ใจว่าการจัดรูปแบบไม่ใช้

  • บันทึกข้อความออก: เขียนข้อความที่รวบรวมไปยังไฟล์ TXT

การตัดรหัสด้านล่างแสดงให้เห็นวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT โดยใช้วิธีการสกัด Raw:

รายละเอียดเพิ่มเติม

  • ประสิทธิภาพและความเรียบง่าย: การสกัดข้อความดิบมักจะเร็วขึ้นเพราะมันไม่ได้พยายามที่จะสกัดหรือใช้กฎการจัดรูปแบบใด ๆ
  • กรณีที่ใช้: เหมาะสําหรับการ استخراجบันทึกการระบุการค้นหาหรือสถานการณ์ที่เนื้อหาข้อความเท่านั้นที่จําเป็น

แปลงไฟล์ PDF ไปยังไฟล์ TXT โดยใช้ C# หรือ VB.NET

ในสถานการณ์อื่น ๆ การรักษาการจัดรูปแบบของข้อความ (เช่น paragraphs, indentations, และ columns) เป็นสิ่งสําคัญ วิธีนี้ใช้การจัดรูปแบบแบบกําหนดเองเพื่อแสดงให้เห็นการจัดรูปแบบของเอกสารในไฟล์ TXT ที่เกิดขึ้น

ขั้นตอนสําหรับการ استخراجข้อความด้วยรูปแบบ

  • ดาวน์โหลดไฟล์ PDF Source: เช่นก่อนหน้านี้, ดาวน์โหลดเอกสาร PDF ในแอพลิเคชันของคุณ

  • เริ่มต้นการเปลี่ยนแปลง String: เตรียม string เพื่อรวบรวมการส่งออกข้อความแบบฟอร์ม

  • สกัดข้อความโดยใช้โหมดแบบฟอร์ม: สําหรับแต่ละหน้าใช้ TextFormattingMode.Pure ตัวเลือก โหมดนี้พยายามที่จะเล่นการจัดรูปแบบเดิมอย่างใกล้ชิดที่สุดเท่าที่เป็นไปได้

  • บันทึกข้อความแบบฟอร์ม: ส่งข้อความที่รวบรวมไปยังไฟล์ TXT ที่เก็บรวบรวมโครงสร้างเช่นแถบแถบแถบแถบแถบ

ตัวอย่างรหัสต่อไปนี้แสดงให้เห็นว่าวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT พร้อมรูปแบบข้อความโดยใช้ C#:

การเปรียบเทียบภาพของ RAW และ Pure Extraction

ภาพด้านล่างให้การเปรียบเทียบภาพของสองโหมดการสกัด ในด้านซ้ายข้อความ PDF จะปรากฏด้วยรูปแบบเดิม (โหมดบริสุทธิ์) ในขณะที่ด้านซ้ายจะแสดงข้อความดิบโดยไม่มีรูปแบบ การเปรียบเทียบนี้สามารถช่วยให้คุณตัดสินใจวิธีการที่เหมาะสมที่สุดกับความต้องการของคุณ

Convert PDF TXT csharp

แปลงไฟล์ TXT ไปยัง PDF โดยโปรแกรมใช้ C# หรือ VB.NET

การแปลงไฟล์ TXT กลับเป็นไฟล์ PDF เป็นประโยชน์เมื่อคุณต้องการที่จะผลิตเอกสารที่ถูกโพสต์จากเนื้อหาข้อความเรียบ กระบวนการนี้รวมถึงการอ่านข้อความแล้วใช้รูปแบบ PDF เพื่อสร้างเอกสารที่ดูน่าสนใจและพร้อมสําหรับการกระจาย

ขั้นตอนสําหรับการแปลง TXT ไปยัง PDF

  • สร้าง Instance TextReader: ใช้ การอ่านข้อความ คลาสเพื่ออ่านเนื้อหาจากไฟล์ TXT

  • เริ่มต้นเอกสาร PDF ใหม่และเพิ่มหน้าสีขาว: สร้างตัวอย่างของ กระดาษ คลาสและเพิ่มหน้าใหม่

  • Instant a TextBuilder วัตถุ: ใช้ วีดีโอ สร้างบทความข้อความด้วยรูปแบบที่ต้องการเช่น font, ขนาดและสี

  • อ่านและเพิ่มแต่ละเส้นของข้อความ: ผ่านเส้นในไฟล์ TXT ป้ายเส้นแต่ละเส้นไปยังวัตถุ TextBuilder

  • บันทึกไฟล์ PDF : ใช้ การบันทึก (String) วิธีการในการเขียนไฟล์ PDF เสร็จสิ้นไปยังไดรฟ์

การตัดรหัสด้านล่างแสดงให้เห็นว่าวิธีการแปลงไฟล์ TXT ไปเป็นเอกสาร PDF โดยใช้ C#:

ความคิดเห็นเมื่อแปลง TXT ไปยัง PDF

  • การจัดเรียงและสไตล์: คุณอาจต้องปรับ margin, line spacing, และคุณสมบัติข้อความอื่น ๆ เพื่อให้แน่ใจว่า PDF เป็นแบบฟอร์มดีและสามารถอ่านได้
  • การจัดการข้อผิดพลาด: ใช้การตรวจสอบข้อผิดพลาดในระหว่างการอ่านและเขียนไฟล์เพื่อจัดการสถานการณ์เช่นปัญหาการเข้าถึงไฟล์หรือการเข้ารหัสข้อผิดพลาด

ข้อสรุป

ในบทความนี้เราแสดงให้เห็นถึงเทคนิคการแปลงไฟล์ PDF ไปยังไฟล์ TXT และ PDF โดยใช้ C# หรือ VB.NET ใน .NET Framework ไม่ว่าคุณเลือกการสกัดข้อความดิบเพื่อความเร็วและความเรียบง่ายหรือต้องการข้อความแบบฟอร์มเพื่อรักษาโครงสร้างเอกสาร Aspose.PDF สําหรับ .NET API มีโซลูชั่นที่เชื่อถือได้และมีความยืดหยุ่น วิธีการแปลงเหล่านี้ไม่คุ้มค่าสําหรับการประมวลผลข้อมูลการจัดเก็บเอกสารและการสร้างเนื้อหา

หากคุณมีคําถามหรือต้องการความช่วยเหลือเพิ่มเติมโปรดเยี่ยมชมของเรา โพสต์การสนับสนุนฟรี หรือตรวจสอบ ผลิตภัณฑ์เอกสาร.

ดูเพิ่มเติม

More in this category