คู่มือ PDF ไฟล์เป็นที่นิยมเพราะพวกเขาสนับสนุนข้อความภาพภาพวิดีโอและบันทึกต่างๆ อย่างไรก็ตามสําหรับเอกสารจํานวนมากข้อความเป็นส่วนที่สําคัญที่สุด บทความนี้อธิบายวิธีการแปลงไฟล์ PDF ไปยังไฟล์ TXT และในทางกลับกันไฟล์TXT ไปเป็น PDF โดยใช้ C# .NET การแปลงนี้เป็นประโยชน์โดยเฉพาะอย่างยิ่งเมื่อคุณต้องการที่จะสกัดหรือมุ่งเน้นเฉพาะกับเนื้อหาข้อความของเอกลักษณ์ PDF เช่นการดําเนินการวิเคราะห์ข้อความหรือการเตรียมข้อมูลสําหรับการปรับปรุง
ธีมที่ครอบคลุมในคู่มือนี้รวมถึง:
- C# TXT ไปยัง PDF หรือ PDF ไปยัง TXT Converter API
- C# แปลงไฟล์ PDF ไปยัง TXT โดยไม่มีการจัดรูปแบบ
- แปลงไฟล์ PDF ไปยังไฟล์ TXT ด้วยการกําหนดค่า Routines โดยใช้ C# หรือ VB.NET
- แปลงไฟล์ TXT ไปยัง PDF โดยโปรแกรมใช้ C# หรือ VB.NET
เคล็ดลับ: คุณอาจมีความสนใจในฟรี หมายเลขรุ่น GIF Converter ซึ่งช่วยให้คุณสามารถสร้าง GIF ที่เคลื่อนไหวจากข้อความ
C# TXT ไปยัง PDF หรือ PDF ไปยัง TXT Converter
การแปลงระหว่างรูปแบบ PDF และ TXT เป็นสิ่งสําคัญเมื่อความสนใจหลักของคุณอยู่ในข้อมูลข้อความภายในเอกสาร ไม่ว่าคุณต้องลบรูปแบบทั้งหมดสําหรับการวิเคราะห์ข้อความเรียบง่ายหรือรักษาโครงสร้างบางอย่างกระบวนการสามารถทําได้โดยใช้ขั้นตอนง่ายๆ Aspose.PDF สําหรับ .NET API นี้มีความหลากหลายและสนับสนุนทั้ง C# และ VB.NET ทําให้ง่ายต่อการรวมเข้ากับแอพ .NET ของคุณ
ในการติดตั้ง API ในแอพของคุณคุณสามารถดาวน์โหลดไฟล์ DLL จาก ดาวน์โหลด หรือใช้ ปริศนา แกลเลอรี่ ตัวอย่างเช่นติดตั้งผ่านแพคเกจผู้จัดการคอนโซล:
PM> Install-Package Aspose.PDF
เมื่อ API ติดตั้งแล้วคุณสามารถเริ่มต้นกระบวนการแปลงด้วยวิธีการหลายวิธีที่กําหนดเองเพื่อความต้องการที่แตกต่างกัน
C# แปลงไฟล์ PDF ไปยัง TXT โดยไม่มีการจัดรูปแบบ
บางครั้งคุณเพียงแค่ต้องการข้อความดิบจากเอกสาร PDF โดยไม่มีการจัดรูปแบบเพิ่มเติม วิธีนี้จะสกัดข้อความตามที่ปรากฏในเอกสารโดยไม่มีการรักษาอักษรพื้นที่หรือรูปแบบ มันเป็นประโยชน์โดยเฉพาะอย่างยิ่งสําหรับการวิเคราะห์ข้อความการระบุการค้นหาหรือเมื่อการจัดรูปแบบไม่เกี่ยวข้อง
ขั้นตอนสําหรับการ استخراجข้อความดิบ
ดาวน์โหลดเอกสารป้อน PDF: ใช้ API เพื่อโหลดไฟล์ PDF ในวัตถุเอกสาร
เริ่มต้น StringBuilder: สร้างตัวอย่างของ StringBuilder คลาสเพื่อเก็บรวบรวมข้อมูลข้อความได้อย่างมีประสิทธิภาพ
จดหมายผ่านแต่ละหน้า PDF: ผ่านหน้าทั้งหมดในเอกสาร สําหรับแต่ละหน้า:
ใช้ วีดีโอ สําหรับการสกัดข้อความ
การจ้างงาน โหมด Raw เพื่อให้แน่ใจว่าการจัดรูปแบบไม่ใช้
บันทึกข้อความออก: เขียนข้อความที่รวบรวมไปยังไฟล์ TXT
การตัดรหัสด้านล่างแสดงให้เห็นวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT โดยใช้วิธีการสกัด Raw:
รายละเอียดเพิ่มเติม
- ประสิทธิภาพและความเรียบง่าย: การสกัดข้อความดิบมักจะเร็วขึ้นเพราะมันไม่ได้พยายามที่จะสกัดหรือใช้กฎการจัดรูปแบบใด ๆ
- กรณีที่ใช้: เหมาะสําหรับการ استخراجบันทึกการระบุการค้นหาหรือสถานการณ์ที่เนื้อหาข้อความเท่านั้นที่จําเป็น
แปลงไฟล์ PDF ไปยังไฟล์ TXT โดยใช้ C# หรือ VB.NET
ในสถานการณ์อื่น ๆ การรักษาการจัดรูปแบบของข้อความ (เช่น paragraphs, indentations, และ columns) เป็นสิ่งสําคัญ วิธีนี้ใช้การจัดรูปแบบแบบกําหนดเองเพื่อแสดงให้เห็นการจัดรูปแบบของเอกสารในไฟล์ TXT ที่เกิดขึ้น
ขั้นตอนสําหรับการ استخراجข้อความด้วยรูปแบบ
ดาวน์โหลดไฟล์ PDF Source: เช่นก่อนหน้านี้, ดาวน์โหลดเอกสาร PDF ในแอพลิเคชันของคุณ
เริ่มต้นการเปลี่ยนแปลง String: เตรียม string เพื่อรวบรวมการส่งออกข้อความแบบฟอร์ม
สกัดข้อความโดยใช้โหมดแบบฟอร์ม: สําหรับแต่ละหน้าใช้ TextFormattingMode.Pure ตัวเลือก โหมดนี้พยายามที่จะเล่นการจัดรูปแบบเดิมอย่างใกล้ชิดที่สุดเท่าที่เป็นไปได้
บันทึกข้อความแบบฟอร์ม: ส่งข้อความที่รวบรวมไปยังไฟล์ TXT ที่เก็บรวบรวมโครงสร้างเช่นแถบแถบแถบแถบแถบ
ตัวอย่างรหัสต่อไปนี้แสดงให้เห็นว่าวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT พร้อมรูปแบบข้อความโดยใช้ C#:
การเปรียบเทียบภาพของ RAW และ Pure Extraction
ภาพด้านล่างให้การเปรียบเทียบภาพของสองโหมดการสกัด ในด้านซ้ายข้อความ PDF จะปรากฏด้วยรูปแบบเดิม (โหมดบริสุทธิ์) ในขณะที่ด้านซ้ายจะแสดงข้อความดิบโดยไม่มีรูปแบบ การเปรียบเทียบนี้สามารถช่วยให้คุณตัดสินใจวิธีการที่เหมาะสมที่สุดกับความต้องการของคุณ

แปลงไฟล์ TXT ไปยัง PDF โดยโปรแกรมใช้ C# หรือ VB.NET
การแปลงไฟล์ TXT กลับเป็นไฟล์ PDF เป็นประโยชน์เมื่อคุณต้องการที่จะผลิตเอกสารที่ถูกโพสต์จากเนื้อหาข้อความเรียบ กระบวนการนี้รวมถึงการอ่านข้อความแล้วใช้รูปแบบ PDF เพื่อสร้างเอกสารที่ดูน่าสนใจและพร้อมสําหรับการกระจาย
ขั้นตอนสําหรับการแปลง TXT ไปยัง PDF
สร้าง Instance TextReader: ใช้ การอ่านข้อความ คลาสเพื่ออ่านเนื้อหาจากไฟล์ TXT
เริ่มต้นเอกสาร PDF ใหม่และเพิ่มหน้าสีขาว: สร้างตัวอย่างของ กระดาษ คลาสและเพิ่มหน้าใหม่
Instant a TextBuilder วัตถุ: ใช้ วีดีโอ สร้างบทความข้อความด้วยรูปแบบที่ต้องการเช่น font, ขนาดและสี
อ่านและเพิ่มแต่ละเส้นของข้อความ: ผ่านเส้นในไฟล์ TXT ป้ายเส้นแต่ละเส้นไปยังวัตถุ TextBuilder
บันทึกไฟล์ PDF : ใช้ การบันทึก (String) วิธีการในการเขียนไฟล์ PDF เสร็จสิ้นไปยังไดรฟ์
การตัดรหัสด้านล่างแสดงให้เห็นว่าวิธีการแปลงไฟล์ TXT ไปเป็นเอกสาร PDF โดยใช้ C#:
ความคิดเห็นเมื่อแปลง TXT ไปยัง PDF
- การจัดเรียงและสไตล์: คุณอาจต้องปรับ margin, line spacing, และคุณสมบัติข้อความอื่น ๆ เพื่อให้แน่ใจว่า PDF เป็นแบบฟอร์มดีและสามารถอ่านได้
- การจัดการข้อผิดพลาด: ใช้การตรวจสอบข้อผิดพลาดในระหว่างการอ่านและเขียนไฟล์เพื่อจัดการสถานการณ์เช่นปัญหาการเข้าถึงไฟล์หรือการเข้ารหัสข้อผิดพลาด
ข้อสรุป
ในบทความนี้เราแสดงให้เห็นถึงเทคนิคการแปลงไฟล์ PDF ไปยังไฟล์ TXT และ PDF โดยใช้ C# หรือ VB.NET ใน .NET Framework ไม่ว่าคุณเลือกการสกัดข้อความดิบเพื่อความเร็วและความเรียบง่ายหรือต้องการข้อความแบบฟอร์มเพื่อรักษาโครงสร้างเอกสาร Aspose.PDF สําหรับ .NET API มีโซลูชั่นที่เชื่อถือได้และมีความยืดหยุ่น วิธีการแปลงเหล่านี้ไม่คุ้มค่าสําหรับการประมวลผลข้อมูลการจัดเก็บเอกสารและการสร้างเนื้อหา
หากคุณมีคําถามหรือต้องการความช่วยเหลือเพิ่มเติมโปรดเยี่ยมชมของเรา โพสต์การสนับสนุนฟรี หรือตรวจสอบ ผลิตภัณฑ์เอกสาร.