คู่มือ PDF ไฟล์เป็นที่นิยมเพราะพวกเขาสนับสนุนข้อความภาพภาพวิดีโอและบันทึกต่างๆ อย่างไรก็ตามสําหรับเอกสารจํานวนมากข้อความเป็นส่วนที่สําคัญที่สุด บทความนี้อธิบายวิธีการแปลงไฟล์ PDF ไปยังไฟล์ TXT และในทางกลับกันไฟล์TXT ไปเป็น PDF โดยใช้ C# .NET การแปลงนี้เป็นประโยชน์โดยเฉพาะอย่างยิ่งเมื่อคุณต้องการที่จะสกัดหรือมุ่งเน้นเฉพาะกับเนื้อหาข้อความของเอกลักษณ์ PDF เช่นการดําเนินการวิเคราะห์ข้อความหรือการเตรียมข้อมูลสําหรับการปรับปรุง.
ธีมที่ครอบคลุมในคู่มือนี้รวมถึง:
- C# TXT ไปยัง PDF หรือ PDF ไปยัง TXT Converter API
- C# แปลงไฟล์ PDF ไปยัง TXT โดยไม่มีการจัดรูปแบบ
- แปลงไฟล์ PDF ไปยังไฟล์ TXT ด้วยการกําหนดค่า Routines โดยใช้ C# หรือ VB.NET
- แปลงไฟล์ TXT ไปยัง PDF โดยโปรแกรมใช้ C# หรือ VB.NET
เคล็ดลับ: คุณอาจมีความสนใจในฟร หมายเลขรุ่น GIF Converter ซึ่งช่วยให้คุณสามารถสร้าง GIF ที่เคลื่อนไหวจากข้อความ.
C# TXT ไปยัง PDF หรือ PDF ไปยัง TXT Converter
การแปลงระหว่างรูปแบบ PDF และ TXT เป็นสิ่งสําคัญเมื่อความสนใจหลักของคุณอยู่ในข้อมูลข้อความภายในเอกสาร ไม่ว่าคุณต้องลบรูปแบบทั้งหมดสําหรับการวิเคราะห์ข้อความเรียบง่ายหรือรักษาโครงสร้างบางอย่างกระบวนการสามารถทําได้โดยใช้ขั้นตอนง่ายๆ Aspose.PDF สําหรับ .NET API นี้มีความหลากหลายและสนับสนุนทั้ง C# และ VB.NET ทําให้ง่ายต่อการรวมเข้ากับแอพ .NET ของคุณ.
ในการติดตั้ง API ในแอพของคุณคุณสามารถดาวน์โหลดไฟล์ DLL จาก ดาวน์โหลด หรือใช NuGet แกลเลอรี่ ตัวอย่างเช่นติดตั้งผ่านแพคเกจผู้จัดการคอนโซล:
PM> Install-Package Aspose.PDF
เมื่อ API ติดตั้งแล้วคุณสามารถเริ่มต้นกระบวนการแปลงด้วยวิธีการหลายวิธีที่กําหนดเองเพื่อความต้องการที่แตกต่างกัน.
C# แปลงไฟล์ PDF ไปยัง TXT โดยไม่มีการจัดรูปแบบ
บางครั้งคุณเพียงแค่ต้องการข้อความดิบจากเอกสาร PDF โดยไม่มีการจัดรูปแบบเพิ่มเติม วิธีนี้จะสกัดข้อความตามที่ปรากฏในเอกสารโดยไม่มีการรักษาอักษรพื้นที่หรือรูปแบบ มันเป็นประโยชน์โดยเฉพาะอย่างยิ่งสําหรับการวิเคราะห์ข้อความการระบุการค้นหาหรือเมื่อการจัดรูปแบบไม่เกี่ยวข้อง.
ขั้นตอนสําหรับการ استخراجข้อความดิบ
ดาวน์โหลดเอกสารป้อน PDF: ใช้ API เพื่อโหลดไฟล์ PDF ในวัตถุเอกสาร.
เริ่มต้น StringBuilder: สร้างตัวอย่างของ StringBuilder คลาสเพื่อเก็บรวบรวมข้อมูลข้อความได้อย่างมีประสิทธิภาพ.
จดหมายผ่านแต่ละหน้า PDF: ผ่านหน้าทั้งหมดในเอกสาร สําหรับแต่ละหน้า:
ใช TextDevice สําหรับการสกัดข้อความ.
การจ้างงาน โหมด Raw เพื่อให้แน่ใจว่าการจัดรูปแบบไม่ใช.
บันทึกข้อความออก: เขียนข้อความที่รวบรวมไปยังไฟล์ TXT.
การตัดรหัสด้านล่างแสดงให้เห็นวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT โดยใช้วิธีการสกัด Raw:
รายละเอียดเพิ่มเติม
- ประสิทธิภาพและความเรียบง่าย: การสกัดข้อความดิบมักจะเร็วขึ้นเพราะมันไม่ได้พยายามที่จะสกัดหรือใช้กฎการจัดรูปแบบใด ๆ.
- กรณีที่ใช: เหมาะสําหรับการ استخراجบันทึกการระบุการค้นหาหรือสถานการณ์ที่เนื้อหาข้อความเท่านั้นที่จําเป็น.
แปลงไฟล์ PDF ไปยังไฟล์ TXT โดยใช้ C# หรือ VB.NET
ในสถานการณ์อื่น ๆ การรักษาการจัดรูปแบบของข้อความ (เช่น paragraphs, indentations, และ columns) เป็นสิ่งสําคัญ วิธีนี้ใช้การจัดรูปแบบแบบกําหนดเองเพื่อแสดงให้เห็นการจัดรูปแบบของเอกสารในไฟล์ TXT ที่เกิดขึ้น.
ขั้นตอนสําหรับการ استخراجข้อความด้วยรูปแบบ
ดาวน์โหลดไฟล์ PDF Source: เช่นก่อนหน้านี้, ดาวน์โหลดเอกสาร PDF ในแอพลิเคชันของคุณ.
เริ่มต้นการเปลี่ยนแปลง String: เตรียม string เพื่อรวบรวมการส่งออกข้อความแบบฟอร์ม.
สกัดข้อความโดยใช้โหมดแบบฟอร์ม: สําหรับแต่ละหน้าใช TextFormattingMode.Pure ตัวเลือก โหมดนี้พยายามที่จะเล่นการจัดรูปแบบเดิมอย่างใกล้ชิดที่สุดเท่าที่เป็นไปได.
บันทึกข้อความแบบฟอร์ม: ส่งข้อความที่รวบรวมไปยังไฟล์ TXT ที่เก็บรวบรวมโครงสร้างเช่นแถบแถบแถบแถบแถบ.
ตัวอย่างรหัสต่อไปนี้แสดงให้เห็นว่าวิธีการแปลงไฟล์ PDF ไปเป็นไฟล์ TXT พร้อมรูปแบบข้อความโดยใช้ C#:
การเปรียบเทียบภาพของ RAW และ Pure Extraction
ภาพด้านล่างให้การเปรียบเทียบภาพของสองโหมดการสกัด ในด้านซ้ายข้อความ PDF จะปรากฏด้วยรูปแบบเดิม (โหมดบริสุทธิ์) ในขณะที่ด้านซ้ายจะแสดงข้อความดิบโดยไม่มีรูปแบบ การเปรียบเทียบนี้สามารถช่วยให้คุณตัดสินใจวิธีการที่เหมาะสมที่สุดกับความต้องการของคุณ.

แปลงไฟล์ TXT ไปยัง PDF โดยโปรแกรมใช้ C# หรือ VB.NET
การแปลงไฟล์ TXT กลับเป็นไฟล์ PDF เป็นประโยชน์เมื่อคุณต้องการที่จะผลิตเอกสารที่ถูกโพสต์จากเนื้อหาข้อความเรียบ กระบวนการนี้รวมถึงการอ่านข้อความแล้วใช้รูปแบบ PDF เพื่อสร้างเอกสารที่ดูน่าสนใจและพร้อมสําหรับการกระจาย.
ขั้นตอนสําหรับการแปลง TXT ไปยัง PDF
สร้าง Instance TextReader: ใช TextReader คลาสเพื่ออ่านเนื้อหาจากไฟล์ TXT.
เริ่มต้นเอกสาร PDF ใหม่และเพิ่มหน้าสีขาว: สร้างตัวอย่างของ กระดาษ คลาสและเพิ่มหน้าใหม.
Instant a TextBuilder วัตถ: ใช TextBuilder สร้างบทความข้อความด้วยรูปแบบที่ต้องการเช่น font, ขนาดและส.
อ่านและเพิ่มแต่ละเส้นของข้อความ: ผ่านเส้นในไฟล์ TXT ป้ายเส้นแต่ละเส้นไปยังวัตถุ TextBuilder.
บันทึกไฟล์ PDF: ใช การบันทึก (String) วิธีการในการเขียนไฟล์ PDF เสร็จสิ้นไปยังไดรฟ.
การตัดรหัสด้านล่างแสดงให้เห็นว่าวิธีการแปลงไฟล์ TXT ไปเป็นเอกสาร PDF โดยใช้ C#:
ความคิดเห็นเมื่อแปลง TXT ไปยัง PDF
- การจัดเรียงและสไตล: คุณอาจต้องปรับ margin, line spacing, และคุณสมบัติข้อความอื่น ๆ เพื่อให้แน่ใจว่า PDF เป็นแบบฟอร์มดีและสามารถอ่านได.
- การจัดการข้อผิดพลาด: ใช้การตรวจสอบข้อผิดพลาดในระหว่างการอ่านและเขียนไฟล์เพื่อจัดการสถานการณ์เช่นปัญหาการเข้าถึงไฟล์หรือการเข้ารหัสข้อผิดพลาด.
ข้อสรุป
ในบทความนี้เราแสดงให้เห็นถึงเทคนิคการแปลงไฟล์ PDF ไปยังไฟล์ TXT และ PDF โดยใช้ C# หรือ VB.NET ใน .NET Framework ไม่ว่าคุณเลือกการสกัดข้อความดิบเพื่อความเร็วและความเรียบง่ายหรือต้องการข้อความแบบฟอร์มเพื่อรักษาโครงสร้างเอกสาร Aspose.PDF สําหรับ .NET API มีโซลูชั่นที่เชื่อถือได้และมีความยืดหยุ่น วิธีการแปลงเหล่านี้ไม่คุ้มค่าสําหรับการประมวลผลข้อมูลการจัดเก็บเอกสารและการสร้างเนื้อหา.
หากคุณมีคําถามหรือต้องการความช่วยเหลือเพิ่มเติมโปรดเยี่ยมชมของเรา โพสต์การสนับสนุนฟร หรือตรวจสอบ ผลิตภัณฑ์เอกสาร.