PDF file populer karena mereka mendukung teks, gambar, animasi, video, dan berbagai catatan.Tetapi, untuk banyak dokumen, teks adalah bagian yang paling penting.Artikel ini menjelaskan bagaimana untuk mengkonversi file PDF ke file TXT dan, sebaliknya, file tXT ke PDF menggunakan C# .NET.Konversi ini sangat berguna ketika Anda perlu mengekstrak atau fokus hanya pada konten teks dari dokumen PDF, seperti ketika melakukan analisis teks atau mempersiapkan konten untuk pembaharuan.
Topik yang ditutupi dalam panduan ini termasuk:
- C# TXT ke PDF atau PDF ke TXT Converter API
- C# Konversi PDF ke TXT tanpa Format
- Konversi PDF ke TXT File dengan Formatting Routines menggunakan C# atau VB.NET
- Konversi file TXT ke PDF dengan menggunakan C# atau VB.NET
Tip: Anda mungkin juga tertarik dengan gratis Menggunakan GIF Converter yang memungkinkan Anda untuk menghasilkan GIF animasi dari teks.
C# TXT ke PDF atau PDF ke TXT Converter
Konversi antara format PDF dan TXT adalah penting ketika minat utama Anda terletak pada data teks di dalam dokumen. Apakah Anda perlu mengalih keluar semua format untuk analisis teks sederhana atau menyimpan beberapa tata letak yang terstruktur, proses ini dapat diselesaikan dengan beberapa langkah sederhana menggunakan Aspose.PDF untuk .NET API ini beragam dan mendukung C# dan VB.NET, menjadikannya mudah untuk mengintegrasikan ke aplikasi .NET Anda.
Untuk menginstal API di aplikasi Anda, Anda dapat mengunduh file DLL dari Downloads Atau gunakan yang NUGET Misalnya, Anda dapat menginstalnya melalui Package Manager Console:
PM> Install-Package Aspose.PDF
Setelah API dipasang, Anda dapat memulai proses konversi dengan beberapa pendekatan yang disesuaikan dengan kebutuhan yang berbeda.
C# Konversi PDF ke TXT tanpa Format
Kadang-kadang, Anda hanya perlu teks mentah dari dokumen PDF tanpa pemformatan tambahan. metode ini mengekstrak teks seperti yang ditunjukkan dalam dokumen, tanpa menyimpan fon, ruang, atau gaya. ini sangat berguna untuk analisis teks, indeks pencarian, atau ketika tataletak tidak relevan.
Langkah-langkah untuk ekstraksi teks mentah
Mengunggah Input Dokumen PDF: Gunakan API untuk memuat file PDF ke dalam objek Dokumen.
Memulai sebuah StringBuilder: Mencipta contoh dari StringBuilder Kelas untuk mengumpulkan data teks secara efektif.
Iterate melalui setiap halaman PDF: Berjalan melalui semua halaman dalam dokumen. untuk setiap halaman:
Penggunaan TextDevice untuk mengekstrak teks.
Mengupah yang Modus Raw untuk memastikan bahwa format tidak diterapkan.
Menyimpan teks output: Tuliskan teks terkumpul ke file TXT.
Snippet kode di bawah ini menggambarkan bagaimana untuk menukar PDF ke file TXT menggunakan metode ekstraksi Raw:
Insight tambahan
- Kesederhanaan dan kesederhanaan : Ekstraksi teks mentah biasanya lebih cepat karena ia tidak mencoba untuk merusak atau menerapkan aturan pemformatan apa pun.
- Menggunakan kasus : Ideal untuk ekstraksi log, indeks pencarian, atau skenario di mana hanya konten teks diperlukan.
Konversi PDF ke TXT File dengan Formatting Routines menggunakan C# atau VB.NET
Dalam skenario lain, mempertahankan pemformatan teks (seperti paragraf, indentasi, dan kolom) adalah penting. metode ini digunakan untuk pemformatan rutin untuk mencerminkan tata letak dokumen dalam file TXT yang dihasilkan.
Langkah-langkah untuk Extraction dengan Formatting
Mengunggah file PDF Sumber: Seperti sebelumnya, muat dokumen PDF ke aplikasi Anda.
Memulai variabel string: Siapkan string untuk mengumpulkan output teks yang diformat.
Mengekstrak teks menggunakan format mode: Untuk setiap halaman, gunakan Perbedaan dengan TextFormattingMode.Pure Mode ini mencoba untuk memodifikasi format asli secepat mungkin.
Menyimpan teks yang terformat: Keluarkan teks yang dikumpulkan ke file TXT yang mempertahankan pemformatan terstruktur seperti breaks baris, indents, dan tab spacing.
Contoh kode berikut menunjukkan cara mengkonversi PDF ke file TXT dengan format teks menggunakan C#:
Perbandingan visual RAW dan ekstraksi murni
Gambar di bawah ini memberikan perbandingan visual dari dua mode ekstraksi. di sebelah kiri, teks PDF muncul dengan format asli (Modus Bersih), sementara kanan menampilkan teks mentah tanpa format. perbandingan ini dapat membantu Anda memutuskan metode mana yang paling sesuai dengan kebutuhan Anda.

Konversi file TXT ke PDF secara programmatik menggunakan C# atau VB.NET
Mengkonversi file TXT kembali ke PDF berguna ketika Anda perlu menghasilkan dokumen yang dilapisi dari konten teks rata. proses ini melibatkan membaca teks dan kemudian menerapkan format PDF untuk membuat dokumen yang visual menarik dan siap untuk didistribusikan.
Langkah-langkah untuk TXT ke Konversi PDF
Mencipta instansi TextReader: Gunakan The Pembaca teks untuk membaca konten dari file TXT.
Mulai dokumen PDF baru dan tambahkan halaman putih: Mencipta contoh dari Dokumen Kelas dan tambahkan halaman baru.
Menginstal objek TextBuilder: Gunakan The Pembuat teks untuk membangun paragraf teks dengan format yang diinginkan, seperti font, ukuran, dan warna.
Baca dan tambahkan setiap baris teks: Berjalan melalui baris dalam file TXT, menempelkan setiap baris ke objek TextBuilder.
Save output PDF : Gunakan The Pengelolaan ( String ) Metode untuk menulis file PDF akhir ke cakera.
Snippet kode di bawah ini menunjukkan cara mengkonversi file TXT ke dokumen PDF menggunakan C#:
Pertimbangan Saat Konversi TXT ke PDF
- Layout dan gaya : Anda mungkin perlu menyesuaikan margin, ruang baris, dan sifat teks lainnya untuk memastikan bahwa PDF diformat dengan baik dan dapat dibaca.
- Penyelesaian kesalahan : Mengimplementasikan pemeriksaan kesalahan saat membaca file dan menulis operasi untuk menangani skenario seperti masalah akses file atau mengenkripsi kesalahan.
Kesimpulan
Dalam artikel ini, kami menunjukkan teknik untuk mengkonversi file PDF ke file TXT dan PDF menggunakan C# atau VB.NET dalam .NET Framework. apakah Anda memilih ekstraksi teks mentah untuk kecepatan dan kesederhanaan atau memerlukan teks terformat untuk mempertahankan tata letak dokumen, Aspose.PDF untuk .NET API menawarkan solusi yang dapat diandalkan dan fleksibel.Metode konversi ini tidak berharga untuk pemrosesan data, penyimpanan dokumen, dan pengembalian konten.
Jika Anda memiliki pertanyaan atau membutuhkan bantuan lebih lanjut, silakan kunjungi kami. Forum Dukungan Gratis atau meninjau Dokumentasi Produk.
Lihat juga
More in this category
- Aspose.PDF ChatGPT Plugin vs OpenAI API untuk Pemrosesan PDF di .NET
- Automatic Batch PDF Compression untuk Penyimpanan di .NET
- Automatic Bulk Form Data Extraction dari PDF dalam .NET
- Automatic PDF Content Summarization menggunakan ChatGPT dan .NET
- Automatikkan PDF ke DOC Konversi untuk Pemrosesan Batch dalam .NET