PDF için Dosyalar popülerdir çünkü metin, resimler, animasyonlar, videolar ve çeşitli notları destekler. ancak, birçok belge için, metnin en önemli parçasıdır. bu makalede PDF dosyalarını TXT dosyalarına ve tersine, C# .NET kullanarak PDF’ye dönüştürmek için nasıl açıklanır. Bu dönüşüm özellikle yararlı olduğunda sadece bir PDF belgesinin yazılı içeriğini çıkarmak veya odaklanmak gerekir, örneğin, yazı analizi yaparken veya yeniden düzenleme için içerik hazırlamak.
Bu kılavuzda yer alan konular şunları içerir:
- C# TXT to PDF veya PDF to TXT Converter API
- C# PDF’yi formatlama olmadan TXT’ye dönüştürmek
- PDF’yi C# veya VB.NET’i kullanarak formatlama rutinleri ile TXT Dosyasına dönüştürün
- TXT dosyasını PDF’ye dönüştürün Programlı olarak C# veya VB.NET kullanarak
Tip: Ücretsiz ile ilgilenebilirsiniz GIF dönüştürücü Bu, animasyonlu GIF’leri metinden oluşturmanıza olanak tanır.
C# TXT to PDF veya PDF to TXT Converter
PDF ve TXT biçimleri arasındaki dönüşüm, ana ilgi bir belgenin içindeki metin verilerinde olduğunda önemlidir. basit bir yazı analizi için tüm biçimlendirmeyi çıkarmanız ya da bazı yapılandırılmış bir düzenin korunması gerekiyorsa, süreci birkaç adımla tamamlayabilirsiniz. Aspose.PDF için .NET Bu API çok yönlüdür ve hem C# hem de VB.NET’i destekler, bu da .NET uygulamalarına entegre edilmesini kolaylaştırır.
API’yi uygulamanızda yüklemek için, ya DLL dosyalarını indirebilirsiniz. İndirme ya da kullanın Nükleer Örneğin, paket yöneticisi konsolu aracılığıyla yükleme:
PM> Install-Package Aspose.PDF
API yüklendiğinde, dönüşüm sürecine farklı ihtiyaçlara göre çeşitli yaklaşımlarla başlayabilirsiniz.
C# Format olmadan PDF’yi TXT’ye dönüştürür
Bazen, sadece herhangi bir ek biçimlendirme olmadan bir PDF belgesinden kaynaklı metin gerektirir. Bu yöntem, metinde tam olarak olduğu gibi metni çıkarır, yazı tipleri, alanları veya tarzları korumadan. metin analizi, arama indeksleme veya düzenin önemsiz olduğunda özellikle yararlıdır.
Raw Text Extraction için adımlar
PDF giriş belgesini yükleyin: PDF dosyasını bir Belge nesnesine yüklemek için API’yi kullanın.
Bir StringBuilder başlatın: Bir örnek oluşturmak için StringBuilder Sınıf, metin verilerini verimli bir şekilde biriktirir.
Her PDF sayfasını kullanarak yazın: Belgenin tüm sayfalarından geçin. her sayfa için:
Kullanımı YazıDevice Yazıyı çıkarmak için.
İşe Alın Yakıt Modu Formatı uygulamadığından emin olmak.
Yazının çıkışını kaydedin: Toplanan metni bir TXT dosyasına yazın.
Aşağıdaki kod tablosu, bir PDF’yi Raw ekstraksiyon yöntemini kullanarak bir TXT dosyasına nasıl dönüştüreceğinizi gösterir:
Ek Bilgiler
- performans ve basitlik: Temiz metin çıkarma genellikle daha hızlıdır, çünkü herhangi bir biçimlendirme kuralını bozmaya veya uygulamaya çalışmaz.
- Kullanılan durumlar : Log çıkarma, arama indeksleme veya sadece metin içeriği gerektiren senaryolar için idealdir.
PDF’yi C# veya VB.NET’i kullanarak formatlama rutinleri ile TXT Dosyasına dönüştürün
Diğer senaryolarda, metnin biçimlendirilmesini korumak (örneğin paragraflar, indentasyonlar ve sütunlar) çok önemlidir. bu yöntem, sonuçlanan TXT dosyasında belgenin düzenini yansıtmak için biçimlendirme rutinleri uygulanır.
Formatı ile Metin Ekstraksiyonu Adımları
Kaynak PDF dosyasını yükleyin: Daha önce olduğu gibi, PDF belgesini uygulamanıza yükleyin.
Bir çizgi değişken başlatın: Formatlanmış metin çıkışını toplamak için bir çubuk hazırlayın.
Formatıma modunu kullanarak metin çıkarın: Her sayfa için kullanın TextFormattingMode.Pure Hakkında Bu mod, orijinal biçimlendirmeyi mümkün olduğunca yakından çoğaltmaya çalışır.
Şekillendirilmiş metni kaydedin: Toplanan metni yapılandırılmış biçimlendirmeyi koruyan bir TXT dosyasına çıkarın, örneğin çizgi boşluklar, indentler ve sekme alanlama.
Aşağıdaki kod örneği, bir PDF’yi C# kullanarak metin biçimlendirmesi ile bir TXT dosyasına nasıl dönüştürüldüğünü gösterir:
RAW ve Pure Extraction ile Görsel Karşılaştırma
Aşağıdaki görüntü, iki ekstraksiyon modunun görsel bir karşılaştırmasını sağlar. sol tarafta, PDF’nin metni orijinal biçimlendirmesi (Pure modu) ile görünürken, sağ tarafta herhangi bir biçimlendirme olmadan ham metni görüntülenir. Bu karşılaştırma hangi yöntemin ihtiyaçlarınıza en uygun olduğuna karar vermenize yardımcı olabilir.

TXT dosyasını PDF’ye dönüştürün Programlı olarak C# veya VB.NET kullanarak
Bir TXT dosyasını bir PDF’ye dönüştürmek, düz metin içeriğinden polize edilmiş bir belge üretmeniz gerektiğinde yararlıdır.Bu süreç metni okumayı ve daha sonra görsel olarak çekici ve dağıtılmaya hazır bir belge oluşturmak için PDF biçimlendirmesini içerir.
TXT’ye PDF Dönüşüm Adımları
Bir TextReader istasyonu oluşturun: Kullanmak için Yazı Okuyucu TXT dosyasından içeriği okumak için sınıf.
Yeni bir PDF belgesini başlatın ve beyaz bir sayfa ekleyin: Bir örnek oluşturmak için belge sınıf ve yeni bir sayfa ekleyin.
Bir TextBuilder Object’i başlatın: Kullanmak için TextBuilder İstediğiniz biçimlendirme ile metin paragrafları oluşturmak, örneğin yazı tipi, boyutu ve renk.
Yazının her satırını okuyun ve ekleyin: TXT dosyasındaki satırları geçerek, her satırı TextBuilder nesnesine ekleyin.
PDF çıkışını kaydedin: Kullanmak için Etiket Arşivi: String Son PDF dosyasını diske yazma yöntemi.
Aşağıdaki kod kesimi, bir TXT dosyasını C# kullanarak bir PDF belgesine nasıl dönüştürüldüğünü gösterir:
TXT’yi PDF’ye dönüştürmek için düşünceler
- Layout ve Stil: PDF’nin iyi biçimlendirilmiş ve okunabilir olmasını sağlamak için marjları, çizgi alanlarını ve diğer metin özelliklerini ayarlamalısınız.
- Yanlış işleme: Dosya okuma ve yazma işlemleri sırasında hata kontrolü, dosya erişim sorunları veya yanlış anlaşmazlıkları kodlama gibi senaryoları ele almak için uygulanır.
Sonuç
Bu makalede, PDF dosyalarını C# veya VB.NET’i kullanarak PDF’ye dönüştürme tekniklerini gösterdik. .NET Çerçevesinde. hızlı ve basitlik için kaynak metin çıkarma seçerseniz ya da belge düzenini korumak için biçimlendirilmiş metni gerektirir. Aspose.PDF için .NET API güvenilir ve esnek çözümler sunar. Bu dönüşüm yöntemleri veri işleme, belge arşivleme ve içerik yeniden yapılandırma için değerli değildir.
Herhangi bir sorunuz varsa veya daha fazla yardım istiyorsanız lütfen bizimle iletişime geçin. Ücretsiz destek forum ya da inceleme Ürün Belgeleri.