PDF Els arxius són populars perquè donen suport a text, imatges, animacions, vídeos i diverses anotacions. No obstant això, per a molts documents, el text és la part més crucial. Aquest article explica com convertir PDFs en fitxers TXT i, inversament, els TXT en PDF utilitzant C# .NET. Aquesta conversió és particularment útil quan cal extreure o centrar-se únicament en el contingut de text d’un document PDF, com per exemple, quan realitza l’anàlisi del text o prepara els continguts per reformar.
Els temes coberts en aquesta guia inclouen:
- C# TXT a PDF o PDF a TXT Converter API
- C# Convertir PDF a TXT sense formatar
- Convertir PDF a TXT File amb Routines de formatació utilitzant C# o VB.NET
- Convertir arxiu TXT a PDF Programàticament utilitzant C# o VB.NET
Tip: També pot estar interessat en un gratuït Text a GIF Converter Això li permet generar GIFs animats del text.
C# TXT a PDF o PDF a TXT Converter
La conversió entre els formats PDF i TXT és essencial quan el seu principal interès es troba en les dades textuals dins d’un document. Si vostè necessita eliminar tot el format per a l’anàlisi de text senzill o conservar algun disseny estructurat, el procés es pot realitzar amb pocs passos senzills utilitzant el Aspose.PDF per a .NET Aquesta API és versàtil i suporta tant C# com VB.NET, fent que sigui fàcil d’integrar-se en les seves aplicacions .NET.
Per instal·lar l’API en la seva aplicació, podeu descarregar els arxius DLL des de Descàrregues o utilitzar el El nou Per exemple, instal·la’l a través de la consola Package Manager:
PM> Install-Package Aspose.PDF
Una vegada instal·lat l’API, es pot iniciar el procés de conversió amb diversos enfocaments adaptats a diferents necessitats.
C# Convertir PDF a TXT sense formatar
De vegades només necessita el text brut d’un document PDF sense cap formatació addicional. Aquest mètode extracta el text exactament com apareix en el document, sense preservar fonts, espais o estils. És particularment útil per a l’anàlisi de text, la recerca indexant, o quan el disseny és irrellevant.
Pasos per a l’extracció de text brut
Càrrega del document PDF d’entrada: Utilitzeu l’API per carregar el fitxer PDF en un objecte de Document.
Iniciar un StringBuilder: Creació d’un exemple de StringBuilder Classificació per a l’acumulació eficaç de dades de text.
Iterat a través de cada pàgina PDF: Passa a través de totes les pàgines del document. per a cada pàgina:
Use TextDevice per extraure el text.
Emplaça el La modalitat rusa Per assegurar-se que el format no s’aplica.
Save the output text: Salva el text de la sortida: Escriu el text acumulat en un arxiu TXT.
L’escrit de codi a continuació il·lustra com convertir un PDF en un fitxer TXT utilitzant el mètode d’extracció Raw:
Insights addicionals
- Performances i simplicitat: L’extracció de text brut és generalment més ràpida perquè no intenta parsejar ni aplicar cap regles de formataci.
- Els casos d’ús: Ideal per a l’extracció de logs, indexatge de cerca o escenaris on només es requereix el contingut textual.
Convertir PDF a TXT File amb Routines de formatació utilitzant C# o VB.NET
En altres escenaris, la preservació de la formatació del text (com ara paràgrafs, indatacions i columnes) és crucial. Aquest mètode s’aplica a la formatació de rutines per reflectir el disseny del document en el fitxer TXT resultant.
Passos per a l’extracció de text amb formatar
Carregar el fitxer PDF font: Com abans, carregueu el document PDF a la vostra aplicaci.
Iniciar una variable d’estret: Preparar una fila per recollir la sortida de text formatada.
Extractar text utilitzant el mode de formatació: Per a cada pàgina, utilitzeu TextFormattingMode.Pure Aquest mode intenta reproduir el format original tan a prop com sigui possible.
Salva el text formatat: Exporta el text recollit a un arxiu TXT que manté formats estructurats com ara pauses de línia, indents i espais de taula.
L’exemple de codi següent demostra com convertir un PDF en un fitxer TXT amb formatatge de text utilitzant C#:
Comparació visual de RAW i Pure Extraction
La imatge a continuació proporciona una comparació visual dels dos modes d’extracció. a l’esquerra, el text del PDF apareix amb el seu format original (mode pur), mentre que la dreta mostra el text brut sense cap format.

Convertir arxiu TXT a PDF Programàticament utilitzant C# o VB.NET
Convertir un fitxer TXT en un PDF és útil quan cal produir un document politzat des del contingut de text pla. Aquest procés implica llegir el text i després aplicar el format PDF per crear un document que és visualment atractiu i disposat a distribuir.
Passos per a TXT a PDF Conversió
Creació d’una instància de textreader: Utilitza el Textreader Classes per llegir el contingut del fitxer TXT.
Iniciar un nou document PDF i afegir una pàgina blanca: Creació d’un exemple de Document Classe i afegir una nova pàgina.
Instal·lació d’un TextBuilder Object: Utilitza el Títol de text per construir paràgrafs de text amb el format desitjat, com ara font, mida i color.
Llegir i afegir cada línia de text: Passar a través de les línies en el fitxer TXT, afegint cada línia a l’objecte TextBuilder.
Save the Output PDF: Utilitza el Documentació.Save(String) Mètode per escriure el fitxer PDF final al disc.
L’escrit de codi a continuació demostra com convertir un fitxer TXT en un document PDF utilitzant C#:
Consideracions quan es converteix TXT en PDF
- Layout i estil: Potser cal ajustar les marges, l’espai de línia i altres propietats de text per assegurar-se que el PDF és ben formatat i llegible.
- Actuació d’errors: Implementar verificació d’error durant la lectura de fitxers i les operacions d’escriptura per gestionar escenaris com ara problemes d’accés a fitxers o codificació d’errades.
Conclusió
En aquest article, hem demostrat les tècniques per a la conversió de fitxers PDF a TXT i TXT en PDF utilitzant C# o VB.NET en el .NET Framework. Si vostè opta per l’extracció de text brut per velocitat i simplicitat o requereix text formatat per mantenir el disseny del document, el Aspose.PDF per a .NET API ofereix solucions fiables i flexibles. Aquests mètodes de conversió són inestimables per al tractament de dades, l’arxiu de documents i la reproducció de continguts.
Si teniu qualsevol pregunta o necessiteu més ajuda, si us plau visiteu la nostra Fòrum de suport gratuït o revisar el Documentació del producte.