PDF Los archivos son populares porque soportan texto, imágenes, animaciones, videos, y diversas anotaciones. Sin embargo, para muchos documentos, el texto es la parte más crucial. Este artículo explica cómo convertir los ficheros PDF en fichiers TXT y, por el contrario, los Fichos TXT en PDF utilizando C# .NET. Esta conversión es particularmente útil cuando necesita extraer o enfocarse únicamente en el contenido de texto de un documento PDF, como cuando se realiza el análisis del texto o la preparación del contenido para la reforma.
Los temas cubiertos en esta guía incluyen:
- C# TXT a PDF o PDF a TXT Converter API
- C# Convertir PDF a TXT sin formatar
- Convertir PDF a Ficheo TXT con Routinas de Formatación utilizando C# o VB.NET
- Convertir el archivo TXT en PDF de forma programática utilizando C# o VB.NET
Tip: También puede estar interesado en un libre Título en GIF Converter que le permite generar gifs animados de texto.
C# TXT a PDF o PDF a TXT Converter
Convertir entre los formatos PDF y TXT es esencial cuando su principal interés se encuentra en los datos textuales dentro de un documento. Ya sea que necesite extraer todo el formato para una simple análisis de texto o preservar algún diseño estructurado, el proceso se puede completar con unos pocos pasos sencillos utilizando la Página web.pdf para .NET Esta API es versátil y apoya tanto C# como VB.NET, lo que hace que sea fácil de integrar en sus aplicaciones .NET.
Para instalar la API en su aplicación, puede descargar los archivos DLL de Descargar o utilizar el NuGet Por ejemplo, instale a través de la consola Package Manager:
PM> Install-Package Aspose.PDF
Una vez que se instala la API, puede comenzar el proceso de conversión con varios enfoques adaptados a diferentes necesidades.
C# Convertir PDF a TXT sin Formatar
A veces, sólo necesita el texto crudo de un documento PDF sin ningún formato adicional. Este método extrae el texto exactamente como aparece en el documento, sin preservar las letras, el espacio o los estilos. Es particularmente útil para el análisis de texto, la indicación de búsqueda, o cuando el diseño es irrelevante.
Pasos para la extracción de texto crudo
Carga el documento de entrada PDF: Utilice la API para cargar el archivo PDF en un objeto de documento.
Iniciación a un StringBuilder: Crea un ejemplo de la StringBuilder La clase para acumular de forma eficiente los datos de texto.
Iterate a través de cada página PDF: A través de todas las páginas del documento. para cada página:
Uso TextDevice para extraer texto.
Empleo el El modo Raw garantizar que el formato no se aplique.
Salva el texto de salida: Escribe el texto acumulado en un archivo TXT.
El snippet de código a continuación ilustra cómo convertir un PDF en un archivo TXT utilizando el método de extracción Raw:
Insights adicionales
- Desarrollo y simplicidad: La extracción de texto crudo es generalmente más rápida porque no intenta parse ni aplicar ninguna regla de formatación.
- Casos de uso: Ideal para extracción de logs, índice de búsqueda o escenarios donde solo se requiere el contenido textual.
Convertir PDF a Ficheo TXT con Routinas de Formatación utilizando C# o VB.NET
En otros escenarios, la preservación de la formatación del texto (como parágrafos, indentaciones y columnas) es crucial.Este método se aplica a la formatación de rutinas para reflejar el diseño del documento en el archivo TXT resultante.
Pasos para la extracción de texto con formatación
Cargar el archivo PDF de la fuente: Como antes, cargue el documento PDF en su aplicación.
Inicio de una variable de string: Preparar una cinta para recoger la salida de texto formado.
Extracto de texto utilizando el modo de formatación: Para cada página, utilice el Página de textoMode.Pure Este modo intenta reproducir el formato original tan cerca como sea posible.
Salva el texto formado: Exporta el texto recogido a un archivo TXT que mantiene formatos estructurados como brechas de línea, indentes y espacio de tablas.
El siguiente ejemplo de código muestra cómo convertir un PDF en un archivo TXT con formato de texto utilizando C#:
Comparación visual de RAW y Pure Extraction
La imagen a continuación proporciona una comparación visual de los dos modos de extracción.En la izquierda, el texto del PDF aparece con su formato original (modo puro), mientras que la derecha muestra el texto crudo sin ningún formato.

Convertir el archivo TXT en PDF de forma programática utilizando C# o VB.NET
Convertir un archivo TXT de vuelta a un PDF es útil cuando necesitas producir un documento polido de contenido de texto plano. Este proceso implica leer el texto y luego aplicar el formato PDF para crear un documento que es visualmente atractivo y listo para la distribución.
Pasos para la conversión de TXT a PDF
Crea una instancia de texto: Utilice el TextReader clase para leer el contenido del archivo TXT.
Iniciar un nuevo documento PDF y agregar una página blanca: Crea un ejemplo de la Documento Clase y añade una nueva página.
Instalar un Objeto TextBuilder: Utilice el TextBuilder para construir parágrafos de texto con el formato deseado, como la letra, el tamaño y el color.
Leer y añadir cada línea de texto: Pasar a través de las líneas en el archivo TXT, añadiendo cada línea al objeto TextBuilder.
Salva la salida PDF: Utilice el SiguienteSiguienteSiguienteSiguienteSiguiente) método para escribir el archivo PDF final en el disco.
El corte de código a continuación muestra cómo convertir un archivo TXT en un documento PDF utilizando C#:
Consideraciones Cuando Convertir TXT en PDF
- Layout y estilo: Puede que necesite ajustar las margen, el espacio de línea y otras propiedades de texto para asegurarse de que el PDF sea bien formátado y leible.
- El tratamiento de los errores: Implementar la verificación de errores durante las operaciones de lectura y escritura de archivos para gestionar escenarios como problemas de acceso al archivo o codificación de errores.
Conclusión
En este artículo, hemos demostrado las técnicas para la conversión de archivos PDF a TXT y TXT a PDF utilizando C# o VB.NET en el .NET Framework. Si usted opta por la extracción de texto crudo para velocidad y simplicidad o requiere texto formado para mantener el diseño del documento, el Página web.pdf para .NET Las API ofrecen soluciones fiables y flexibles.Estos métodos de conversión son inestimables para el procesamiento de datos, el archivo de documentos y la reproducción de contenidos.
Si tienes alguna pregunta o necesitas ayuda adicional, por favor visite nuestro Foro de apoyo gratuito o revisar el Documentación del producto.