PDF 这些文件很受欢迎,因为它们支持文本、图像、动画、视频和各种笔记。 但是,对于许多文档来说,文字是最关键的部分. 这篇文章解释了如何将PDF文件转换为TXT文件,而相反,TCT文件则使用C# .NET.
本指南所涵盖的主题包括:
- C# TXT 到 PDF 或 PDF 到 TXT 转换器 API
- C# 将 PDF 转换为 TXT 没有格式化
- 将 PDF 转换为 TXT 文件,使用 C# 或 VB.NET 格式
- 将 TXT 文件转换为 PDF 通过 C# 或 VB.NET 编程
提示: 您也可能感兴趣的免费 文本到 GIF 转换器 它允许您从文本中创建动画GIF.
C# TXT 到 PDF 或 PDF 到 TXT 转换器
PDF 和 TXT 格式之间的转换是必不可少的,当您的主要兴趣在文档中的文本数据中。 无论您需要为简单的文法分析切除所有形式或保存一些结构化的布局,这个过程可以通过使用几个简单步骤完成 ASPOSE.PDF 为 .NET 此 API 是多功能的,支持 C# 和 VB.NET,使其易于集成到您的 .NET 应用程序.
要在您的应用程序中安装 API,您可以从 下载 或者使用 NuGet 例如,通过 Package Manager Console 安装:
PM> Install-Package Aspose.PDF
一旦 API 安装,您可以使用多种方法开始转换过程,以适应不同的需求.
C# 将 PDF 转换为 TXT 没有格式化
有时,你只需要从PDF文档的原始文本没有任何额外的格式化. 这种方法提取文本正如它在文档中出现的那样,没有保存字体,空间或风格. 它特别有用于文本分析,搜索索引,或者当布局是无关紧要的.
原文提取的步骤
下载输入PDF文档: 使用 API 将 PDF 文件加载到文档对象中.
启动一个 StringBuilder: 创建一个例子 StringBuilder 能够有效地积累文本数据.
通过每个 PDF 页面输入: 通过文档中的所有页面,为每个页面:
使用 TextDevice 提取文本.
雇用 The 原始模式 确保格式化不适用.
保存输出文本: 将积累的文本输入到 TXT 文件中.
下面的代码剪辑描述了如何使用 Raw 提取方法将 PDF 转换为 TXT 文件:
附加洞察
- 性能和簡單性: 原文提取通常更快,因为它不试图破坏或应用任何格式化规则.
- 使用案例: 理想用于日志提取、搜索索引或仅需要文本内容的场景.
将 PDF 转换为 TXT 文件,使用 C# 或 VB.NET
在其他场景中,保存文本格式(如段落、插图和列)是至关重要的,这种方法适用于格式格式,以反映文档的布局在结果的 TXT 文件中.
文本提取与格式化步骤
下载源 PDF 文件: 如同以前一样,将 PDF 文件加载到您的应用程序中.
启动一带变量: 准备一个字符串来收集格式化文本输出.
使用格式化模式提取文本: 对于每个页面,使用 编辑Mode.Pure 此模式试图尽可能密切地重复原始格式.
保存格式化文本: 输出收集的文本到一个 TXT 文件,保留结构化的格式化,如线条中断,索引和选项卡空间.
下面的代码示例如何将 PDF 转换为使用 C# 文本格式的 TXT 文件#:
视觉比较 RAW 和 Pure Extraction
下面的图像提供了两种提取模式的视觉比较。在左侧,PDF的文本与其原始格式(纯模式)显示,而右侧则显示原始文本没有任何格式.

将 TXT 文件转换为 PDF 通过 C# 或 VB.NET 编程}
将 TXT 文件转换为 PDF 是有用的,当您需要从清晰的文本内容中创建一个编辑文档时,这个过程包括阅读文本,然后应用 PDF 格式化,以创建一个视觉上有吸引力和准备分发的文档.
步骤 TXT 到 PDF 转换
创建 TextReader 实例: 使用 The TextReader 学习从 TXT 文件中阅读内容.
启动新 PDF 文档并添加白页: 创建一个例子 文件 学习,并添加新页面.
立即安装 TextBuilder 对象: 使用 The TextBuilder 用所需格式构建文本段,如字体、尺寸和颜色.
阅读和添加每行文本: 通过 TXT 文件中的行,将每个行添加到 TextBuilder 对象中.
保存 PDF 输出: 使用 The 编辑:Save(String) 如何将最终的 PDF 文件写入磁盘.
下面的代码剪辑显示如何将 TXT 文件转换为 PDF 文档,使用 C#:
考虑如何将 TXT 转换为 PDF
- 布局和风格: 您可能需要调整边缘、线路和其他文本属性,以确保 PDF 已格式化和可阅读.
- 错误处理: 在文件阅读和写作过程中进行错误检查,以处理文件访问问题或编码错误等情况.
结论
在本文中,我们展示了通过 C# 或 VB.NET 在 .NET 框架中将 PDF 文件转换为 TXT 的技术,无论您选择原文提取速度和简单性,还是需要格式化文本来维持文档布局 ASPOSE.PDF 为 .NET API 提供可靠和灵活的解决方案. 这些转换方法对数据处理、文档存档和内容重定向无价值.
如果您有任何疑问或需要进一步的帮助,请访问我们的 免费支持论坛 或审查 产品文档.