从 PDF 到 Excel 手动导出表或结构化数据是一个可怕的任务,可以错误。 使用 Aspose.PDF XLS Converter for .NET 自动化这个过程,在财务、报告、分析和遵守方面简化和调整工作流.
引入
将 PDF 文档转换为 Microsoft Excel 格式(XLS、XLSX、CSV)的自动化对于许多业务流程至关重要.
现实世界问题
从 PDF 到 Excel 手动导出表或结构化数据是工作强度和错误的。 自动化这种转换对财务、报告、分析和遵守工作流至关重要,在那里需要大量的 PDF-to- spreadsheet 操作.
解决方案概述
Aspose.PDF XLS Converter for .NET 允许您:
- 将单个或多个 PDF 转换为 Excel 文件(XLSX, XLS, CSV, ODS, XML)
- 控制工作表结构和格式化
- 与可扩展自动化的 C#/NET 项目顺利集成
原則
- Visual Studio 2019 或以后
- .NET 6.0 或更高
- Aspose.PDF for .NET 通过 NuGet 安装
PM> Install-Package Aspose.PDF
步骤实施
步骤1:参考所需的名称空间
using Aspose.Pdf.Plugins;
using System.IO;
步骤2:将 PDF 转换为 XLSX
使用案例和应用程序(与代码变量)
1. 出口到 CSV、XLS、ODS 或 XML
指定所需的输出格式,使用 Format 财产:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
2. Batch 将多个 PDF 转换为 Excel
3. 最少工作表数量
默认情况下,每个 PDF 页面都会变成一个新的 Excel 工作表:
options.MinimizeTheNumberOfWorksheets = true;
4. 在启动时插入白色列
对于某些数据进口情况,您可能希望将白色列添加为第一个列:
options.InsertBlankColumnAtFirst = true;
最好的做法和提示
- 预览输出以验证桌面配置和数据完整性,特别是使用先进的配置选项.
- 对于大型文件,使用集合处理以有效地自动化大批转换.
- 在转换为CSV时,检查分离器和编码下流兼容性.
- 对于高度结构化或扫描的PDF文件,预处理文件获得最佳结果.
完整实施例子
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = "C:\\Samples\\sample.pdf";
var outputPath = "C:\\Samples\\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
结论
Aspose.PDF XLS Converter for .NET 可在 C# 项目中快速、强大、灵活地自动化 PDF-to-Excel (XLS / XLSX / CSV / XML / ODS.