从 PDF 到 Excel 手动导出表或结构化数据是一个可怕的任务,可以错误。 使用 Aspose.PDF XLS Converter for .NET 自动化这个过程,在财务、报告、分析和遵守方面简化和调整工作流.

引入

将 PDF 文档转换为 Microsoft Excel 格式(XLS、XLSX、CSV)的自动化对于许多业务流程至关重要.

现实世界问题

从 PDF 到 Excel 手动导出表或结构化数据是工作强度和错误的。 自动化这种转换对财务、报告、分析和遵守工作流至关重要,在那里需要大量的 PDF-to- spreadsheet 操作.

解决方案概述

Aspose.PDF XLS Converter for .NET 允许您:

  • 将单个或多个 PDF 转换为 Excel 文件(XLSX, XLS, CSV, ODS, XML)
  • 控制工作表结构和格式化
  • 与可扩展自动化的 C#/NET 项目顺利集成

原則

  • Visual Studio 2019 或以后
  • .NET 6.0 或更高
  • Aspose.PDF for .NET 通过 NuGet 安装
PM> Install-Package Aspose.PDF

步骤实施

步骤1:参考所需的名称空间

using Aspose.Pdf.Plugins;
using System.IO;

步骤2:将 PDF 转换为 XLSX

使用案例和应用程序(与代码变量)

1. 出口到 CSV、XLS、ODS 或 XML

指定所需的输出格式,使用 Format 财产:

options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

2. Batch 将多个 PDF 转换为 Excel

3. 最少工作表数量

默认情况下,每个 PDF 页面都会变成一个新的 Excel 工作表:

options.MinimizeTheNumberOfWorksheets = true;

4. 在启动时插入白色列

对于某些数据进口情况,您可能希望将白色列添加为第一个列:

options.InsertBlankColumnAtFirst = true;

最好的做法和提示

  • 预览输出以验证桌面配置和数据完整性,特别是使用先进的配置选项.
  • 对于大型文件,使用集合处理以有效地自动化大批转换.
  • 在转换为CSV时,检查分离器和编码下流兼容性.
  • 对于高度结构化或扫描的PDF文件,预处理文件获得最佳结果.

完整实施例子

using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
    static void Main()
    {
        var inputPath = "C:\\Samples\\sample.pdf";
        var outputPath = "C:\\Samples\\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

结论

Aspose.PDF XLS Converter for .NET 可在 C# 项目中快速、强大、灵活地自动化 PDF-to-Excel (XLS / XLSX / CSV / XML / ODS.

More in this category