Xuất khẩu bảng hoặc dữ liệu cấu trúc từ PDF sang Excel bằng tay là một nhiệm vụ mệt mỏi có thể gây ra lỗi. Tự động hóa quá trình này với Aspose.PDF XLS Converter for .NET làm đơn giản và nhanh chóng các dòng công việc trong tài chính, báo cáo, phân tích và tuân thủ.

Giới thiệu

Tự động hóa chuyển đổi tài liệu PDF sang định dạng Microsoft Excel (XLS, XLSX, CSV) là điều rất quan trọng đối với nhiều quy trình kinh doanh. Bài viết này cho thấy cách sử dụng Aspose.PDF XLS Converter cho .NET để đạt được nhiệm vụ này một cách hiệu quả.

Vấn đề thế giới thực

Xuất khẩu bảng hoặc dữ liệu có cấu trúc từ PDF sang Excel bằng tay là công việc chuyên sâu và gây sai lầm. Tự động hóa chuyển đổi này là điều cần thiết cho các dòng làm việc trong tài chính, báo cáo, phân tích và tuân thủ nơi các hoạt động đa dạng PDF-to-breadsheet được yêu cầu.

Giải pháp Overview

Aspose.PDF XLS Converter for .NET cho phép bạn:

  • Chuyển đổi một hoặc nhiều PDF sang tệp Excel (XLSX, XLS, CSV, ODS, XML)
  • Kiểm soát cấu trúc sổ làm việc và định dạng
  • Kết hợp một cách dễ dàng với các dự án C#/NET cho tự động hóa quy mô

Nguyên tắc

  • Visual Studio 2019 hoặc hơn
  • .NET 6.0 hoặc mới hơn
  • Aspose.PDF cho .NET cài đặt qua NuGet
PM> Install-Package Aspose.PDF

Chế độ thực hiện từng bước

Bước 1: Tham khảo các không gian tên cần thiết

using Aspose.Pdf.Plugins;
using System.IO;

Bước 2: Chuyển đổi PDF sang XLSX

Sử dụng trường hợp và ứng dụng (với biến thể mã)

1. Xuất sang CSV, XLS, ODS hoặc XML

Chọn định dạng xuất khẩu mong muốn bằng cách sử dụng Format Tài sản :

options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

2. Batch chuyển đổi nhiều PDF sang Excel

3. Giảm thiểu số lượng bảng điều khiển

Theo mặc định, mỗi trang PDF trở thành một sổ làm việc Excel mới. để lưu tất cả nội dung trong một bảng điều khiển duy nhất:

options.MinimizeTheNumberOfWorksheets = true;

4. Nhập một cột trắng tại khởi động

Đối với một số kịch bản nhập dữ liệu nhất định, bạn có thể muốn thêm một cột trắng như cỗ đầu tiên:

options.InsertBlankColumnAtFirst = true;

Thực hành và lời khuyên tốt nhất

  • Hiển thị kết quả để xác minh bố trí bảng và tính toàn vẹn dữ liệu, đặc biệt là khi sử dụng các tùy chọn sắp xếp nâng cao.
  • Đối với các tài liệu lớn, sử dụng bộ xử lý để tự động chuyển đổi khối hiệu quả.
  • Khi chuyển đổi sang CSV, kiểm tra bộ phân giải và mã hóa để tương thích downstream.
  • Đối với các PDF có cấu trúc cao hoặc được quét, các tài liệu trước quá trình cho kết quả tốt nhất.

Một ví dụ thực hiện đầy đủ

using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
    static void Main()
    {
        var inputPath = "C:\\Samples\\sample.pdf";
        var outputPath = "C:\\Samples\\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Kết luận

Aspose.PDF XLS Converter cho .NET cho phép tự động hóa PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) nhanh chóng, vững chắc và linh hoạt trong các dự án C#. Khóa dữ liệu từ PDF, phân tích trực tiếp, và tích hợp các dòng công việc bảng điều khiển - tất cả với một API đơn giản, hiệu suất cao.

More in this category