Mengeksport jadual atau data berstruktur dari PDF ke Excel secara manual merupakan tugas yang membosankan yang boleh menyebabkan kesilapan.Mengautomatikkan proses ini dengan Aspose.PDF XLS Converter untuk .NET memudahkan dan menyegarkan aliran kerja dalam kewangan, laporan, analisis, dan pematuhan.

Introduction

Mengautomatikkan penukaran dokumen PDF ke dalam format Microsoft Excel (XLS, XLSX, CSV) adalah penting bagi banyak proses perniagaan. artikel ini menunjukkan bagaimana untuk menggunakan Aspose.PDF XLS Converter untuk .NET untuk mencapai tugas ini dengan cekap.

Masalah dunia sebenar

Mengeksport jadual atau data terstruktur dari PDF ke Excel secara manual adalah kerja-kerja yang intensif dan berisiko.Mengautomatikkan penukaran ini adalah penting untuk aliran kerja dalam kewangan, laporan, analisis, dan pematuhan di mana operasi bulk PDF-to-spreadheet diperlukan.

Gambaran keseluruhan penyelesaian

Aspose.PDF XLS Converter untuk .NET membolehkan anda:

  • Menukar satu atau beberapa PDF ke fail Excel (XLSX, XLS, CSV, ODS, XML)
  • Mengawal struktur lembaran kerja dan pemformatan
  • Mengintegrasikan dengan lancar dengan projek-projek C#/NET untuk automasi skala

Prerequisites

  • Visual Studio 2019 atau seterusnya
  • .NET 6.0 atau lebih baru
  • Aspose.PDF untuk .NET dipasang melalui NuGet
PM> Install-Package Aspose.PDF

Pelaksanaan langkah demi langkah

Langkah 1: Merujuk kepada ruang nama yang diperlukan

using Aspose.Pdf.Plugins;
using System.IO;

Langkah 2: Menukar PDF kepada XLSX

Penggunaan Kasus & Aplikasi (dengan Variasi Kod)

1. ** Eksport ke CSV, XLS, ODS, atau XML**

Menentukan format output yang dikehendaki menggunakan Format dan hartanah :

options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

2. Batch Convert Multiple PDFs ke Excel

3. *Mengurangkan bilangan lembaran kerja

Secara lalai, setiap halaman PDF menjadi lembaran kerja Excel yang baru. untuk menyimpan semua kandungan dalam satu lembar kerja:

options.MinimizeTheNumberOfWorksheets = true;

4. Masukkan lajur putih pada permulaan

Untuk senario pengimportan data tertentu, anda mungkin ingin menambah lajur putih sebagai lapisan pertama:

options.InsertBlankColumnAtFirst = true;

Amalan dan Tips Terbaik

  • Prospek output untuk mengesahkan tataletak jadual dan integriti data, terutamanya apabila menggunakan opsyen layout canggih.
  • Untuk dokumen besar, gunakan pemprosesan batch untuk mengautomatikkan penukaran bulk dengan cekap.
  • Apabila menukar kepada CSV, semak delimiters dan kod untuk kompatibiliti downstream.
  • Untuk PDF yang sangat berstruktur atau dipindai, dokumen pra-proses untuk hasil terbaik.

Contoh Pelaksanaan Lengkap

using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
    static void Main()
    {
        var inputPath = "C:\\Samples\\sample.pdf";
        var outputPath = "C:\\Samples\\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Conclusion

Aspose.PDF XLS Converter untuk .NET membolehkan automatik PDF-to-Excel yang cepat, kukuh dan fleksibel (XLS / XLSX / CSV / XML / ODS) dalam projek-projek C#. Unlock data daripada PDF, analisis lancar, dan mengintegrasikan aliran kerja spreadsheet - semua dengan API yang mudah dan berprestasi tinggi.

More in this category