Exporting tables or structured data from PDFs to Excel manually is a tedious task that can be error-prone. การอัตโนมัติกระบวนการนี้ด้วย Aspose.PDF XLS Converter for .NET simplifies and streamlines workflows in finance, reporting, analytics, and compliance.

บทนํา

การอัตโนมัติการแปลงเอกสาร PDF ในรูปแบบ Microsoft Excel (XLS, XLSX, CSV) เป็นสิ่งสําคัญสําหรับกระบวนการธุรกิจจํานวนมากบทความนี้แสดงให้เห็นว่าวิธีการใช้ Aspose.PDF XLS Converter สําหรับ .NET เพื่อให้ดําเนินการนี้ได้อย่างมีประสิทธิภาพ

ปัญหาโลกจริง

Exporting tables or structured data from PDFs to Excel manually is labor-intensive and error-proof. การอัตโนมัติการแปลงนี้เป็นสิ่งสําคัญสําหรับกระแสทํางานในทางการเงินการรายงานการวิเคราะห์และการปฏิบัติตามที่จํานวนมาก PDF-to- spreadsheet การดําเนินงานที่จําเป็น

ความคิดเห็นเกี่ยวกับโซลูชัน

Aspose.PDF XLS Converter for .NET ช่วยให้คุณ:

  • แปลงไฟล์ PDF เดี่ยวหรือหลายไฟล์ไปยังไฟล์ Excel (XLSX, XLS, CSV, ODS, XML)
  • การควบคุมโครงสร้างแผ่นงานและรูปแบบ
  • การบูรณาการได้อย่างราบรื่นกับโครงการ C#/.NET สําหรับการอัตโนมัติแบบสแกน

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า
  • Aspose.PDF สําหรับ .NET ติดตั้งผ่าน NuGet
PM> Install-Package Aspose.PDF

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอนที่ 1: การอ้างอิงพื้นที่ชื่อที่จําเป็น

using Aspose.Pdf.Plugins;
using System.IO;

ขั้นตอน 2: แปลงไฟล์ PDF ไปยัง XLSX

การใช้กรณีและแอพพลิเคชัน (ด้วยการเปลี่ยนแปลงรหัส)

1. การส่งออกไปยัง CSV, XLS, ODS หรือ XML

ระบุรูปแบบการส่งออกที่ต้องการโดยใช้ Format คุณสมบัติ :

options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

2. Batch แปลงหลายไฟล์ PDF ไปยัง Excel

3. ลดจํานวนแผ่นงาน

โดยเริ่มต้นแต่ละหน้า PDF จะกลายเป็นตารางงาน Excel ใหม่ เพื่อบันทึกเนื้อหาทั้งหมดไว้ในแผ่นงานเดียว:

options.MinimizeTheNumberOfWorksheets = true;

4. ใส่คอลัมน์สีขาวเมื่อเริ่มต้น

สําหรับสถานการณ์การนําเข้าข้อมูลบางอย่างคุณอาจต้องการเพิ่มคอลัมน์สีขาวเป็นกลมแรก:

options.InsertBlankColumnAtFirst = true;

การปฏิบัติที่ดีที่สุดและเคล็ดลับ

  • แสดงผลลัพธ์เพื่อตรวจสอบการจัดตั้งตารางและความสมบูรณ์ของข้อมูลโดยเฉพาะอย่างยิ่งเมื่อใช้ตัวเลือกจัดวางขั้นสูง
  • สําหรับเอกสารขนาดใหญ่ใช้การประมวลผลชุดเพื่ออัตโนมัติการแปลงจํานวนมากได้อย่างมีประสิทธิภาพ
  • เมื่อแปลงเป็น CSV, ตรวจสอบ delimiters และ encoding สําหรับ compatibility downstream.
  • สําหรับไฟล์ PDF ที่โครงสร้างสูงหรือสแกนเป็นเอกสารก่อนกระบวนการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

ตัวอย่างการดําเนินการที่สมบูรณ์

using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
    static void Main()
    {
        var inputPath = "C:\\Samples\\sample.pdf";
        var outputPath = "C:\\Samples\\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

ข้อสรุป

Aspose.PDF XLS Converter สําหรับ .NET ช่วยให้การอัตโนมัติ PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) ได้อย่างรวดเร็วและมีความยืดหยุ่นในโครงการ C# ปล็อคข้อมูลจากไฟล์ PDF, การวิเคราะห์เส้นผ่านศูนย์กลางและการบูรณาการไหลของแผ่นงาน - ทั้งหมดด้วย API ที่เรียบง่ายและมีประสิทธิภาพสูง

More in this category