Exporting tables or structured data from PDFs to Excel manually is a tedious task that can be error-prone. การอัตโนมัติกระบวนการนี้ด้วย Aspose.PDF XLS Converter for .NET simplifies and streamlines workflows in finance, reporting, analytics, and compliance.
บทนํา
การอัตโนมัติการแปลงเอกสาร PDF ในรูปแบบ Microsoft Excel (XLS, XLSX, CSV) เป็นสิ่งสําคัญสําหรับกระบวนการธุรกิจจํานวนมากบทความนี้แสดงให้เห็นว่าวิธีการใช้ Aspose.PDF XLS Converter สําหรับ .NET เพื่อให้ดําเนินการนี้ได้อย่างมีประสิทธิภาพ
ปัญหาโลกจริง
Exporting tables or structured data from PDFs to Excel manually is labor-intensive and error-proof. การอัตโนมัติการแปลงนี้เป็นสิ่งสําคัญสําหรับกระแสทํางานในทางการเงินการรายงานการวิเคราะห์และการปฏิบัติตามที่จํานวนมาก PDF-to- spreadsheet การดําเนินงานที่จําเป็น
ความคิดเห็นเกี่ยวกับโซลูชัน
Aspose.PDF XLS Converter for .NET ช่วยให้คุณ:
- แปลงไฟล์ PDF เดี่ยวหรือหลายไฟล์ไปยังไฟล์ Excel (XLSX, XLS, CSV, ODS, XML)
- การควบคุมโครงสร้างแผ่นงานและรูปแบบ
- การบูรณาการได้อย่างราบรื่นกับโครงการ C#/.NET สําหรับการอัตโนมัติแบบสแกน
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า
- Aspose.PDF สําหรับ .NET ติดตั้งผ่าน NuGet
PM> Install-Package Aspose.PDF
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอนที่ 1: การอ้างอิงพื้นที่ชื่อที่จําเป็น
using Aspose.Pdf.Plugins;
using System.IO;
ขั้นตอน 2: แปลงไฟล์ PDF ไปยัง XLSX
การใช้กรณีและแอพพลิเคชัน (ด้วยการเปลี่ยนแปลงรหัส)
1. การส่งออกไปยัง CSV, XLS, ODS หรือ XML
ระบุรูปแบบการส่งออกที่ต้องการโดยใช้ Format
คุณสมบัติ :
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
2. Batch แปลงหลายไฟล์ PDF ไปยัง Excel
3. ลดจํานวนแผ่นงาน
โดยเริ่มต้นแต่ละหน้า PDF จะกลายเป็นตารางงาน Excel ใหม่ เพื่อบันทึกเนื้อหาทั้งหมดไว้ในแผ่นงานเดียว:
options.MinimizeTheNumberOfWorksheets = true;
4. ใส่คอลัมน์สีขาวเมื่อเริ่มต้น
สําหรับสถานการณ์การนําเข้าข้อมูลบางอย่างคุณอาจต้องการเพิ่มคอลัมน์สีขาวเป็นกลมแรก:
options.InsertBlankColumnAtFirst = true;
การปฏิบัติที่ดีที่สุดและเคล็ดลับ
- แสดงผลลัพธ์เพื่อตรวจสอบการจัดตั้งตารางและความสมบูรณ์ของข้อมูลโดยเฉพาะอย่างยิ่งเมื่อใช้ตัวเลือกจัดวางขั้นสูง
- สําหรับเอกสารขนาดใหญ่ใช้การประมวลผลชุดเพื่ออัตโนมัติการแปลงจํานวนมากได้อย่างมีประสิทธิภาพ
- เมื่อแปลงเป็น CSV, ตรวจสอบ delimiters และ encoding สําหรับ compatibility downstream.
- สําหรับไฟล์ PDF ที่โครงสร้างสูงหรือสแกนเป็นเอกสารก่อนกระบวนการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
ตัวอย่างการดําเนินการที่สมบูรณ์
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = "C:\\Samples\\sample.pdf";
var outputPath = "C:\\Samples\\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
ข้อสรุป
Aspose.PDF XLS Converter สําหรับ .NET ช่วยให้การอัตโนมัติ PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) ได้อย่างรวดเร็วและมีความยืดหยุ่นในโครงการ C# ปล็อคข้อมูลจากไฟล์ PDF, การวิเคราะห์เส้นผ่านศูนย์กลางและการบูรณาการไหลของแผ่นงาน - ทั้งหมดด้วย API ที่เรียบง่ายและมีประสิทธิภาพสูง