Експортирането на таблици или структурирани данни от PDF до Excel ръчно е тъжна задача, която може да бъде причинена от грешки.Автоматизиране на този процес с Aspose.PDF XLS Converter за .NET опростява и улеснява работните потоци в областта на финансите, докладите, анализите и съответствието.
Въведение
Автоматизирането на конвертацията на PDF документи в формати на Microsoft Excel (XLS, XLSX, CSV) е от решаващо значение за много бизнес процеси. Тази статия показва как да използвате Aspose.PDF XLS Converter за .NET, за да постигнете тази задача ефективно.
Реални световни проблеми
Експортирането на таблици или структурирани данни от PDF до Excel ръчно е трудова интензивност и без грешки. Автоматизиране на тази конверсия е от жизненоважно значение за работните потоци в областта на финансите, докладите, анализите и съответствието, където са необходими масови PDF-на-прозрачни операции.
Преглед на решението
ASPOSE.PDF XLS Converter за .NET ви позволява:
- Конвертирайте единични или множество PDF файлове в Excel (XLSX, XLS, CSV, ODS, XML)
- Управление на структурата и форматирането на работния лист
- Интегрирайте гладко с проекти на C#/NET за скалираща автоматизация
Предупреждения
- Visual Studio 2019 или по-късно
- .NET 6.0 или по-късно
- Aspose.PDF за .NET, инсталиран чрез NuGet
PM> Install-Package Aspose.PDF
Стъпка по стъпка изпълнение
Стъпка 1: Предоставяне на необходимите имена
using Aspose.Pdf.Plugins;
using System.IO;
Стъпка 2: Конвертиране на PDF към XLSX
Използване на случаи и приложения (с код вариации)
1. Износ към CSV, XLS, ODS или XML
Определете желания формат за изход, като използвате Format
Имотът е:
options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel
2. Batch конвертира няколко PDF файла в Excel
3. Намаляване на броя на работните карти
По подразбиране, всяка PDF страница се превръща в нов работен лист на Excel. За да се съхранява цялото съдържание в една работна листа:
options.MinimizeTheNumberOfWorksheets = true;
4. Вмъкнете бяла колона в началото
За определени сценарии за внос на данни, може да искате да добавите бял колона като първия:
options.InsertBlankColumnAtFirst = true;
Най-добри практики и съвети
- Преглед на изхода, за да се провери расположението на таблицата и целостта на данните, особено при използване на усъвършенствани опции за расположение.
- За големи документи, използвайте обработка на партиди, за да автоматизирате конвертирането на маси ефективно.
- Когато конвертирате към CSV, проверете делимитерите и кодирането за съвместимост на потока надолу.
- За високо структурирани или сканирани PDF документи, предварително обработени документи за най-добри резултати.
Допълнителен пример за изпълнение
using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
static void Main()
{
var inputPath = "C:\\Samples\\sample.pdf";
var outputPath = "C:\\Samples\\sample.xlsx";
var options = new PdfToXlsOptions
{
Format = PdfToXlsOptions.ExcelFormat.XLSX,
MinimizeTheNumberOfWorksheets = true
};
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));
using var converter = new PdfXls();
var result = converter.Process(options);
Console.WriteLine("PDF converted to Excel successfully!");
}
}
заключение
Aspose.PDF XLS Converter за .NET позволява бързо, стабилно и гъвкаво автоматизиране на PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в проекти C#. Отключване на данни от PDFs, аналитични линии и интегрирани работни потоци - всички с проста, високопроизводителна API.