Експортувати таблиці або структуровані дані з PDF-файлів в Excel вручну є неприємною задачею, яка може бути виправдана помилкою.Автоматизація цього процесу за допомогою Aspose.PDF XLS Converter для .NET полегшує і упрощає потоки роботи в галузі фінансів, звіту, аналізу та дотримання.

Введення

Автоматизація конвертації PDF-документів у формати Microsoft Excel (XLS, XLSX, CSV) є ключовим для багатьох бізнес-процесів.Ця стаття демонструє, як використовувати Aspose.PDF XLS Converter для .NET для ефективного виконання цієї задачі.

Реальні проблеми світу

Експортувати таблиці або структуровані дані з PDF до Excel вручну є робочою інтенсивністю і без помилок. Автоматизація цієї конверсії є життєво важливою для робочих потоків у фінансах, звітах, аналізі та відповідності, де потрібні великі операції в форматі PDF-на-розповсюдження.

Огляд рішення

ASPOSE.PDF XLS Converter для .NET дозволяє:

  • Конвертувати одноразові або кілька PDF-файлів в Excel (XLSX, XLS, CSV, ODS, XML)
  • Контроль структури та форматування робочого листа
  • Інтеграція з проектами C#/NET для скальованої автоматизації

Передумови

  • Visual Studio 2019 або вище
  • .NET 6.0 або пізніше
  • Aspose.PDF для .NET встановлено через NuGet
PM> Install-Package Aspose.PDF

Крок за кроком реалізація

Крок 1: Потрібні номінаційні простіри

using Aspose.Pdf.Plugins;
using System.IO;

Крок 2: Конвертувати PDF на XLSX

Використання випадків і додатків (з варіантами коду)

1. Експорт до CSV, XLS, ODS або XML

Визначити бажаний формат виходу за допомогою Format Нерухомість :

options.Format = PdfToXlsOptions.ExcelFormat.CSV; // For CSV output
// options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003; // For Excel XML 2003
// options.Format = PdfToXlsOptions.ExcelFormat.ODS; // For OpenDocument Spreadsheet
// options.Format = PdfToXlsOptions.ExcelFormat.XLSM; // For macro-enabled Excel

2. Batch Convert Multiple PDFs to Excel

3. Мінімальна кількість робочих сторінок

За замовчуванням, кожна сторінка PDF стає новою робочою таблицею Excel. Щоб зберегти весь вміст в одній робочій таблиці:

options.MinimizeTheNumberOfWorksheets = true;

4. Введіть білий стовп на початку

Для певних сценаріїв імпорту даних, можливо, ви хочете додати вільну колонку як першу:

options.InsertBlankColumnAtFirst = true;

Найкращі практики та поради

  • Переглянути вихід для перевірки табличного розташування та цілісності даних, особливо при використанні передових варіантів розташення.
  • Для великих документів використовуйте обробку пакетів для автоматизації масової конверсії ефективно.
  • При конвертації в CSV перевіряйте розмежування і кодування для співвідношення з низьким потоком.
  • Для високо структурованих або сканованих ПДФ, допроцесуальні документи для кращих результатів.

Повний приклад реалізації

using Aspose.Pdf.Plugins;
using System;
using System.IO;
class Program
{
    static void Main()
    {
        var inputPath = "C:\\Samples\\sample.pdf";
        var outputPath = "C:\\Samples\\sample.xlsx";
        var options = new PdfToXlsOptions
        {
            Format = PdfToXlsOptions.ExcelFormat.XLSX,
            MinimizeTheNumberOfWorksheets = true
        };
        options.AddInput(new FileDataSource(inputPath));
        options.AddOutput(new FileDataSource(outputPath));
        using var converter = new PdfXls();
        var result = converter.Process(options);
        Console.WriteLine("PDF converted to Excel successfully!");
    }
}

Заключення

ASPOSE.PDF XLS Converter для .NET дозволяє швидку, міцну і гнучку автоматизацію PDF-to-Excel (XLS / XLSX / CSV / XML / ODS) в проектах C#. Відключити дані з PDF, аналітику рішучості та інтегрувати робочі потоки ширини - все з простим, високопродуктивним API.

More in this category