Adakah anda perlu memuatkan string HTML atau halaman web ke dalam Excel untuk pemprosesan, visualisasi, atau penyimpanan? panduan ini menerangkan bagaimana untuk menukar kandungan HTML secara langsung ke buku kerja Excel menggunakan Aspose.Cells untuk .NET .

Introduction

Menukar data HTML kepada Excel boleh menjadi tugas yang mencabar kerana kerumitan struktur HTML dan keperluan untuk pemformatan yang tepat dalam Excel. Walau bagaimanapun, dengan Aspose.Cells untuk .NET, proses ini menjadi mudah dan cekap.

Artikel ini akan berjalan anda melalui langkah-langkah yang diperlukan untuk menukar string HTML atau fail ke dalam buku kerja Excel menggunakan C#. .xlsx fail yang

Menggunakan Kasus untuk HTML ke Excel Konversi

  • Menukar e-mel atau data CMS ke dalam Excel
  • Memproses laporan HTML atau eksport daripada platform pihak ketiga
  • Mengimport jadual web ke dalam skrin terstruktur

Panduan Langkah-Langkah

Langkah 1: Instal Aspose.Cells untuk .NET

$ dotnet add package Aspose.Cells

Langkah 2: Sediakan HTML sebagai string

Sediakan kandungan HTML anda sama ada daripada sumber luaran atau secara langsung dalam kod.

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

Langkah 3: Menukar tali kepada aliran

Menukar string HTML kepada a MemoryStream objek, yang diperlukan untuk memuatkan kandungan HTML.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

Langkah 4: Muat turun HTML Stream dengan HtmlLoadOptions

Use HtmlLoadOptions untuk memuatkan kandungan HTML daripada MemoryStream dan mencipta yang baru Workbook objek yang

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

Langkah 5: Bekerja dengan buku kerja (pilihan)

Sebaik sahaja kandungan HTML diisi ke dalam Workbook, anda boleh memanipulasi seperti yang diperlukan. contohnya, anda mungkin mahu menambah formula atau gaya.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

Langkah 6: Simpan fail Excel yang berjaya

Akhirnya, menyimpan perubahan Workbook untuk fail pada cakera.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

Contoh Kod Lengkap

Berikut ialah contoh lengkap yang menunjukkan bagaimana untuk menukar string HTML ke dalam fail Excel menggunakan Aspose.Cells untuk .NET.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

amalan terbaik

PracticeBenefit
Menggunakan aliran untuk integrasi webLebih mudah untuk mengendalikan APIs
Use HtmlLoadOptionsMenyesuaikan parsing atau mengendalikan kandungan HTML canggih
Perbezaan kolomMeningkatkan kebolehpercayaan produk

Subseksyen: Mengendalikan struktur HTML yang kompleks

Apabila berurusan dengan struktur HTML yang kompleks, ia adalah penting untuk menggunakan HtmlLoadOptions kelas untuk menyesuaikan bagaimana Aspose.Cells merangkumi HTML. Ini boleh termasuk pilihan tetapan seperti mengabaikan unsur-unsur tertentu atau mengendalikan tag tertentu berbeza.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

Conclusion

Menukar kandungan HTML kepada Excel menggunakan Aspose.Cells untuk .NET adalah cara yang kuat untuk mengintegrasikan data web ke dalam aliran kerja Excel anda.Dengan mengikuti panduan ini, anda akan dapat mengendalikan kedua-dua struktur HTML yang mudah dan kompleks dengan mudah.

More in this category