Moet u een HTML-lijn of webpagina in Excel laden voor verwerking, visualisering of opslag?Deze gids legt uit hoe u HTML-inhoud rechtstreeks in een Excel-werkboek kunt converteren met behulp van Aspose.Cells voor .NET.

Introductie

Het omzetten van HTML-gegevens naar Excel kan een uitdagende taak zijn vanwege de complexiteit van html-structuren en de behoefte aan nauwkeurige formatting in Excel. echter, met Aspose.Cells voor .NET, wordt dit proces eenvoudig en efficiënt.

Dit artikel gaat u door de stappen die nodig zijn om een HTML string of bestand in een Excel werkboek met behulp van C# te converteren. .xlsx Het bestand.

Gebruik Cases voor HTML naar Excel Conversie

  • Convert e-mail of CMS-gegevens naar Excel
  • Verwerking van HTML-rapporten of exports van platforms van derden
  • Importeer webtables in gestructureerde spreadsheets

Step-by-step gids

Stap 1: Installeer Aspose.Cells voor .NET

$ dotnet add package Aspose.Cells

Stap 2: Voorbereid HTML als een string

Voorbereid uw HTML-inhoud van een externe bron of rechtstreeks binnen de code.

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

Stap 3: Convert String naar Stream

Omzetten van de HTML string naar een MemoryStream object, die vereist is voor het laden van HTML-inhoud.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

Stap 4: Download HTML Stream met HtmlLoadOptions

Gebruik HtmlLoadOptions om de HTML-inhoud van de MemoryStream en een nieuw creëren Workbook Het object.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

Stap 5: Werk met het werkboek (optional)

Zodra de HTML-inhoud is geladen in een WorkbookU kunt het zoals nodig manipuleren. bijvoorbeeld, u kunt formules of stijlen toevoegen.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

Stap 6: Save the Resulting Excel File

Ten slotte, het gemodificeerde Workbook Een bestand op de schijf.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

Volledige code voorbeeld

Hier is een volledige voorbeeld die laat zien hoe je een HTML string in een Excel-bestand kunt converteren met behulp van Aspose.Cells voor .NET.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

Beste praktijken

De praktijkVoordelen
Gebruik streams voor webintegratieMakkelijker te beheren in APIs
Gebruik HtmlLoadOptionsCustomiseer parsing of beheren van geavanceerde HTML-inhoud
Auto-fit kolomVerbetering van de leesbaarheid van de productie

Onderdeel: Het beheren van complexe HTML-structuur

Bij het omgaan met complexe HTML-structuren is het belangrijk om de HtmlLoadOptions Klassen om te personaliseren hoe Aspose.Cells de HTML verspreidt. Dit kan opties omvatten, zoals het negeren van bepaalde elementen of het behulp van specifieke tags anders.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

Conclusie

Het converteren van HTML-inhoud naar Excel met behulp van Aspose.Cells voor .NET is een krachtige manier om webgegevens te integreren in uw Excel-werkstromen. door deze gids te volgen, zult u in staat zijn om zowel eenvoudige als complexe HTML structuren gemakkelijk te beheren.

More in this category