Necessites carregar una cadena HTML o pàgina web a Excel per a processar, visualitzar o emmagatzemar? Aquesta guia explica com convertir el contingut HTML directament a un llibre de treball d’Excel utilitzant Aspose.Cells per .NET.

Introducció

Convertir dades HTML a Excel pot ser una tasca desafiant a causa de la complexitat de les estructures HTML i la necessitat per a la formatació precisa en Excel. No obstant això, amb Aspose.Cells per .NET, aquest procés esdevé senzill i eficient.

Aquest article us passarà a través dels passos necessaris per convertir una cadena HTML o arxiu en un llibre de treball d’Excel utilitzant C .xlsx El fitxer.

Utilitzar Cases per a HTML a Excel Conversió

  • Convertir dades de correu electrònic o CMS a Excel
  • Processar els informes HTML o les exportacions de plataformes de tercers
  • Importació de taules web en taules estructurades

Guia de pas a pas

Pas 1: Instal·lar Aspose.Cells per a .NET

$ dotnet add package Aspose.Cells

Pas 2: Preparar el HTML com una cinta

Prepara el teu contingut HTML des d’una font externa o directament dins del codi.

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

Pas 3: Convertir el corrent en el corrent

Convertir la línia HTML en un MemoryStream Object, que és necessari per carregar contingut HTML.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

Pas 4: Carregar el flux HTML amb HtmlLoadOptions

Use HtmlLoadOptions per carregar el contingut HTML des de la MemoryStream Crear una nova Workbook l’objecte.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

Pas 5: Treballar amb el llibre de treball (opcional)

Una vegada que el contingut HTML es carrega en un Workbook, Per exemple, pot voler afegir fórmules o estils.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

Pas 6: Salvar el fitxer resultant d’Excel

Finalment, guardar la modificació Workbook Un arxiu al disc.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

Exemple de codi complet

Aquí teniu un exemple complet que demostra com convertir una cadena HTML en un arxiu d’Excel utilitzant Aspose.Cells per a .NET.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

Les millors pràctiques

PràcticaBeneficis
Utilitzar els fluxos per a la integració webMés fàcil de gestionar en APIs
Use HtmlLoadOptionsPersonalitzar pars o gestionar continguts HTML avançats
Columnes autònomsMillora de la lectura de la producció

Subsecció: Gestió de estructures complexes HTML

Quan es tracta de estructures complexes HTML, és important utilitzar el HtmlLoadOptions classe per personalitzar com Aspose.Cells parseix l’HTML. Això pot incloure opcions de configuració com ignorar determinats elements o tractar etiquetes específics de manera diferent.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

Conclusió

Convertir contingut HTML a Excel utilitzant Aspose.Cells per a .NET és una manera poderosa d’integrar dades web en els fluxos de treball de Excel. Seguint aquest guia, vostè serà capaç de gestionar les estructures HTML simples i complexes amb facilitat.

More in this category