Potrebujete nahrať HTML riadok alebo webovú stránku do programu Excel na spracovanie, vizualizáciu alebo ukladanie?Tento sprievodca vysvetľuje, ako previesť obsah HTML priamo do pracovnej knihy programu Excel pomocou Aspose.Cells pre .NET.

Úvod

Konverzia údajov HTML do programu Excel môže byť náročnou úlohou kvôli zložitosti štruktúr HTML a potrebe presného formátovania v programe Excel. Avšak s aplikáciou Aspose.Cells pre .NET sa tento proces stáva jednoduchým a efektívnym.

Tento článok vás bude prechádzať krokami potrebnými na konverziu HTML riadku alebo súboru do pracovnej knihy Excelu pomocou C#. .xlsx súbory .

Použitie prípadov pre konverziu HTML do programu Excel

  • Konvertovať e-mail alebo CMS údaje do programu Excel
  • Spracovanie správ HTML alebo exportov z platformy tretích strán
  • Importovať webové tabuľky do štruktúrovaných šípkov

Krok za krokom sprievodca

Krok 1: Inštalácia Aspose.Cells pre .NET

$ dotnet add package Aspose.Cells

Krok 2: Pripravte HTML ako pruh

Pripravte svoj obsah HTML buď z vonkajšieho zdroja alebo priamo v rámci kódu.

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

Krok 3: Konvertovať prúd na prúd

Konvertovať HTML riadok na MemoryStream objekt, ktorý je potrebný na načítanie obsahu HTML.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

Krok 4: Nahrať HTML Stream s HtmlLoadOptions

Použitie HtmlLoadOptions Prečítajte si HTML obsah z MemoryStream Vytvorte si novú Workbook na objekty.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

Krok 5: Práca s pracovnou knihou (voliteľné)

Keď je obsah HTML nahraný do Workbook, môžete ho manipulovať podľa potreby. napríklad by ste mohli chcieť pridať vzorce alebo štýly.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

Krok 6: Uložiť výsledný súbor Excel

Nakoniec, zachrániť upravené Workbook Do súboru na disku.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

Kompletný príklad kódu

Tu je kompletný príklad, ktorý ukazuje, ako premeniť HTML riadok do súboru Excel pomocou Aspose.Cells pre .NET.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

Najlepšie postupy

PraktickáVýhody
Použitie streamov pre webovú integráciuĽahšie sa zaobchádzať s APIs
Použitie HtmlLoadOptionsPrispôsobenie alebo manipulácia s pokročilým obsahom HTML
Auto-vhodné kolónyZlepšenie čitateľnosti produkcie

Podsekcia: Spracovanie komplexných HTML štruktúr

Pri riešení zložitých štruktúr HTML je dôležité použiť HtmlLoadOptions triedy na prispôsobenie toho, ako Aspose.Cells porazí HTML. To môže zahŕňať možnosti nastavenia, napríklad ignorovať určité prvky alebo zaobchádzať s konkrétnymi značkami inak.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

Záver

Konverzia obsahu HTML do Excelu pomocou Aspose.Cells pre .NET je silný spôsob, ako integrovať webové údaje do pracovných tokov programu Excel.Sledovaním tohto sprievodcu budete môcť ľahko zvládnuť jednoduché a zložité štruktúry HTML.

More in this category