Potřebujete stáhnout HTML řetězec nebo webovou stránku do Excelu pro zpracování, vizualizace nebo ukládání?Tento průvodce vysvětluje, jak převést obsah HTML přímo do pracovní knihy Excelu pomocí Aspose.Cells pro .NET.
Úvod
Převod dat HTML do Excelu může být náročným úkolem vzhledem k složitosti struktur HTML a potřebě přesného formátování v programu Excel. Nicméně s Aspose.Cells pro .NET se tento proces stává jednoduchým a efektivním.
Tento článek vám ukáže kroky potřebné pro konverzi HTML řetězu nebo souboru do Excel workbook pomocí C#. .xlsx
a souboru.
Použití případů pro konverzi HTML do Excelu
- Převod e-mailu nebo CMS dat do Excelu
- Zpracování HTML zpráv nebo exportů z platform třetích stran
- Import webových tabulek do strukturovaných šířek
Krok za krokem průvodce
Krok 1: Instalace Aspose.Cells pro .NET
$ dotnet add package Aspose.Cells
Krok 2: Připravte HTML jako řetěz
Připravte svůj obsah HTML buď z externího zdroje, nebo přímo v rámci kódu.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Krok 3: Přeměna pruhů na proud
Přeměna HTML řetězce na MemoryStream
Objekt, který je nezbytný pro načítání HTML obsahu.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Krok 4: Stáhněte HTML Stream s HTMLLoadOptions
Použití HtmlLoadOptions
Přihlašování obsahu HTML z MemoryStream
Vytvořte novou Workbook
a předmětem
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Krok 5: Práce s pracovní knihou (voliteln)
Jakmile je obsah HTML nahrazen do Workbook
, můžete to manipulovat podle potřeby. například, můžete chtít přidat vzorce nebo styly.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Krok 6: Shromažďujte výsledný soubor Excel
Zbavte se změněného Workbook
Přidat soubor na disk.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Kompletní příklad kódu
Zde je kompletní příklad, který ukazuje, jak převést řádek HTML do souboru Excel pomocí Aspose.Cells pro .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
Nejlepší postupy
Praktika | Výhoda |
---|---|
Použití streamů pro webovou integraci | Jednodušší zvládnout v APIs |
Použití HtmlLoadOptions | Přizpůsobte parsing nebo zpracování pokročilého HTML obsahu |
Auto-vhodné sloupce | Zlepšení čitelnosti produkce |
Předmět: Zpracování komplexních struktur HTML
Při řešení složitých struktur HTML je důležité použít HtmlLoadOptions
třída přizpůsobit, jak Aspose.Cells pars HTML. To může zahrnovat možnosti nastavení, jako je ignorování určitých prvků nebo zacházení s konkrétními tagy jinak.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
závěr
Konverzace obsahu HTML do Excelu pomocí Aspose.Cells pro .NET je silný způsob, jak integrovat webové údaje do pracovních toků programu Excel. Sledováním tohoto průvodce budete moci jednoduše zvládnout jednoduché a složité struktury HTML.