Potrebujete nahrať HTML riadok alebo webovú stránku do programu Excel na spracovanie, vizualizáciu alebo ukladanie?Tento sprievodca vysvetľuje, ako previesť obsah HTML priamo do pracovnej knihy programu Excel pomocou Aspose.Cells pre .NET.
Úvod
Konverzia údajov HTML do programu Excel môže byť náročnou úlohou kvôli zložitosti štruktúr HTML a potrebe presného formátovania v programe Excel. Avšak s aplikáciou Aspose.Cells pre .NET sa tento proces stáva jednoduchým a efektívnym.
Tento článok vás bude prechádzať krokami potrebnými na konverziu HTML riadku alebo súboru do pracovnej knihy Excelu pomocou C#. .xlsx
súbory .
Použitie prípadov pre konverziu HTML do programu Excel
- Konvertovať e-mail alebo CMS údaje do programu Excel
- Spracovanie správ HTML alebo exportov z platformy tretích strán
- Importovať webové tabuľky do štruktúrovaných šípkov
Krok za krokom sprievodca
Krok 1: Inštalácia Aspose.Cells pre .NET
$ dotnet add package Aspose.Cells
Krok 2: Pripravte HTML ako pruh
Pripravte svoj obsah HTML buď z vonkajšieho zdroja alebo priamo v rámci kódu.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Krok 3: Konvertovať prúd na prúd
Konvertovať HTML riadok na MemoryStream
objekt, ktorý je potrebný na načítanie obsahu HTML.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Krok 4: Nahrať HTML Stream s HtmlLoadOptions
Použitie HtmlLoadOptions
Prečítajte si HTML obsah z MemoryStream
Vytvorte si novú Workbook
na objekty.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Krok 5: Práca s pracovnou knihou (voliteľné)
Keď je obsah HTML nahraný do Workbook
, môžete ho manipulovať podľa potreby. napríklad by ste mohli chcieť pridať vzorce alebo štýly.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Krok 6: Uložiť výsledný súbor Excel
Nakoniec, zachrániť upravené Workbook
Do súboru na disku.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Kompletný príklad kódu
Tu je kompletný príklad, ktorý ukazuje, ako premeniť HTML riadok do súboru Excel pomocou Aspose.Cells pre .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
Najlepšie postupy
Praktická | Výhody |
---|---|
Použitie streamov pre webovú integráciu | Ľahšie sa zaobchádzať s APIs |
Použitie HtmlLoadOptions | Prispôsobenie alebo manipulácia s pokročilým obsahom HTML |
Auto-vhodné kolóny | Zlepšenie čitateľnosti produkcie |
Podsekcia: Spracovanie komplexných HTML štruktúr
Pri riešení zložitých štruktúr HTML je dôležité použiť HtmlLoadOptions
triedy na prispôsobenie toho, ako Aspose.Cells porazí HTML. To môže zahŕňať možnosti nastavenia, napríklad ignorovať určité prvky alebo zaobchádzať s konkrétnymi značkami inak.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
Záver
Konverzia obsahu HTML do Excelu pomocou Aspose.Cells pre .NET je silný spôsob, ako integrovať webové údaje do pracovných tokov programu Excel.Sledovaním tohto sprievodcu budete môcť ľahko zvládnuť jednoduché a zložité štruktúry HTML.