Trebuie să încărcați o stringă HTML sau o pagină web în Excel pentru prelucrare, vizualizare sau stocare? Acest ghid explică cum să convertiți conținutul HTML direct într-un manual Excel folosind Aspose.Cells pentru .NET.
Introducere
Conversia datelor HTML în Excel poate fi o sarcină dificilă datorită complexității structurilor HTML și nevoii de formatare precisă din Excel. Cu toate acestea, cu Aspose.Cells pentru .NET, acest proces devine simplu și eficient.
Acest articol vă va trece prin pașii necesari pentru a converti un string HTML sau fișier într-o carte de lucru Excel folosind C#. Vom acoperi totul de la instalarea pachetului necesar la salvarea rezultatului final ca un .xlsx
fişieră .
Utilizarea cazurilor pentru HTML în Excel Conversion
- Convertarea datelor de e-mail sau CMS în Excel
- Procesarea rapoartelor HTML sau a exporturilor de pe platforme terțe
- Importați tabele web în broșuri structurate
Ghidul pas cu pas
Pasul 1: Instalați Aspose.Cells pentru .NET
$ dotnet add package Aspose.Cells
Pasul 2: Pregătiți HTML ca o bandă
Pregătiți conținutul HTML fie dintr-o sursă externă, fie direct în cod.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Pasul 3: Conversați strangul în flux
Convertați stringul HTML într-un MemoryStream
Obiect, care este necesar pentru încărcarea conținutului HTML.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Pasul 4: Încărcați HTML Stream cu HtmlLoadOptions
Utilizarea HtmlLoadOptions
pentru a încărca conținutul HTML din MemoryStream
Crearea unui nou Workbook
Obiectul .
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Pasul 5: Lucrați cu cartea de lucru (opțional)
După ce conținutul HTML este încărcat în Workbook
, puteți manipula după cum este necesar. de exemplu, ar putea dori să adăugați formule sau stiluri.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Pasul 6: Salvați fișierul rezultat Excel
În cele din urmă, salvați modificarea Workbook
pentru un fișier pe disc.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Exemplu complet de cod
Iată un exemplu complet care demonstrează modul de a converti un string HTML într-un fișier Excel folosind Aspose.Cells pentru .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
Cele mai bune practici
practică | Beneficii |
---|---|
Utilizați fluxuri pentru integrarea web | Mai ușor de gestionat în APIs |
Utilizarea HtmlLoadOptions | Personalizarea parsing-ului sau gestionarea conținutului HTML avansat |
Columnele Auto-Fit | Îmbunătățirea readabilității producției |
Cuvânt cheie: structuri HTML complexe
Atunci când se ocupă cu structurile HTML complexe, este important să se utilizeze HtmlLoadOptions
Clasa pentru a personaliza modul în care Aspose.Cells parsează HTML. Acest lucru poate include opțiuni de setare, cum ar fi ignorarea anumitor elemente sau manipularea unor etichete specifice diferit.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
concluziile
Conversia conținutului HTML în Excel folosind Aspose.Cells pentru .NET este o modalitate puternică de a integra datele web în fluxurile de lucru Excel. Urmând acest ghid, veți putea gestiona atât structurile simple, cât și complexe HTML cu ușurință.