Necessites carregar una cadena HTML o pàgina web a Excel per a processar, visualitzar o emmagatzemar? Aquesta guia explica com convertir el contingut HTML directament a un llibre de treball d’Excel utilitzant Aspose.Cells per .NET.
Introducció
Convertir dades HTML a Excel pot ser una tasca desafiant a causa de la complexitat de les estructures HTML i la necessitat per a la formatació precisa en Excel. No obstant això, amb Aspose.Cells per .NET, aquest procés esdevé senzill i eficient.
Aquest article us passarà a través dels passos necessaris per convertir una cadena HTML o arxiu en un llibre de treball d’Excel utilitzant C .xlsx
El fitxer.
Utilitzar Cases per a HTML a Excel Conversió
- Convertir dades de correu electrònic o CMS a Excel
- Processar els informes HTML o les exportacions de plataformes de tercers
- Importació de taules web en taules estructurades
Guia de pas a pas
Pas 1: Instal·lar Aspose.Cells per a .NET
$ dotnet add package Aspose.Cells
Pas 2: Preparar el HTML com una cinta
Prepara el teu contingut HTML des d’una font externa o directament dins del codi.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Pas 3: Convertir el corrent en el corrent
Convertir la línia HTML en un MemoryStream
Object, que és necessari per carregar contingut HTML.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Pas 4: Carregar el flux HTML amb HtmlLoadOptions
Use HtmlLoadOptions
per carregar el contingut HTML des de la MemoryStream
Crear una nova Workbook
l’objecte.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Pas 5: Treballar amb el llibre de treball (opcional)
Una vegada que el contingut HTML es carrega en un Workbook
, Per exemple, pot voler afegir fórmules o estils.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Pas 6: Salvar el fitxer resultant d’Excel
Finalment, guardar la modificació Workbook
Un arxiu al disc.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Exemple de codi complet
Aquí teniu un exemple complet que demostra com convertir una cadena HTML en un arxiu d’Excel utilitzant Aspose.Cells per a .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
Les millors pràctiques
Pràctica | Beneficis |
---|---|
Utilitzar els fluxos per a la integració web | Més fàcil de gestionar en APIs |
Use HtmlLoadOptions | Personalitzar pars o gestionar continguts HTML avançats |
Columnes autònoms | Millora de la lectura de la producció |
Subsecció: Gestió de estructures complexes HTML
Quan es tracta de estructures complexes HTML, és important utilitzar el HtmlLoadOptions
classe per personalitzar com Aspose.Cells parseix l’HTML. Això pot incloure opcions de configuració com ignorar determinats elements o tractar etiquetes específics de manera diferent.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
Conclusió
Convertir contingut HTML a Excel utilitzant Aspose.Cells per a .NET és una manera poderosa d’integrar dades web en els fluxos de treball de Excel. Seguint aquest guia, vostè serà capaç de gestionar les estructures HTML simples i complexes amb facilitat.