Besoin de charger un fil HTML ou une page Web dans Excel pour le traitement, la visualisation ou le stockage?Cette guide explique comment convertir le contenu HTML directement dans un livre de travail Excel en utilisant Aspose.Cells pour .NET.
Introduction
Convertir les données HTML à Excel peut être une tâche difficile en raison de la complexité des structures HTML et de l’exigence de formatage précis dans Excel. Cependant, avec Aspose.Cells pour .NET, ce processus devient simple et efficace.
Cet article vous suivra les étapes nécessaires pour convertir un fil HTML ou un fichier dans un ouvrage Excel en utilisant C#. Nous couvrirons tout depuis l’installation du paquet nécessaire pour économiser la sortie finale en tant que .xlsx le fichier.
Utiliser des cas pour HTML à Excel Conversion
- Convertir les données de messagerie ou CMS en Excel
- Traitement des rapports HTML ou des exportations de plateformes tiers
- Importer des tables Web dans des brochures structurées
Guide étape par étape
Étape 1 : Installer Aspose.Cells pour .NET
$ dotnet add package Aspose.Cells
Étape 2 : Préparez le HTML comme un filet
Préparez votre contenu HTML soit à partir d’une source extérieure, soit directement au sein du code.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Étape 3 : Convertir le fil en courant
Convertir le fil HTML en un MemoryStream Objet, qui est nécessaire pour le chargement de contenu HTML.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Étape 4 : Télécharger le flux HTML avec les options HTML
Utiliser HtmlLoadOptions pour télécharger le contenu HTML de la MemoryStream Créer une nouvelle Workbook L’objet.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Étape 5 : Travailler avec le livre de travail (optionnel)
Une fois que le contenu HTML est chargé dans un Workbook, Vous pouvez le manipuler comme nécessaire. par exemple, vous pourriez vouloir ajouter des formules ou des styles.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Étape 6: Enregistrer le fichier Excel résultant
En fin de compte, sauvez la modification Workbook Un fichier sur le disque.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Exemple de code complet
Voici un exemple complet qui montre comment convertir une tranche HTML dans un fichier Excel en utilisant Aspose.Cells pour .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
Migliori pratiche
| La pratique | Les avantages |
|---|---|
| Utiliser les flux pour l’intégration web | Plus facile à gérer dans les APIs |
Utiliser HtmlLoadOptions | Customiser le partage ou gérer le contenu HTML avancé |
| Colonne automatique | Améliorer la lecture de la production |
Sujet: Traitement des structures HTML complexes
Lorsqu’il s’agit de structures HTML complexes, il est important d’utiliser les HtmlLoadOptions classe pour personnaliser comment Aspose.Cells parse le HTML. Cela peut inclure des options de configuration telles que l’ignorance d’éléments spécifiques ou la manipulation de tags spéciaux différemment.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
Conclusion
Convertir le contenu HTML à Excel en utilisant Aspose.Cells pour .NET est un moyen puissant d’intégrer les données Web dans vos flux de travail Excel. En suivant ce guide, vous serez en mesure de gérer facilement les structures HTML simples et complexes.