Besoin de charger un fil HTML ou une page Web dans Excel pour le traitement, la visualisation ou le stockage?Cette guide explique comment convertir le contenu HTML directement dans un livre de travail Excel en utilisant Aspose.Cells pour .NET.

Introduction

Convertir les données HTML à Excel peut être une tâche difficile en raison de la complexité des structures HTML et de l’exigence de formatage précis dans Excel. Cependant, avec Aspose.Cells pour .NET, ce processus devient simple et efficace.

Cet article vous suivra les étapes nécessaires pour convertir un fil HTML ou un fichier dans un ouvrage Excel en utilisant C#. Nous couvrirons tout depuis l’installation du paquet nécessaire pour économiser la sortie finale en tant que .xlsx le fichier.

Utiliser des cas pour HTML à Excel Conversion

  • Convertir les données de messagerie ou CMS en Excel
  • Traitement des rapports HTML ou des exportations de plateformes tiers
  • Importer des tables Web dans des brochures structurées

Guide étape par étape

Étape 1 : Installer Aspose.Cells pour .NET

$ dotnet add package Aspose.Cells

Étape 2 : Préparez le HTML comme un filet

Préparez votre contenu HTML soit à partir d’une source extérieure, soit directement au sein du code.

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

Étape 3 : Convertir le fil en courant

Convertir le fil HTML en un MemoryStream Objet, qui est nécessaire pour le chargement de contenu HTML.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

Étape 4 : Télécharger le flux HTML avec les options HTML

Utiliser HtmlLoadOptions pour télécharger le contenu HTML de la MemoryStream Créer une nouvelle Workbook L’objet.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

Étape 5 : Travailler avec le livre de travail (optionnel)

Une fois que le contenu HTML est chargé dans un Workbook, Vous pouvez le manipuler comme nécessaire. par exemple, vous pourriez vouloir ajouter des formules ou des styles.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

Étape 6: Enregistrer le fichier Excel résultant

En fin de compte, sauvez la modification Workbook Un fichier sur le disque.

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

Exemple de code complet

Voici un exemple complet qui montre comment convertir une tranche HTML dans un fichier Excel en utilisant Aspose.Cells pour .NET.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

Migliori pratiche

La pratiqueLes avantages
Utiliser les flux pour l’intégration webPlus facile à gérer dans les APIs
Utiliser HtmlLoadOptionsCustomiser le partage ou gérer le contenu HTML avancé
Colonne automatiqueAméliorer la lecture de la production

Sujet: Traitement des structures HTML complexes

Lorsqu’il s’agit de structures HTML complexes, il est important d’utiliser les HtmlLoadOptions classe pour personnaliser comment Aspose.Cells parse le HTML. Cela peut inclure des options de configuration telles que l’ignorance d’éléments spécifiques ou la manipulation de tags spéciaux différemment.

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

Conclusion

Convertir le contenu HTML à Excel en utilisant Aspose.Cells pour .NET est un moyen puissant d’intégrer les données Web dans vos flux de travail Excel. En suivant ce guide, vous serez en mesure de gérer facilement les structures HTML simples et complexes.

More in this category