Convertir le contenu HTML dans un format JSON structuré est essentiel pour l’intégration des données Web avec des services ou des applications backend. Aspose.Cells pour .NET offre un moyen efficace et simple d’obtenir cette conversion, ce qui le rend idéal pour les développeurs qui cherchent à automatiser le processus d’extraction de données tabulaires des sites Web.

Introduction

Convertir le contenu HTML dans un format JSON structuré est essentiel pour l’intégration des données Web avec des services ou des applications backend. Aspose.Cells pour .NET offre un moyen efficace et simple d’obtenir cette conversion, ce qui le rend idéal pour les développeurs qui cherchent à automatiser le processus d’extraction de données tabulaires des sites Web.

Pourquoi transformer HTML en JSON ?

  • Portabilité des données: Transférer les données tabulaires HTML vers des services de backend ou des APIs en tant que JSON.
  • Integration Web-application: Extrait de table ou de contenu web structuré pour un traitement ultérieur dans les applications.
  • Automation prête: Idéal pour l’automatisation des processus de scrapage web ou d’extraction de contenu.

Guide étape par étape pour convertir HTML à JSON

Étape 1 : Installer Aspose.Cells via NuGet

Installation Aspose.Cells pour .NET :

Install-Package Aspose.Cells

Étape 2 : Créer la licence

Permettre une fonctionnalité complète :

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Étape 3 : Télécharger le fichier HTML

Créer un nouveau livre de travail en téléchargant l’entrée HTML :

Workbook workbook = new Workbook("Sample.html");

Étape 4 : Accès à la dernière cellule

Identifier la dernière cellule dans la feuille de travail pour définir les limites d’exportation :

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Étape 5 : Définir la limite d’exportation

Créez une gamme qui s’étend sur les données de feuille de travail:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Étape 6 : Configurer JsonSaveOptions

Choisissez toutes les options d’exportation :

JsonSaveOptions options = new JsonSaveOptions();

Étape 7 : Exporter à JSON

Sérialisez la gamme définie à JSON :

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Étape 8: Sauvez JSON dans le fichier

Écrivez la sortie sur le disque :

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problèmes communs et fixations

1 La sortie vide

  • Solution: Assurez-vous que le fichier HTML contient des contenus structurés sur la base de table pour la reconnaissance des données valide.

2 - Range incorrect

  • Solution: Double-check que la gamme comprend toutes les cellules pertinentes de la feuille de travail.

Formation de l’exportation

  • Résolution : Utiliser JsonSaveOptions pour contrôler l’indexation des feuilles, échapper aux lignes vides ou personnaliser les hyperliens.

More in this category