Convertir le contenu HTML dans un format JSON structuré est essentiel pour l’intégration des données Web avec des services ou des applications backend. Aspose.Cells pour .NET offre un moyen efficace et simple d’obtenir cette conversion, ce qui le rend idéal pour les développeurs qui cherchent à automatiser le processus d’extraction de données tabulaires des sites Web.
Introduction
Convertir le contenu HTML dans un format JSON structuré est essentiel pour l’intégration des données Web avec des services ou des applications backend. Aspose.Cells pour .NET offre un moyen efficace et simple d’obtenir cette conversion, ce qui le rend idéal pour les développeurs qui cherchent à automatiser le processus d’extraction de données tabulaires des sites Web.
Pourquoi transformer HTML en JSON ?
- Portabilité des données: Transférer les données tabulaires HTML vers des services de backend ou des APIs en tant que JSON.
- Integration Web-application: Extrait de table ou de contenu web structuré pour un traitement ultérieur dans les applications.
- Automation prête: Idéal pour l’automatisation des processus de scrapage web ou d’extraction de contenu.
Guide étape par étape pour convertir HTML à JSON
Étape 1 : Installer Aspose.Cells via NuGet
Installation Aspose.Cells pour .NET :
Install-Package Aspose.Cells
Étape 2 : Créer la licence
Permettre une fonctionnalité complète :
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Étape 3 : Télécharger le fichier HTML
Créer un nouveau livre de travail en téléchargant l’entrée HTML :
Workbook workbook = new Workbook("Sample.html");
Étape 4 : Accès à la dernière cellule
Identifier la dernière cellule dans la feuille de travail pour définir les limites d’exportation :
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Étape 5 : Définir la limite d’exportation
Créez une gamme qui s’étend sur les données de feuille de travail:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Étape 6 : Configurer JsonSaveOptions
Choisissez toutes les options d’exportation :
JsonSaveOptions options = new JsonSaveOptions();
Étape 7 : Exporter à JSON
Sérialisez la gamme définie à JSON :
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Étape 8: Sauvez JSON dans le fichier
Écrivez la sortie sur le disque :
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Problèmes communs et fixations
1 La sortie vide
- Solution: Assurez-vous que le fichier HTML contient des contenus structurés sur la base de table pour la reconnaissance des données valide.
2 - Range incorrect
- Solution: Double-check que la gamme comprend toutes les cellules pertinentes de la feuille de travail.
Formation de l’exportation
- Résolution : Utiliser
JsonSaveOptions
pour contrôler l’indexation des feuilles, échapper aux lignes vides ou personnaliser les hyperliens.