Konwersja zawartości HTML do strukturowanego formatu JSON jest niezbędna do integracji danych internetowych z usługami lub aplikacjami backend. Aspose.Cells dla .NET oferuje efektywny i prosty sposób na osiągnięcie tej konwersji, dzięki czemu jest to idealny sposób dla deweloperów, którzy chcą zautomatyzować proces ekstrakcji danych tabularnych z witryn.

Wprowadzenie

Konwersja zawartości HTML do strukturowanego formatu JSON jest niezbędna do integracji danych internetowych z usługami lub aplikacjami backend. Aspose.Cells dla .NET oferuje efektywny i prosty sposób na osiągnięcie tej konwersji, dzięki czemu jest to idealny sposób dla deweloperów, którzy chcą zautomatyzować proces ekstrakcji danych tabularnych z witryn.

Dlaczego warto konwertować HTML na JSON?

  • Portabilność danych: Przekazywanie tabelowych danych HTML do usług backend lub APIs jako JSON.
  • Web-to-App Integracja: Ekstrakcja tabeli lub strukturowanego treści internetowej do dalszego przetwarzania w aplikacjach.
  • Automation Ready: Idealny do automatyzacji procesów skraplenia sieci Web lub ekstrakcji treści.

Przewodnik krok po kroku do konwersji HTML do JSON

Krok 1: Zainstaluj Aspose.Cells za pośrednictwem NuGet

Instalacja Aspose.Cells dla .NET:

Install-Package Aspose.Cells

Krok 2: Ustaw licencję

Zapewnienie pełnej funkcjonalności:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Krok 3: Pobierz plik HTML

Tworzenie nowej księgi roboczej poprzez ładowanie wpisu HTML:

Workbook workbook = new Workbook("Sample.html");

Krok 4: Dostęp do ostatniej komórki

Zidentyfikuj ostatnią komórkę w tablicy roboczej, aby określić granice eksportu:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Krok 5: Określenie zakresu eksportu

Stwórz zakres, który rozciąga dane z arkusza roboczego:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Krok 6: Konfiguruj JsonSaveOptions

Wybierz dowolne opcje eksportu:

JsonSaveOptions options = new JsonSaveOptions();

Krok 7: Eksport do JSON

Seriować określony zakres do JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Krok 8: Zapisz JSON do pliku

Wpisz wyjście na dyski:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Wspólne problemy i korekty

1 Puste wyjście

  • Rozwiązanie: Upewnij się, że plik HTML zawiera strukturowane treści oparte na tabeli dla ważnego rozpoznawania danych.

2. niewłaściwy zakres

  • Rozwiązanie: Podwójne sprawdzenie, że zakres zawiera wszystkie odpowiednie komórki z arkusza roboczego.

Formaty eksportowe

  • Rozwiązanie: Użyj JsonSaveOptions Aby kontrolować indeksowanie arkuszy, przebić pustych kolejek lub dostosować hiperłącze.

More in this category