Претварање ХТМЛ садржаја у структурирани ЈСОН формат је од суштинског значаја за интегрисање веб података са бацхенд услугама или апликацијама.Аппосе.Целс за .НЕТ нуди ефикасан и једноставан начин за постизање ове конверзије, чинећи га идеалним за програмери који желе да аутоматизују процес извлачења табеларних информација са сајтова.
Увод
Претварање ХТМЛ садржаја у структурирани ЈСОН формат је од суштинског значаја за интегрисање веб података са бацхенд услугама или апликацијама.Аппосе.Целс за .НЕТ нуди ефикасан и једноставан начин за постизање ове конверзије, чинећи га идеалним за програмери који желе да аутоматизују процес извлачења табеларних информација са сајтова.
Zašto pretvoriti HTML u JSON?
- Портабилност података: Пренос табеларних ХТМЛ подаци у услуге бацкенда или АПИ-а као ЈСОН.
- Web-to-App Интеграција: Екстракт табела или структурираног веб садржаја за даље обраду у апликацијама.
- Аутоматизација спремна: Идеална за аутоматизацију веб скрапања или процеса извлачења садржаја.
Корак по корак водич за конверзију ХТМЛ-а у ЈСОН
Корак 1: Инсталирајте Aspose.Cells преко NuGet
Инсталирајте Aspose.Cells за .NET:
Install-Package Aspose.Cells
Корак 2: Поставите лиценцу
Омогућава пуну функционалност:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
Корак 3: Преузмите ХТМЛ датотеку
Kreirajte novu radnu knjigu preuzimanjem HTML ulaza:
Workbook workbook = new Workbook("Sample.html");
Корак 4: Приступ последњој ћелији
Идентификујте последњу ћелију у радном листу да бисте дефинисали границе извоза:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
Корак 5: Опремите опсег за извоз
Креирајте опсег који шири податке о радном листу:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
Корак 6: Конфигурисање JsonSaveOptions
Поставите било какве опције за извоз:
JsonSaveOptions options = new JsonSaveOptions();
Корак 7: Експорт у ЈСОН
Серијализујте дефинисани опсег на JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
Корак 8: Сачувајте JSON у датотеку
Напишите излаз на диск:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
Уобичајени проблеми и фиксирања
1. празан излаз
- Решење: Уверите се да ХТМЛ датотека садржи табелно структурирани садржај за важећу препознавање података.
2 Неправилан ранг
- Решење: Двоструко проверите да опсег укључује све релевантне ћелије из радног листа.
3. извоз форматирање
- Решење : Употреба
JsonSaveOptions
да контролишете индексирање листе, прескочите празне редове или прилагодите хиперлинкове.