将 HTML 内容转换为结构化的 JSON 格式,对于网页数据与背景服务或应用程序的集成至关重要。Aspose.Cells for .NET 提供了一个有效而简单的方式来实现这种转型,使其理想的开发人员寻求从网站中自动提取表数据的过程。
引入
将 HTML 内容转换为结构化的 JSON 格式,对于网页数据与背景服务或应用程序的集成至关重要。Aspose.Cells for .NET 提供了一个有效而简单的方式来实现这种转型,使其理想的开发人员寻求从网站中自动提取表数据的过程。
為什麼要將 HTML 轉換為 JSON?
- 数据可移动性: 将表格的 HTML 数据转移到背景服务或作为 JSON 的 APIs。
- Web-to-App 集成: 提取表或结构化 Web 内容,以便在应用程序中进行进一步处理。
- Automation Ready: 理想用于自动化网页扫描或内容提取过程。
步骤指南将 HTML 转换为 JSON
步骤 1: 通过 NuGet 安装 Aspose.Cells
安装 Aspose.Cells for .NET:
Install-Package Aspose.Cells
步骤2:设置许可证
提供完整的功能:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
步骤3:下载 HTML 文件
通过加载 HTML 输入创建一个新的工作簿:
Workbook workbook = new Workbook("Sample.html");
步骤4:进入最后一个细胞
在工作表中识别最后一个单元格,以确定出口边界:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
步骤5:定义出口范围
创建一个包含工作表数据的范围:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
步骤6:设置 JsonSaveOptions
设置任何出口选项:
JsonSaveOptions options = new JsonSaveOptions();
步骤7:向JSON出口
序列定义范围到 JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
步骤8:将 JSON 保存到文件中
将输出写在磁盘上:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
常见问题和解决方案
1、空出口
- 解决方案:确保 HTML 文件包含基于表的结构化内容,以便有效的数据识别。
二、不正确的范围
- 解決方案:雙重檢查範圍包含工作表中的所有相關細胞。
3、出口格式化
- 解決方案:使用
JsonSaveOptions
控制表索引,跳过空行,或自定义超链接。