将 HTML 内容转换为结构化的 JSON 格式,对于网页数据与背景服务或应用程序的集成至关重要。Aspose.Cells for .NET 提供了一个有效而简单的方式来实现这种转型,使其理想的开发人员寻求从网站中自动提取表数据的过程。

引入

将 HTML 内容转换为结构化的 JSON 格式,对于网页数据与背景服务或应用程序的集成至关重要。Aspose.Cells for .NET 提供了一个有效而简单的方式来实现这种转型,使其理想的开发人员寻求从网站中自动提取表数据的过程。

為什麼要將 HTML 轉換為 JSON?

  • 数据可移动性: 将表格的 HTML 数据转移到背景服务或作为 JSON 的 APIs。
  • Web-to-App 集成: 提取表或结构化 Web 内容,以便在应用程序中进行进一步处理。
  • Automation Ready: 理想用于自动化网页扫描或内容提取过程。

步骤指南将 HTML 转换为 JSON

步骤 1: 通过 NuGet 安装 Aspose.Cells

安装 Aspose.Cells for .NET:

Install-Package Aspose.Cells

步骤2:设置许可证

提供完整的功能:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

步骤3:下载 HTML 文件

通过加载 HTML 输入创建一个新的工作簿:

Workbook workbook = new Workbook("Sample.html");

步骤4:进入最后一个细胞

在工作表中识别最后一个单元格,以确定出口边界:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

步骤5:定义出口范围

创建一个包含工作表数据的范围:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

步骤6:设置 JsonSaveOptions

设置任何出口选项:

JsonSaveOptions options = new JsonSaveOptions();

步骤7:向JSON出口

序列定义范围到 JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

步骤8:将 JSON 保存到文件中

将输出写在磁盘上:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

常见问题和解决方案

1、空出口

  • 解决方案:确保 HTML 文件包含基于表的结构化内容,以便有效的数据识别。

二、不正确的范围

  • 解決方案:雙重檢查範圍包含工作表中的所有相關細胞。

3、出口格式化

  • 解決方案:使用 JsonSaveOptions 控制表索引,跳过空行,或自定义超链接。

More in this category