HTML コンテンツを構造化された JSON フォーマットに変換することは、バックエンド サービスやアプリケーションと Web データを統合するために不可欠です. Aspose.Cells for .NET は、この転換を達成するための効率的かつシンプルな方法を提供し、ウェブサイトからテーブルデータの抽出プロセスを自動化しようとする開発者にとって理想的です。

導入

HTML コンテンツを構造化された JSON フォーマットに変換することは、バックエンド サービスやアプリケーションと Web データを統合するために不可欠です. Aspose.Cells for .NET は、この転換を達成するための効率的かつシンプルな方法を提供し、ウェブサイトからテーブルデータの抽出プロセスを自動化しようとする開発者にとって理想的です。

なぜHTMLをJSONに変換するのか?

  • データポータリティ: テーブル HTML データを JSON としてバックエンド サービスまたは API に転送します。
  • Web-to-App 統合: アプリでさらなる処理のためにテーブルまたは構造化されたウェブコンテンツを抽出します。
  • Automation Ready: ウェブスクラッピングやコンテンツ抽出プロセスの自動化に最適です。

HTML を JSON に変換するためのステップ・ステップガイド

ステップ1: NuGet を介して Aspose.Cells をインストール

インストール Aspose.Cells for .NET:

Install-Package Aspose.Cells

ステップ2:ライセンス設定

完全な機能を可能にする:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

ステップ3:HTMLファイルのダウンロード

新しいワークブックを作成するには、HTMLの入力を入力することによって:

Workbook workbook = new Workbook("Sample.html");

ステップ4:最後の細胞へのアクセス

輸出制限を定義するためのワークシートの最後の細胞を識別する:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

ステップ5:輸出の範囲を設定する

ワークシートデータを拡張する範囲を作成する:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

ステップ6: JsonSaveOptions を設定する

輸出オプションを設定する:

JsonSaveOptions options = new JsonSaveOptions();

ステップ7:JSONへの輸出

定義範囲を JSON にシリアル化する:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

ステップ8: JSON をファイルに保存する

出力をディスクに書き込む:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

共通の問題と修正

1.空き出力

  • ソリューション: HTML ファイルには、有効なデータ認識のためのテーブルベースの構造化されたコンテンツが含まれていることを確認します。

2.不適切な範囲

  • ソリューション:範囲にワークシートのすべての関連セルが含まれていることをダブルチェックします。

3.輸出形式化

  • 解決策:使用 JsonSaveOptions 表のインデックスをコントロールし、空っぽの行を乗り越え、またはハイパーリンクをカスタマイズします。

More in this category