Converter conteúdo HTML em um formato JSON estruturado é essencial para a integração de dados da web com serviços ou aplicações de backend. Aspose.Cells para .NET oferece uma maneira eficiente e simples de alcançar esta conversão, tornando-o ideal para os desenvolvedores que procuram automatizar o processo de extrair dados de tabelas de sites.

Introdução

Converter conteúdo HTML em um formato JSON estruturado é essencial para a integração de dados da web com serviços ou aplicações de backend. Aspose.Cells para .NET oferece uma maneira eficiente e simples de alcançar esta conversão, tornando-o ideal para os desenvolvedores que procuram automatizar o processo de extrair dados de tabelas de sites.

Por que converter HTML para JSON?

  • Portabilidade de dados: Transferir dados de tabela HTML para serviços de backend ou APIs como JSON.
  • Web-to-App Integração: Extrair tabela ou conteúdo web estruturado para processamento adicional em aplicativos.
  • Automation Ready: Ideal para automatizar processos de escrapagem da web ou de extração de conteúdo.

Guia passo a passo para converter HTML para JSON

Passo 1: Instalar Aspose.Cells através de NuGet

Instalar Aspose.Cells para .NET:

Install-Package Aspose.Cells

Passo 2: Configurar a licença

Permite a funcionalidade completa:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

Passo 3: Carregar arquivo HTML

Crie um novo livro de trabalho carregando a entrada HTML:

Workbook workbook = new Workbook("Sample.html");

Passo 4: Acesso à última célula

Identificar a última célula na folha de trabalho para definir limites de exportação:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

Passo 5: Defina o limite de exportação

Crie uma faixa que expande os dados da folha de trabalho:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

Passo 6: Configure JsonSaveOptions

Selecione todas as opções de exportação:

JsonSaveOptions options = new JsonSaveOptions();

Passo 7: Exportação para JSON

Serialize a faixa definida para JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

Passo 8: Salve JSON para o arquivo

Escreva a saída para o disco:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

Problemas comuns e fixos

1 - A saída vazia

  • Solução: Assegure-se que o arquivo HTML contém conteúdo estruturado baseado em tabelas para reconhecimento de dados válidos.

2 – Range incorreto

  • Solução: Verifique duplo que a faixa inclui todas as células relevantes da folha de trabalho.

3 - Formato de Exportação

  • Solução Usar JsonSaveOptions para controlar o indexamento de folhas, escapar de linhas vazias ou personalizar hiperlinks.

More in this category