Adakah anda perlu memuatkan string HTML atau halaman web ke dalam Excel untuk pemprosesan, visualisasi, atau penyimpanan? panduan ini menerangkan bagaimana untuk menukar kandungan HTML secara langsung ke buku kerja Excel menggunakan Aspose.Cells untuk .NET .
Introduction
Menukar data HTML kepada Excel boleh menjadi tugas yang mencabar kerana kerumitan struktur HTML dan keperluan untuk pemformatan yang tepat dalam Excel. Walau bagaimanapun, dengan Aspose.Cells untuk .NET, proses ini menjadi mudah dan cekap.
Artikel ini akan berjalan anda melalui langkah-langkah yang diperlukan untuk menukar string HTML atau fail ke dalam buku kerja Excel menggunakan C#. .xlsx
fail yang
Menggunakan Kasus untuk HTML ke Excel Konversi
- Menukar e-mel atau data CMS ke dalam Excel
- Memproses laporan HTML atau eksport daripada platform pihak ketiga
- Mengimport jadual web ke dalam skrin terstruktur
Panduan Langkah-Langkah
Langkah 1: Instal Aspose.Cells untuk .NET
$ dotnet add package Aspose.Cells
Langkah 2: Sediakan HTML sebagai string
Sediakan kandungan HTML anda sama ada daripada sumber luaran atau secara langsung dalam kod.
string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";
Langkah 3: Menukar tali kepada aliran
Menukar string HTML kepada a MemoryStream
objek, yang diperlukan untuk memuatkan kandungan HTML.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
// Proceed with loading the stream into an Excel workbook
}
Langkah 4: Muat turun HTML Stream dengan HtmlLoadOptions
Use HtmlLoadOptions
untuk memuatkan kandungan HTML daripada MemoryStream
dan mencipta yang baru Workbook
objek yang
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}
Langkah 5: Bekerja dengan buku kerja (pilihan)
Sebaik sahaja kandungan HTML diisi ke dalam Workbook
, anda boleh memanipulasi seperti yang diperlukan. contohnya, anda mungkin mahu menambah formula atau gaya.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
// Add formulas, styles, or modify data
}
Langkah 6: Simpan fail Excel yang berjaya
Akhirnya, menyimpan perubahan Workbook
untuk fail pada cakera.
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
// Optional: Modify the data or format
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}
Contoh Kod Lengkap
Berikut ialah contoh lengkap yang menunjukkan bagaimana untuk menukar string HTML ke dalam fail Excel menggunakan Aspose.Cells untuk .NET.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class HtmlToExcelConverter
{
public static void Main()
{
string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
{
Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
Worksheet sheet = workbook.Worksheets[0];
sheet.AutoFitColumns();
workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("HTML converted to Excel.");
}
}
amalan terbaik
Practice | Benefit |
---|---|
Menggunakan aliran untuk integrasi web | Lebih mudah untuk mengendalikan APIs |
Use HtmlLoadOptions | Menyesuaikan parsing atau mengendalikan kandungan HTML canggih |
Perbezaan kolom | Meningkatkan kebolehpercayaan produk |
Subseksyen: Mengendalikan struktur HTML yang kompleks
Apabila berurusan dengan struktur HTML yang kompleks, ia adalah penting untuk menggunakan HtmlLoadOptions
kelas untuk menyesuaikan bagaimana Aspose.Cells merangkumi HTML. Ini boleh termasuk pilihan tetapan seperti mengabaikan unsur-unsur tertentu atau mengendalikan tag tertentu berbeza.
using System;
using System.IO;
using System.Text;
using Aspose.Cells;
public class ComplexHtmlToExcelConverter
{
public static void Main()
{
string complexHtml = @"
<html>
<body>
<table border='1'>
<tr>
<th>Product</th>
<th>Price</th>
<th>Quantity</th>
</tr>
<tr>
<td>Laptop</td>
<td>$999.99</td>
<td>5</td>
</tr>
<tr>
<td>Smartphone</td>
<td>$699.99</td>
<td>10</td>
</tr>
</table>
</body>
</html>";
// Create a MemoryStream from the HTML string
using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
{
// Use HtmlLoadOptions to customize parsing if needed
HtmlLoadOptions loadOptions = new HtmlLoadOptions();
loadOptions.AutoFilterColumns = true; // Enable auto-filter for columns
// Load the HTML content into a Workbook
Workbook workbook = new Workbook(htmlStream, loadOptions);
// Access the first worksheet
Worksheet sheet = workbook.Worksheets[0];
// Auto-fit all columns to improve readability
sheet.AutoFitColumns();
// Save the resulting Excel file
workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
}
Console.WriteLine("Complex HTML converted to Excel.");
}
}
Conclusion
Menukar kandungan HTML kepada Excel menggunakan Aspose.Cells untuk .NET adalah cara yang kuat untuk mengintegrasikan data web ke dalam aliran kerja Excel anda.Dengan mengikuti panduan ini, anda akan dapat mengendalikan kedua-dua struktur HTML yang mudah dan kompleks dengan mudah.