ต้องโหลด string HTML หรือหน้าเว็บใน Excel สําหรับการประมวลผลการดูหรือการจัดเก็บ? คู่มือนี้อธิบายวิธีการแปลงเนื้อหา HTML โดยตรงไปยังหนังสือทํางานของ Excel โดยใช้ Aspose.Cells for .NET

บทนํา

การแปลงข้อมูล HTML ไปยัง Excel อาจเป็นงานที่ท้าทายเนื่องจากความซับซ้อนของโครงสร้าง HTML และความต้องการในการจัดรูปแบบที่แม่นยําใน Excel อย่างไรก็ตามกับ Aspose.Cells สําหรับ .NET กระบวนการนี้จะง่ายและมีประสิทธิภาพ

บทความนี้จะช่วยให้คุณผ่านขั้นตอนที่จําเป็นในการแปลง string HTML หรือไฟล์ into a Excel workbook using C# เราจะครอบคลุมทุกอย่างจากการติดตั้งแพคเกจที่ต้องการเพื่อบันทึกผลลัพธ์สุดท้ายเป็น .xlsx ไฟล์

ใช้กรณีสําหรับ HTML ไปยัง Excel การแปลง

  • แปลงอีเมลหรือข้อมูล CMS ใน Excel
  • การประมวลผลรายงาน HTML หรือส่งออกจากแพลตฟอร์มบุคคลที่สาม
  • นําเข้าตารางเว็บไปยังตารางโครงสร้าง

คู่มือขั้นตอน

ขั้นตอน 1: ติดตั้ง Aspose.Cells สําหรับ .NET

$ dotnet add package Aspose.Cells

ขั้นตอนที่ 2: การเตรียม HTML เป็น String

การเตรียมเนื้อหา HTML ของคุณจากแหล่งภายนอกหรือโดยตรงภายในรหัส

string htmlString = "<html><body><table><tr><td>Item</td><td>Price</td></tr><tr><td>Book</td><td>20</td></tr></table></body></html>";

ขั้นตอนที่ 3: แปลงสายเคเบิ้ลไปยังกระแส

แปลง string HTML ใน a MemoryStream วัตถุที่จําเป็นสําหรับการโหลดเนื้อหา HTML

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    // Proceed with loading the stream into an Excel workbook
}

ขั้นตอน 4: ดาวน์โหลด HTML Stream ด้วย HtmlLoadOptions

ใช้ HtmlLoadOptions ดาวน์โหลดเนื้อหา HTML จาก MemoryStream และสร้างใหม่ Workbook วัตถุ

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
}

ขั้นตอน 5: การทํางานกับหนังสืองาน (ตัวเลือก)

เมื่อเนื้อหา HTML ถูกโหลดลงใน A Workbookคุณสามารถจัดการได้ตามที่จําเป็น ตัวอย่างเช่นคุณอาจต้องการเพิ่มสูตรหรือรูปแบบ

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    Worksheet sheet = workbook.Worksheets[0];
    // Add formulas, styles, or modify data
}

ขั้นตอน 6: การบันทึกไฟล์ Excel ผล

ในที่สุดเพื่อบันทึกการเปลี่ยนแปลง Workbook ไปยังไฟล์บนดิสก์

using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(htmlString)))
{
    Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
    // Optional: Modify the data or format
    Worksheet sheet = workbook.Worksheets[0];
    sheet.AutoFitColumns();
    workbook.Save("converted.xlsx", SaveFormat.Xlsx);
}

ตัวอย่างรหัสสมบูรณ์

นี่คือตัวอย่างที่สมบูรณ์ที่แสดงให้เห็นว่าวิธีการแปลง string HTML ไปเป็นไฟล์ Excel โดยใช้ Aspose.Cells สําหรับ .NET

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class HtmlToExcelConverter
{
    public static void Main()
    {
        string html = "<html><body><table><tr><td>Name</td><td>Score</td></tr><tr><td>Alice</td><td>92</td></tr></table></body></html>";

        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(html)))
        {
            Workbook workbook = new Workbook(htmlStream, new HtmlLoadOptions());
            Worksheet sheet = workbook.Worksheets[0];
            sheet.AutoFitColumns();
            workbook.Save("html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("HTML converted to Excel.");
    }
}

แนวทางที่ดีที่สุด

การปฏิบัติประโยชน์
ใช้ Streams สําหรับการบูรณาการเว็บง่ายต่อการจัดการใน APIs
ใช้ HtmlLoadOptionsการปรับแต่งหรือจัดการเนื้อหา HTML ที่ทันสมัย
คอลัมน์ Auto-Fitเพิ่มความสามารถในการอ่านการผลิต

Subsection: การจัดการโครงสร้าง HTML ที่ซับซ้อน

เมื่อจัดการกับโครงสร้าง HTML ที่ซับซ้อนมันเป็นสิ่งสําคัญที่จะใช้ HtmlLoadOptions ประเภทเพื่อกําหนดเองวิธีการ Aspose.Cells parses HTML นี้อาจรวมถึงตัวเลือกการตั้งค่าเช่นการลบองค์ประกอบบางอย่างหรือจัดการแท็กที่เฉพาะเจาะจงแตกต่างกัน

using System;
using System.IO;
using System.Text;
using Aspose.Cells;

public class ComplexHtmlToExcelConverter
{
    public static void Main()
    {
        string complexHtml = @"
            <html>
                <body>
                    <table border='1'>
                        <tr>
                            <th>Product</th>
                            <th>Price</th>
                            <th>Quantity</th>
                        </tr>
                        <tr>
                            <td>Laptop</td>
                            <td>$999.99</td>
                            <td>5</td>
                        </tr>
                        <tr>
                            <td>Smartphone</td>
                            <td>$699.99</td>
                            <td>10</td>
                        </tr>
                    </table>
                </body>
            </html>";

        // Create a MemoryStream from the HTML string
        using (MemoryStream htmlStream = new MemoryStream(Encoding.UTF8.GetBytes(complexHtml)))
        {
            // Use HtmlLoadOptions to customize parsing if needed
            HtmlLoadOptions loadOptions = new HtmlLoadOptions();
            loadOptions.AutoFilterColumns = true;  // Enable auto-filter for columns

            // Load the HTML content into a Workbook
            Workbook workbook = new Workbook(htmlStream, loadOptions);

            // Access the first worksheet
            Worksheet sheet = workbook.Worksheets[0];

            // Auto-fit all columns to improve readability
            sheet.AutoFitColumns();

            // Save the resulting Excel file
            workbook.Save("complex_html_to_excel.xlsx", SaveFormat.Xlsx);
        }

        Console.WriteLine("Complex HTML converted to Excel.");
    }
}

ข้อสรุป

การแปลงเนื้อหา HTML ไปยัง Excel โดยใช้ Aspose.Cells สําหรับ .NET เป็นวิธีที่แข็งแกร่งในการรวมข้อมูลเว็บเข้าสู่การทํางานของ Excel ของคุณ โดยการติดตามคู่มือนี้คุณจะสามารถจัดการทั้งโครงสร้าง HTML ที่เรียบง่ายและซับซ้อนได้อย่างง่ายดาย

More in this category