การแปลงเนื้อหา HTML ในรูปแบบ JSON ที่โครงสร้างเป็นสิ่งสําคัญสําหรับการรวมข้อมูลเว็บกับบริการหรือแอปพลิเคชัน Backend Aspose.Cells for .NET มีวิธีที่มีประสิทธิภาพและง่ายต่อการแปลงนี้ทําให้เหมาะสําหรับนักพัฒนาที่ต้องการอัตโนมัติกระบวนการสกัดข้อมูลตารางจากเว็บไซต์
บทนํา
การแปลงเนื้อหา HTML ในรูปแบบ JSON ที่โครงสร้างเป็นสิ่งสําคัญสําหรับการรวมข้อมูลเว็บกับบริการหรือแอปพลิเคชัน Backend Aspose.Cells for .NET มีวิธีที่มีประสิทธิภาพและง่ายต่อการแปลงนี้ทําให้เหมาะสําหรับนักพัฒนาที่ต้องการอัตโนมัติกระบวนการสกัดข้อมูลตารางจากเว็บไซต์
ทําไมแปลง HTML ไปยัง JSON
- การพกพาข้อมูล: การถ่ายโอนข้อมูล HTML แบบตารางไปยังบริการ backend หรือ APIs เป็น JSON
- **การบูรณาการ Web-to-App:**สกัดตารางหรือเนื้อหาเว็บโครงสร้างสําหรับการประมวลผลเพิ่มเติมในแอป
- อัตโนมัติพร้อม: เหมาะสําหรับการอัตราส่วนการสแกนเว็บหรือกระบวนการ استخراجเนื้อหา
คู่มือขั้นตอนเพื่อแปลง HTML ไปยัง JSON
ขั้นตอน 1: ติดตั้ง Aspose.Cells via NuGet
ติดตั้ง Aspose.Cells สําหรับ .NET:
Install-Package Aspose.Cells
ขั้นตอนที่ 2: ติดตั้งใบอนุญาต
ช่วยให้ฟังก์ชั่นเต็มรูปแบบ:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
ขั้นตอนที่ 3: ดาวน์โหลดไฟล์ HTML
สร้างหนังสือทํางานใหม่โดยการโหลด input HTML:
Workbook workbook = new Workbook("Sample.html");
ขั้นตอน 4: เข้าถึงเซลล์สุดท้าย
การระบุเซลล์สุดท้ายในแผ่นงานเพื่อกําหนดข้อจํากัดการส่งออก:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
ขั้นตอน 5: กําหนดช่วงการส่งออก
สร้างช่วงที่ครอบคลุมข้อมูลแผ่นงาน:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
ขั้นตอน 6: การตั้งค่า JsonSaveOptions
ตั้งค่าตัวเลือกการส่งออกใด ๆ:
JsonSaveOptions options = new JsonSaveOptions();
ขั้นตอน 7: การส่งออกไปยัง JSON
ซีรี่ส์ช่วงที่กําหนดเพื่อ JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
ขั้นตอน 8: เก็บ JSON ไปยังไฟล์
เขียนออกไปยังดิสก์:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
ปัญหาทั่วไปและข้อกําหนด
1. การส่งออกที่ว่างเปล่า
- โซลูชัน: ตรวจสอบให้แน่ใจว่าไฟล์ HTML มีเนื้อหาที่โครงสร้างขึ้นอยู่กับตารางเพื่อการรับรู้ข้อมูลที่ถูกต้อง
2. ปริมาณที่ไม่ถูกต้อง
- โซลูชัน: ตรวจสอบคู่ว่าช่วงรวมถึงเซลล์ที่เกี่ยวข้องทั้งหมดจากแผ่นงาน
3. การส่งออกแบบฟอร์ม
- โซลูชัน: ใช้
JsonSaveOptions
เพื่อควบคุมการดัชนีแผ่นล้มเหลวเส้นว่างหรือกําหนดค่า hyperlinks