تبدیل محتوای HTML به یک فرمت JSON ساختاری برای ادغام داده های وب با خدمات یا برنامه های پشتیبان ضروری است. Aspose.Cells برای .NET یک راه کارآمد و ساده برای دستیابی به این تبدیل را ارائه می دهد، بنابراین ایده آل برای توسعه دهندگان است که به دنبال اتوماسیون فرآیند استخراج اطلاعات جدول از وب سایت ها هستند.
معرفی
تبدیل محتوای HTML به یک فرمت JSON ساختاری برای ادغام داده های وب با خدمات یا برنامه های پشتیبان ضروری است. Aspose.Cells برای .NET یک راه کارآمد و ساده برای دستیابی به این تبدیل را ارائه می دهد، بنابراین ایده آل برای توسعه دهندگان است که به دنبال اتوماسیون فرآیند استخراج اطلاعات جدول از وب سایت ها هستند.
چرا HTML را به JSON تبدیل می کنیم؟
- قابل حمل داده ها: انتقال داده های جدول HTML به سرویس های پشتیبان یا APIs به عنوان JSON.
- Web-to-App Integration: برای پردازش بیشتر در برنامه ها، جدول یا محتوای وب ساختار یافته را استخراج کنید.
- Automation Ready: ایده آل برای اتوماسیون فرآیندهای استخراج وب یا محتوا است.
راهنمای گام به گام برای تبدیل HTML به JSON
مرحله 1: نصب Aspose.Cells از طریق NuGet
نصب Aspose.Cells برای .NET:
Install-Package Aspose.Cells
مرحله دوم: تنظیم مجوز
امکان عملکرد کامل :
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
مرحله 3: فایل HTML را بارگذاری کنید
ایجاد یک دفترچه کار جدید با بارگذاری ورودی HTML:
Workbook workbook = new Workbook("Sample.html");
مرحله چهارم: دسترسی به آخرین سلول
شناسایی آخرین سلول در ورق کار برای تعریف مرزهای صادرات:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
مرحله پنجم: محدوده صادرات را تعیین کنید
یک محدوده ایجاد کنید که داده های ورق را گسترش می دهد:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
مرحله 6: تنظیم JsonSaveOptions
انتخاب گزینه های صادرات:
JsonSaveOptions options = new JsonSaveOptions();
مرحله 7: صادرات به JSON
محدوده مشخص شده را به JSON سریالی کنید:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
مرحله 8: JSON را به فایل ذخیره کنید
صفحه را به دیسک بفرستید:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
مشکلات و اصلاحات مشترک
1- خروجی خالی
- راه حل: اطمینان حاصل کنید که فایل HTML حاوی محتوای ساختاری مبتنی بر جدول برای تشخیص داده های معتبر است.
۲- محدوده نادرست
- راه حل: دوگانه چک کنید که محدوده شامل تمام سلول های مربوطه از ورق کار است.
3- فرمت صادرات
- راه حل: استفاده از
JsonSaveOptions
برای کنترل فهرست ورق، عبور از ردیف های خالی، و یا سفارشی کردن لینک های هیپر.