تحويل محتوى HTML إلى تنسيق JSON هو أمر ضروري لدمج بيانات الويب مع الخدمات الخلفية أو التطبيقات. Aspose.Cells for .NET يقدم طريقة فعالة وبسيطة لتحقيق هذا التحويل، مما يجعلها مثالية للمطورين الذين يرغبون في تلقائي عملية استخراج البيانات اللوحية من المواقع.
مقدمة
تحويل محتوى HTML إلى تنسيق JSON هو أمر ضروري لدمج بيانات الويب مع الخدمات الخلفية أو التطبيقات. Aspose.Cells for .NET يقدم طريقة فعالة وبسيطة لتحقيق هذا التحويل، مما يجعلها مثالية للمطورين الذين يرغبون في تلقائي عملية استخراج البيانات اللوحية من المواقع.
لماذا تحويل HTML إلى JSON؟
- قابلية نقل البيانات: نقل بيانات HTML اللوحية إلى الخدمات الخلفية أو APIs كJSON.
- التكامل عبر الإنترنت في التطبيقات: استخراج جدول أو محتوى الويب المنظّم لمزيد من المعالجة في الأجهزة.
- الآلية جاهزة: مثالية لأتمتة عمليات تصفية الويب أو استخراج المحتوى.
دليل خطوة بخطوة لتحويل HTML إلى JSON
الخطوة 1: تثبيت Aspose.Cells عبر NuGet
تثبيت Aspose.Cells لـ .NET:
Install-Package Aspose.Cells
الخطوة 2: إعداد الترخيص
تتيح الوظائف الكاملة:
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
الخطوة 3: تحميل ملف HTML
إنشاء دفتر عمل جديد عن طريق تحميل إدخال HTML:
Workbook workbook = new Workbook("Sample.html");
الخطوة 4: الوصول إلى الخلية الأخيرة
تحديد الخلية الأخيرة في ورقة العمل لتحديد حدود التصدير:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
الخطوة 5: تحديد نطاق التصدير
إنشاء نطاق يمتد إلى بيانات ورقة العمل:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
الخطوة 6: إعداد JsonSaveOptions
حدد أي خيارات التصدير:
JsonSaveOptions options = new JsonSaveOptions();
الخطوة 7: تصدير إلى JSON
تسلسل النطاق المحدد إلى JSON:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
الخطوة 8: حفظ JSON إلى الملفات
اكتب النتيجة إلى القرص:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
المشاكل المشتركة والتصحيح
1- الخروج الفارغ
- الحل: تأكد من أن ملف HTML يحتوي على محتوى منظم على أساس جدول لتحديد البيانات الصحيحة.
2- نطاق غير صحيح
- الحل: تحقق مزدوجًا من أن النطاق يحتوي على جميع الخلايا ذات الصلة من ورقة العمل.
3- تنسيق الصادرات
- الحل: الاستخدام
JsonSaveOptions
للتحكم في تصنيف الورقة، والتخلص من الصفوف الفارغة، أو تخصيص الروابط العليا.