تحويل محتوى HTML إلى تنسيق JSON هو أمر ضروري لدمج بيانات الويب مع الخدمات الخلفية أو التطبيقات. Aspose.Cells for .NET يقدم طريقة فعالة وبسيطة لتحقيق هذا التحويل، مما يجعلها مثالية للمطورين الذين يرغبون في تلقائي عملية استخراج البيانات اللوحية من المواقع.

مقدمة

تحويل محتوى HTML إلى تنسيق JSON هو أمر ضروري لدمج بيانات الويب مع الخدمات الخلفية أو التطبيقات. Aspose.Cells for .NET يقدم طريقة فعالة وبسيطة لتحقيق هذا التحويل، مما يجعلها مثالية للمطورين الذين يرغبون في تلقائي عملية استخراج البيانات اللوحية من المواقع.

لماذا تحويل HTML إلى JSON؟

  • قابلية نقل البيانات: نقل بيانات HTML اللوحية إلى الخدمات الخلفية أو APIs كJSON.
  • التكامل عبر الإنترنت في التطبيقات: استخراج جدول أو محتوى الويب المنظّم لمزيد من المعالجة في الأجهزة.
  • الآلية جاهزة: مثالية لأتمتة عمليات تصفية الويب أو استخراج المحتوى.

دليل خطوة بخطوة لتحويل HTML إلى JSON

الخطوة 1: تثبيت Aspose.Cells عبر NuGet

تثبيت Aspose.Cells لـ .NET:

Install-Package Aspose.Cells

الخطوة 2: إعداد الترخيص

تتيح الوظائف الكاملة:

Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");

الخطوة 3: تحميل ملف HTML

إنشاء دفتر عمل جديد عن طريق تحميل إدخال HTML:

Workbook workbook = new Workbook("Sample.html");

الخطوة 4: الوصول إلى الخلية الأخيرة

تحديد الخلية الأخيرة في ورقة العمل لتحديد حدود التصدير:

Cell lastCell = workbook.Worksheets[0].Cells.LastCell;

الخطوة 5: تحديد نطاق التصدير

إنشاء نطاق يمتد إلى بيانات ورقة العمل:

Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);

الخطوة 6: إعداد JsonSaveOptions

حدد أي خيارات التصدير:

JsonSaveOptions options = new JsonSaveOptions();

الخطوة 7: تصدير إلى JSON

تسلسل النطاق المحدد إلى JSON:

string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);

الخطوة 8: حفظ JSON إلى الملفات

اكتب النتيجة إلى القرص:

System.IO.File.WriteAllText("htmltojson.json", jsonData);

المشاكل المشتركة والتصحيح

1- الخروج الفارغ

  • الحل: تأكد من أن ملف HTML يحتوي على محتوى منظم على أساس جدول لتحديد البيانات الصحيحة.

2- نطاق غير صحيح

  • الحل: تحقق مزدوجًا من أن النطاق يحتوي على جميع الخلايا ذات الصلة من ورقة العمل.

3- تنسيق الصادرات

  • الحل: الاستخدام JsonSaveOptions للتحكم في تصنيف الورقة، والتخلص من الصفوف الفارغة، أو تخصيص الروابط العليا.

More in this category