Extract Images from Word in C#

مقدمه

اسناد ورد اغلب شامل تصاویر جاسازی شده هستند که ممکن است نیاز به استخراج برای استفاده مجدد، پردازش یا ذخیره‌سازی داشته باشند. در این راهنما، ما به بررسی چگونگی استخراج تصاویر از فایل‌های DOCX و DOC به‌صورت برنامه‌نویسی در C# با استفاده از Aspose.Words for .NET خواهیم پرداخت.

چرا تصاویر را از ورد استخراج کنیم؟

استخراج تصاویر از اسناد ورد می‌تواند به دلایل مختلفی مفید باشد:

  • استخراج خودکار تصاویر به‌صورت انبوه از چندین سند ورد.
  • دریافت تصاویر با وضوح بالا بدون از دست دادن کیفیت.
  • ذخیره تصاویر استخراج‌شده در فرمت‌های مختلف، از جمله JPEG، PNG و BMP.

فهرست مطالب

  1. تنظیم استخراج تصویر ورد در C#
  2. راهنمای گام به گام برای استخراج تصاویر
  3. ذخیره تصاویر استخراج‌شده در فرمت‌های مختلف
  4. استخراج تصاویر به‌صورت انبوه از چندین سند ورد
  5. دریافت مجوز API رایگان
  6. نتیجه‌گیری و منابع اضافی

1. تنظیم استخراج تصویر ورد در C#

برای استخراج تصاویر از اسناد ورد، ما از Aspose.Words for .NET استفاده می‌کنیم. این کتابخانه قدرتمند امکانات زیر را ارائه می‌دهد:

  • استخراج خودکار تصاویر از فرمت‌های DOCX، DOC و سایر فرمت‌ها.
  • پشتیبانی از چندین فرمت تصویر (PNG، JPG، BMP و غیره).
  • پردازش کارآمد اسناد ورد بزرگ.

نصب

شما می‌توانید به‌راحتی Aspose.Words را از طریق NuGet با استفاده از دستور زیر نصب کنید:

PM> Install-Package Aspose.Words

به‌علاوه، می‌توانید DLL را از صفحه دانلود Aspose دانلود کنید.


2. راهنمای گام به گام برای استخراج تصاویر

برای استخراج تصاویر از یک سند ورد به‌صورت برنامه‌نویسی، مراحل زیر را دنبال کنید:

  1. فایل ورد را با استفاده از کلاس Document بارگذاری کنید.
  2. تمام اشکال حاوی تصاویر را بازیابی کنید.
  3. هر تصویر را استخراج و در مکان مشخصی ذخیره کنید.

مثال کد

در اینجا یک کد ساده برای کمک به شما در شروع آورده شده است:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

این روش استخراج تصویر از اسناد ورد را به‌طور کارآمد خودکار می‌کند.


3. ذخیره تصاویر استخراج‌شده در فرمت‌های مختلف

Aspose.Words به شما امکان می‌دهد تصاویر استخراج‌شده را در فرمت‌های مختلف ذخیره کنید و انعطاف‌پذیری بر اساس نیازهای شما ارائه می‌دهد:

فرمتمزیت
JPEGفرمت فشرده ایده‌آل برای استفاده در وب.
PNGفرمت بدون افت کیفیت برای تصاویر با کیفیت بالا.
BMPفرمت بدون فشرده‌سازی برای حداکثر جزئیات.

برای ذخیره تصاویر در یک فرمت خاص، به سادگی پسوند فایل را در روش ذخیره‌سازی تنظیم کنید.


4. استخراج تصاویر به‌صورت انبوه از چندین سند ورد

برای استخراج تصاویر از چندین فایل ورد، می‌توانید از یک حلقه برای مرور یک پوشه استفاده کنید، همان‌طور که در زیر نشان داده شده است:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

این روش استخراج انبوه تصاویر از اسناد ورد را خودکار می‌کند و زمان و تلاش شما را به‌طور قابل‌توجهی صرفه‌جویی می‌کند.


5. دریافت مجوز API رایگان

برای باز کردن تمام ویژگی‌های Aspose.Words، می‌توانید درخواست مجوز موقت رایگان کنید. این به شما دسترسی به تمام قابلیت‌های کتابخانه را برای اهداف ارزیابی می‌دهد.

برای مستندات دقیق‌تر، به راهنمای Aspose.Words مراجعه کنید یا با جامعه در فروم Aspose برای هرگونه سوال یا پشتیبانی در تماس باشید.


6. نتیجه‌گیری و منابع اضافی

خلاصه

در این راهنما، ما پوشش دادیم:

چگونه تصاویر را از اسناد ورد در C# استخراج کنیم
ذخیره تصاویر در فرمت‌های مختلف (JPEG، PNG، BMP)
پردازش انبوه چندین فایل ورد


با Aspose.Words for .NET، شما می‌توانید به‌طور کارآمد تصاویر را استخراج و مدیریت کنید در اسناد ورد. امروز استخراج تصویر ورد را خودکار کنید و جریان کار پردازش سند خود را بهبود بخشید!