Extract Images from Word in C#

Introduction

Dokumen Word sering mengandungi **gambar tertanam ** yang mungkin perlu dikeluarkan untuk penggunaan semula, pemprosesan, atau penyimpanan ** . Dalam panduan ini, kami akan meneroka **bagaimana untuk mengekstrak imej daripada fail DOCX dan DOC secara programmatik dalam C# ** menggunakan Aspose.Words untuk .NET

Mengapa mengekstrak imej daripada perkataan?

Mengekstrak imej daripada dokumen Word boleh bermanfaat untuk beberapa sebab:

  • Mengekstrak imej secara automatik daripada beberapa dokumen Word.
  • Kembalikan imej resolusi tinggi tanpa kehilangan kualiti.
  • ** Simpan imej yang dikeluarkan** dalam pelbagai format, termasuk JPEG, PNG, dan BMP.

Jadual Kandungan

Menetapkan Word Image Extraction dalam C#

Untuk mengekstrak imej daripada dokumen **Word ** , kami menggunakan Aspose.Words untuk .NET . perpustakaan yang berkuasa ini menawarkan:

  • Mengekstrak imej secara automatik daripada DOCX, DOC, dan format lain.
  • ** Sokongan untuk pelbagai format imej** (PNG, JPG, BMP, dan lain-lain).
  • Pengendalian yang cekap dokumen Word yang besar.

Installation

Anda boleh dengan mudah memasang Aspose.Words melalui NuGet dengan perintah berikut:

PM> Install-Package Aspose.Words

Sebagai alternatif, muat turun DLL daripada Halaman untuk Downloads.

2. langkah-langkah panduan untuk mengekstrak imej

Ikuti langkah-langkah berikut untuk mengekstrak imej daripada dokumen Word secara programmatik :

  • Muat turun fail Word menggunakan Document Kelas yang
  • Retrieve ** semua bentuk yang mengandungi imej** .
  • Mengekstrak dan menyimpan setiap imej ke lokasi tertentu.

Kod contoh

Berikut ialah skrip kod yang mudah untuk membantu anda memulakan:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

Kaedah ini mengautomatikkan pengekstrakan imej daripada dokumen Word dengan cekap.

Menyimpan imej yang dikeluarkan dalam format yang berbeza

Aspose.Words membolehkan anda menyimpan imej yang dikeluarkan dalam pelbagai format, menyediakan fleksibiliti berdasarkan keperluan anda:

FormatBenefit
Tag : jpegFormat kompresi yang sesuai untuk penggunaan web.
*Penggunaan *Format tanpa kerugian untuk imej berkualiti tinggi.
Bahasa InggerisFormat tidak dikompresi untuk butiran maksimum.

Untuk menyimpan imej dalam format tertentu, hanya menyesuaikan ekstensi fail dalam kaedah penyimpanan.

4.Batch Mengekstrak imej daripada pelbagai dokumen perkataan

Untuk mengekstrak imej daripada beberapa fail Word , anda boleh mengelilingi folder seperti yang ditunjukkan di bawah:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

Kaedah ini **mengautomatikkan pengekstrakan imej besar-besaran daripada dokumen Word ** , menjimatkan anda masa dan usaha yang signifikan.Selain itu, anda boleh memanfaatkan keupayaan untuk pengekrakan gambar daripada PDF dalam C# jika aliran kerja anda memerlukan pemprosesan fail PDF.

5. mendapatkan lesen API percuma

Untuk mengecualikan ciri-ciri penuh Aspose.Words , anda boleh meminta ** lesen sementara percuma. ini akan memberi anda akses kepada semua keupayaan perpustakaan untuk tujuan penilaian.

Untuk dokumen yang lebih terperinci, lawati Aspose.Words Guide ** atau terlibat dengan komuniti di ** Forum Asosi untuk sebarang pertanyaan atau sokongan.

6. kesimpulan dan sumber tambahan

Summary

Dalam panduan ini, kami meliputi:

  • Bagaimana untuk mengekstrak imej daripada dokumen Word dalam C#
  • ** Menyimpan imej dalam format yang berbeza (JPEG, PNG, BMP)**
  • Batch pemprosesan pelbagai fail Word
  • **Menggunakan C# untuk mengekstrak teks daripada Word ** dan menukar C# Word kepada Imej untuk pengendalian dokumen yang dipertingkatkan.

Dengan **Aspose.Words untuk .NET ** , anda boleh secara berkesan **mengekstrak dan menguruskan imej ** dalam dokumen Word. Mulakan hari ini *memperbaiki aliran kerja pemprosesan dokumen anda.Selain itu, bagi mereka yang berminat untuk menukar gambar kepada dokumen, pertimbangkan untuk menggunakan ** JPGTOWORD.NET untuk peralihan antara format tanpa wayar.

Di samping itu, untuk senario di mana anda perlu menukar C# Word kepada Imej , versatiliti Aspose.Words menyediakan semua alat yang diperlukan untuk integrasi tanpa wayar dan pengurusan dokumen yang berkesan.

More in this category