Extract Images from Word in C#

Introducció

Els documents de Word sovint contenen images embedded que poden necessitar ser extraïts per a reutilitzar, processar o emmagatzemar. En aquest guia, explorarem com extreure imatges dels arxius DOCX i DOC programàticament en C# utilitzant Aspose.Words per .NET.

Per què extreure imatges de la paraula?

L’extracció d’imatges dels documents de Word pot ser beneficiós per diverses raons:

  • Extracció automàtica d’imatges en massa a partir de diversos documents de Word.
  • Retreu imatges d’alta resolució sense pèrdua de qualitat.
  • Save extracted images en diversos formats, inclosos JPEG, PNG i BMP.

Taula de continguts

Instal·lació de l’extracció de la imatge de Word en C#

Per extreure imatges de documents de Word, utilitzem Aspose.Words per .NET. Aquesta poderosa biblioteca ofereix:

  • Extracció d’imatge automàtica de DOCX, DOC i altres formats.
  • Suport per a múltiples formats d’imatge (PNG, JPG, BMP, etc.).
  • Processament eficaç de grans documents Word.

Instal·lació

Podeu instal·lar amb facilitat Aspose.Words a través de NuGet amb el comando següent:

PM> Install-Package Aspose.Words

Alternativament, descarregar el DLL des de la Descarrega la pàgina.

Guia de pas a pas per a l’extracció d’imatges

Segueix aquests passos per extreure imatges d’un document de Word programàticament:

  • Carregar el fitxer Word utilitzant el Document La classe.
  • Retrieve totes les formes que contenen imatges.
  • Extraure i Save cada imatge a una ubicació especificada.

Exemple de codi

Aquí teniu un senzill codi per ajudar-vos a començar:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

Aquest mètode automatitza l’extracció d’imatge dels documents de Word de manera eficient.

Salvar imatges extraïdes en diferents formats

Aspose.Words li permet guardar imatges extraïdes en diversos formats, proporcionant flexibilitat basada en les seves necessitats:

FormatBeneficis
El JPEGFormat comprès ideal per a l’ús web.
El PNGFormat sense pèrdues per a imatges d’alta qualitat.
El BMPFormat no comprès per al màxim detall.

Per salvar imatges en un format específic, simplement ajustar l’extensió de fitxer en el mètode d’emmagatzematge.

4.Batch Extractes d’imatges de diversos documents de paraula

Per a extreure imatges de múltiples fitxers de Word, podeu girar a través d’una carpeta com es mostra a continuació:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

Aquest mètode automatitza l’extracció d’imatges en massa dels documents de Word, cosa que li estalvia temps i esforç significatius. A més, pot aprofitar la capacitat per extrair imatges de PDF en C# si el seu flux de treball requereix el tractament de fitxers PDF.

Obtenir una llicència d’API gratuïta

Per desbloquejar funcions completes d’Aspose.Words, podeu sol·licitar una llicència temporal gratuïta. Això li donarà accés a totes les capacitats de la biblioteca per a finalitats d’avaluació.

Per a documentació més detallada, visiteu el Aspose.Words Guide ** o entreu-vos amb la comunitat al ** Fòrum d’Associació per a qualsevol pregunta o suport.

Conclusions i recursos addicionals

Resum

En aquest guia, vam cobrir:

  • Com extreure imatges de documents de Word en C#
  • Servint imatges en diferents formats (JPEG, PNG, BMP)
  • Batch processament de múltiples arxius de Word
  • Utilitzar C# per extreure text de Word i convertir C# Word a imatge per millorar el tractament del document.

Amb Aspose.Words per a .NET, es pot extreure i gestionar de manera eficient les imatges en els documents de Word. Començar Automatitzant l’extracció d’imatge del Word avui i millorar el seu flux de treball de processament de documents! A més, per als interessats en convertir imatges en documents, considereu utilitzar JPGTOWORD.NET per transmissions sense segell entre els formats.

A més, en els escenaris en què cal convertir un C# Word a imatge, la versatilitat d’Aspose.Words proporciona totes les eines necessàries per a la integració senzilla i la gestió efectiva del document.

More in this category