Extract Images from Word in C#

Въведение

Word документи често съдържат вградени изображения, които може да се наложи да бъдат извлечени за повторна употреба, обработка или съхранение. В този ръководство ще разгледаме как да извличаме снимки от DOCX и DOC файлове програмирано в C# с помощта на Aspose.Words за .NET.

Защо да извлечем изображения от думата?

Извличането на изображения от Word документи може да бъде полезно по няколко причини:

  • Автоматично извличане на изображения от множество документи в Word.
  • Възстановяване на изображения с висока резолюция без загуба на качество.
  • Съхранявайте извлечени изображения в различни формати, включително JPEG, PNG и BMP.

Таблица на съдържанието

Word в C#

За да извлечем изображения от Word документи, ние използваме Aspose.Words за .NET. Тази мощна библиотека предлага:

  • Автоматично извличане на изображения от DOCX, DOC и други формати.
  • Поддръжка за множество формати на изображения (PNG, JPG, BMP и т.н.).
  • Ефективна обработка на големи Word документи.

инсталация

Aspose.Words чрез NuGet:

PM> Install-Package Aspose.Words

В противен случай изтегляне на DLL от Страница за изтегляне Aspose.

2. стъпка по стъпка ръководство за екстракция на изображения

Следвайте следните стъпки, за да извлечете изображения от документ на Word по програма:

  • Изтеглете файла “Word” с помощта на Document в клас.
  • Изтеглете всички форми, съдържащи изображения.
  • Извлечете и спасете всяка снимка на определено място.

Кодът пример

Ето един прост код, който ще ви помогне да започнете:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

Този метод автоматизира извличането на изображения от документи на Word ефективно.

Съхранение на извлечени изображения в различни формати

Aspose.Words ви позволява да съхранявате извлечени изображения в различни формати, осигурявайки гъвкавост въз основа на вашите нужди:

ФорматПолзите
JPEGКомпресираният формат е идеален за уеб употреба.
ПНКФормат без загуби за висококачествени изображения.
БМПНекомпресиран формат за максимален детайл.

За да съхранявате изображения в определен формат, просто коригирайте разширяването на файла в метода за съхранение.

Word документи

За извличане на изображения от няколко Word файла, можете да ходите през папката, както е показано по-долу:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

Този метод автоматизира масовото извличане на изображения от документи на Word, което ви спестява значително време и усилия. Освен това можете да използвате способността да извлечете изображение от PDF в C# ако работен поток изисква обработка на PDF файлове.

5. получаване на свободна API лиценз

За да отключите пълните функции на Aspose.Words, можете да поискате (https://purchase.aspose.com/temporary-license). Това ще ви даде достъп до всички възможности на библиотеката за целите на оценката.

За по-подробна документация посетете Aspose.Words Guide ** или се ангажирайте с общността на ** Forum за всякакви запитвания или подкрепа.

Заключение и допълнителни ресурси

Резюме

В този ръководство обхванахме:

  • Как да се извличат изображения от Word документи в C#
  • Съхраняване на изображения в различни формати (JPEG, PNG, BMP)
  • Batch обработка на няколко Word файлове
  • Използвайте C#, за да извлечете текст от Word и да конвертирате C# Word в Image за подобрена обработка на документи.

С Aspose.Words за .NET можете ефективно извличане и управление на изображения в Word документи. Започнете автоматизиране на Word изображението екстракция днес и подобрете работния поток на обработка на документи! Освен това, за тези, които се интересуват от конвертирането на снимки в документи, помислете за използването на JPGTOWORD.NET за безкрайни преход между формати.

Освен това, за сценарии, в които трябва да конвертирате C# Word в Image, разнообразието на Aspose.Words осигурява всички необходими инструменти за безпроблемна интеграция и ефективно управление на документи.

More in this category