Extract Images from Word in C#

Введение

Word-документы часто содержат встроенные изображения, которые могут понадобиться извлечь для повторного использования, обработки или хранения. В этом руководстве мы рассмотрим как извлечь изображения из файлов DOCX и DOC программически в C# с помощью Aspose.Words для .NET.

Почему выводить изображения из слова?

Извлечение изображений из документов Word может быть полезным по нескольким причинам:

  • Автоматическое множественное изображение из нескольких документов Word.
  • Реставрировать изображения высокого разрешения без потери качества.
  • Спасите извлеченные изображения в различных форматах, включая JPEG, PNG и BMP.

Таблица контента

Настройка Word Image Extraction в C#

Чтобы извлечь изображения из Word документов, мы используем [Aspose.Words для .NET](https://products.aspose.net/words:

  • Автоматическое извлечение изображения из DOCX, DOC и других форматов.
  • Поддержка для нескольких форматов изображения (PNG, JPG, BMP и т. д.).
  • Эффективная обработка больших Word-документов.

Инсталляция

Вы можете легко установить Aspose.Words через NuGet с следующим командой:

PM> Install-Package Aspose.Words

В качестве альтернативы, скачать DLL из Скачать Aspose Downloads.

2. Step-by-Step Guide to Экстракция изображений

Следуйте следующим шагом, чтобы программировать изображения из документа Word:

  • Загрузите файл Word с помощью Document Класс.
  • Откройте все формы, содержащие изображения.
  • Экстрактируйте и сбережите каждую картину в определенное местоположение.

Код Пример

Вот несколько простых кодов, которые помогут вам начать:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

Этот метод автоматизирует экстракцию изображения из документов Word эффективно.

Сохранение извлеченных изображений в разных форматах

Aspose.Words позволяет сохранить извлеченные изображения в различных форматах, обеспечивая гибкость на основе ваших потребностей:

Форматвыгоды
JPEGКомпрессированный формат идеально подходит для веб-пользования.
ПГБесплатный формат для высококачественных изображений.
БМПНекомпрессированный формат для максимальных деталей.

Чтобы сохранить изображения в конкретном формате, просто настроить расширение файла в методе сохранения.

4.Batch Экстракт изображений из множественных Word-документов

Чтобы экстрактировать изображения из нескольких файлов Word, вы можете прокручиваться через папку, как показано ниже:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

Этот метод автоматизирует массу изображений из Word-документов, сэкономив вам значительное время и усилия. Кроме того, вы можете воспользоваться возможностью экстрактировать изображение из PDF в C# если ваш рабочий поток требует обработки PDF-файлов.

Получение бесплатной лицензии API

Чтобы отключить полные функции Aspose.Words, вы можете запросить [бесплатную временную лицензию](https://purchase.aspose.com/temporary-license.

Для получения более подробной документации, посетите Aspose.Words Guide или присоединяйтесь к сообществу на Forum Aspose для любых запросов или поддержки.

Заключение и дополнительные ресурсы

Совокупность

В этом руководстве мы охватываем:

  • Как извлечь изображения из документов Word в C#
  • Создание изображений в разных форматах (JPEG, PNG, BMP)
  • Batch обработка множества Word файлов
  • Используйте C# для извлечения текста из Word и конвертируйте C# Word в Image для улучшения обработки документа.

С Aspose.Words для .NET вы можете эффективно экстрактировать и управлять изображениями в Word-документах.Старт автоматизировать экстракцию изображений Word сегодня и улучшить рабочий поток обработки документов!К тому же, для тех, кто заинтересован в конвертировании картин в документы, подумайте о использовании JPGTOWORD.NET для бесконечной транзиции между форматами.Крім того, способность к извлечению текста из Word может еще больше усилить ваши возможности управления документами, в том числе, как вывлечь текст из WordPress и использовать C# для эффективного извлечения текста от Word.

Кроме того, для сценариев, где вам нужно конвертировать C# Word в Image, универсальность Aspose.Words обеспечивает все необходимые инструменты для беспроводной интеграции и эффективного управления документами.

More in this category