Extract Images from Word in C#

引入

Word 文件通常包含 嵌入式图像 可能需要 提取用于重复使用、处理或存储. 在此指南中,我们将探讨 如何从 DOCX 和 DOC 文件中编程提取图像在 C# 使用 Aspose.Words for .NET

为什么要从字中提取图像?

从Word文档中提取图像可能有益于几个原因:

  • 从多个Word文档中自动大规模图像提取
  • 恢复高分辨率图像 无损质量。
  • 保存提取的图像 以各种格式,包括 JPEG、PNG 和 BMP。

内容表

1. 设置 Word 图像提取在 C#

要从 Word 文件 提取图像,我们使用 Aspose.Words for .NET

  • 自动图像提取从DOCX,DOC和其他格式。
  • 支持多个图像格式(PNG、JPG、BMP等)。
  • 有效处理 大型Word文档。

安装

您可以通过 NuGet 轻松安装 Aspose.Words 以以下命令:

PM> Install-Package Aspose.Words

否则,下载 DLL 从 Aspose 下载页面.

2. Step-by-Step 图像提取指南

遵循以下步骤 从 Word 文档中编程提取图像:

  • 加载 Word 文件 使用 Document 班级。
  • 返回 包含图像的所有格式
  • 提取和 保存每个图像 到指定位置。

代码例子

下面是一个简单的代码剪辑,可以帮助你开始:

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

此方法 自动从Word文档中提取图像。

3、保存不同格式的提取图像

Aspose.Words 允许您以各种格式保存提取的图像,根据您的需求提供灵活性:

格式福利
◎JPEG压缩格式适合网页使用。
◎PNG无损格式为高品质的图像。
“BMP”无压缩格式为最大细节。

要将图像存储在一个特定的格式中,只需在存储方法中调整文件扩展。

4. Batch 从多个字文档提取图像

从多个 Word 文件中提取图像,您可以通过如下所示的文件夹:

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

此方法 自动从Word文档中大批图像提取,节省了大量的时间和精力. 此外,如果您的工作流需要处理PDF文件,您还可以利用 从PDF中提交图形的能力。

5、获得免费的API许可证

要解锁 完整的 Aspose.Words 功能,您可以申请 (https://purchase.aspose.com/temporary-license)

要了解更多详细信息,请访问 Aspose.Words 指南 ** 或与社区联系在 ** Aspose 论坛 为任何查询或支持。

结论和额外资源

总结

在此指南中,我们涵盖了:

  • 如何在C#中从Word文档中提取图像
  • 以不同的格式(JPEG、PNG、BMP)发送图像
  • Batch 处理多个 Word 文件
  • 使用 C# 从 Word 提取文本 并转换 C# Word 为 图像 为增强文档处理。

使用 Aspose.Words for .NET,您可以在 Word 文档中有效地 提取和管理图像. 今天启动 自定义的 Word Image Extraction 并提高文件处理工作流! 此外,对于那些有兴趣将图片转换为文件的人,请考虑使用 JPGTOWORD.NET 进行格式之间的无缝过渡。

此外,对于需要将“C# Word”转换为“图像”的场景,Aspose.Words的多样性提供了无缝集成和有效文档管理所需的所有工具。

More in this category