Extract Images from Word in C#

소개

Word 문서에는 종종 복제된 이미지가 포함되어 있으며 재사용, 처리 또는 저장을 위해 추출되어야 할 수 있습니다.이 가이드에서는 Aspose.Words for .NET를 사용하여 DOCX 및 DOC 파일에서 이미지를 프로그래밍적으로 추출하는 방법을 탐구합니다.

왜 단어에서 이미지를 추출합니까?

Word 문서에서 이미지를 추출하는 것은 여러 가지 이유로 유익 할 수 있습니다 :

  • 여러 Word 문서에서 자동 대량 이미지 추출.
  • 품질 손실 없이 고해상도 이미지를 복구하십시오.
  • 추출된 이미지를 다양한 형식으로 저장하십시오, JPEG, PNG 및 BMP를 포함합니다.

테이블 콘텐츠

C#에서 Word 이미지 추출을 설정합니다

Word 문서에서 이미지를 추출하려면 **Aspose.Words for .NET**를 사용합니다.

  • DOCX, DOC 및 기타 형식의 자동 이미지 추출.
  • 수많은 이미지 형식에 대한 지원 (PNG, JPG, BMP 등)
  • 대규모 Word 문서의 효율적인 처리.

설치

다음 명령을 사용하여 NuGet를 통해 Aspose.Words를 쉽게 설치할 수 있습니다.

PM> Install-Package Aspose.Words

대체로 DLL을 다운로드하십시오. 아스포스 다운로드 페이지.

2. Step-by-Step 가이드 이미지 추출

다음 단계를 따르십시오 Word 문서에서 이미지를 프로그래밍으로 추출하십시오:

  • Word 파일을 사용하여 다운로드합니다. Document 클래스 입니다
  • 리트리브 이미지를 포함하는 모든 모양.
  • 추출 및 각 이미지를 지정된 위치로 저장합니다.

코드 예제

다음은 당신이 시작하는 데 도움이되는 간단한 코드 스니프트입니다 :

// Load the document
Document doc = new Document("input.docx");

// Get all shapes that contain images
NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

// Extract and save each image
int imageIndex = 1;
foreach (Shape shape in shapes)
{
    if (shape.HasImage)
    {
        string imagePath = $"Image_{imageIndex}.png";
        shape.ImageData.Save(imagePath);
        imageIndex++;
    }
}

이 방법 Word 문서에서 이미지 추출을 효율적으로 자동화합니다.

3) 다른 형식으로 추출 된 이미지를 저장

Aspose.Words는 다양한 형식으로 추출 된 이미지를 저장할 수 있으며, 필요에 따라 유연성을 제공합니다.

형식혜택
JPEG압축 형식은 웹 사용에 이상적입니다.
PNG높은 품질의 이미지에 대한 손실없는 형식.
BMP최대한의 세부 사항을 위해 압축되지 않은 형식.

특정 형식으로 이미지를 저장하려면 저장 방법에서 파일 확장을 단순히 조정합니다.

4.Batch 여러 단어 문서에서 이미지 추출

다수의 Word 파일에서 이미지를 추출하려면 아래에 표시된 폴더를 통해 롤할 수 있습니다.

string[] files = Directory.GetFiles("input_docs", "*.docx");
foreach (string file in files)
{
    Document doc = new Document(file);
    NodeCollection shapes = doc.GetChildNodes(NodeType.Shape, true);

    int index = 1;
    foreach (Shape shape in shapes)
    {
        if (shape.HasImage)
        {
            string imagePath = $"Extracted_{Path.GetFileNameWithoutExtension(file)}_{index}.jpg";
            shape.ImageData.Save(imagePath);
            index++;
        }
    }
}

이 방법 Word 문서에서 대량 이미지 추출을 자동화하여 상당한 시간과 노력을 절약합니다. 또한, 작업 흐름이 PDF 파일을 처리해야하는 경우 C#에서 PDF에서 이미지를 가져올 수있는 능력을 활용할 수 있습니다.

무료 API 라이센스를 얻으십시오

Aspose.Words의 완전한 기능을 해제하려면 (https://purchase.aspose.com/temporary-license)를 요청할 수 있습니다.이 문서는 평가 목적으로 도서관의 모든 기능에 액세스합니다.

자세한 문서를 참조하십시오 Aspose.Words 가이드 ** 또는 모든 질문이나 지원을 위해 ** 아스포스 포럼 에서 커뮤니티와 함께 참여하세요.

결론 및 추가 자원

요약

이 가이드에서는 다음을 다루고 있습니다 :

  • C#에서 Word 문서에서 이미지를 추출하는 방법
  • 다양한 형식의 이미지를 저장 (JPEG, PNG, BMP)
  • Batch 여러 Word 파일 처리
  • C#를 사용하여 Word에서 텍스트를 추출하고 개선 된 문서 처리을 위해 C# Word에서 Image로 변환합니다.

Aspose.Words for .NET를 사용하면 Word 문서에서 이미지를 효율적으로 추출하고 관리할 수 있습니다. Automating Word image extraction 오늘 시작하고 문서를 처리하는 작업 흐름을 향상시킵니다. 또한, 이미지 변환에 관심이 있는 사람들에게는 형식 간의 무시무시한 전환을 위해 JPGTOWORD.NET를 고려하십시오.

또한, C# Word to Image를 변환해야 하는 시나리오의 경우, Aspose.Words의 다양성은 무제한 통합과 효과적인 문서 관리에 필요한 모든 도구를 제공합니다. .NET word to image 기능을 사용하여 작업 흐름을 향상시킬 수 있습니다.

More in this category