Extract Images from PDF in C#

Giới thiệu

Các tệp PDF thường chứa các hình ảnh có giá trị cần phải được rút ra để tái sử dụng, phân tích, hoặc chuyển đổi. Bài viết này cung cấp một hướng dẫn toàn diện từng bước về cách rút hình ảnh từ các tệp PDF trong C# bằng cách sử dụng Aspose.PDF cho .NET. Plugin mạnh mẽ này .NET Plugin đảm bảo tình ảnh thu hồi chất lượng cao, bảo tồn định dạng và độ phân giải ban đầu.

Tại sao lấy hình ảnh từ PDF?

Tiết xuất hình ảnh từ PDF có thể hữu ích vì nhiều lý do:

  • Sử dụng lại hình ảnh cho báo cáo, trình bày hoặc lưu trữ.
  • Hãy chuyển đổi hình ảnh PDF sang các tệp riêng biệt để chỉnh sửa hoặc xử lý thêm.
  • Tự động chiết xuất hình ảnh cho quá trình xử lý PDF lớn.
  • Bảo vệ hình ảnh độ phân giải cao mà không mất chất lượng.

Bảng nội dung

Cài đặt Aspose.PDF for Image Extraction

Để lấy hình ảnh từ PDF, chúng tôi sử dụng Aspose.PDF for .NET. Thư viện này hỗ trợ:

  • High accuracy image extraction không bị mất dữ liệu.
  • Hỗ trợ nhiều định dạng hình ảnh (JPEG, PNG, BMP, vv.).
  • Tự động lấy từ nhiều trang PDF.

Cài đặt

Bạn có thể dễ dàng cài đặt thư viện bằng NuGet:

PM> Install-Package Aspose.PDF

Thay vào đó, hãy tải về DLL từ Aspose Downloads Trang.

2.Thuyết xuất hình ảnh từ các tệp PDF trong C#

Thực hiện các bước sau để tắt hình ảnh từ PDF một cách lập trình:

  • Tải xuống tệp PDF bằng cách sử dụng Document lớp.
  • Đi qua mỗi trang để truy cập vào hình ảnh.
  • Tất cả các hình ảnh từ Page.Resources.Images.
  • Save extracted images in your desired format (Hãy lưu các hình ảnh được rút ra trong định dạng bạn muốn.

Code Ví dụ

Phương pháp này đảm bảo chất lượng không gỉ trong khi duy trì chất lượng hình ảnh gốc.

3. lưu trữ hình ảnh được lấy trong các định dạng khác nhau

Aspose.PDF cho phép bạn lưu các hình ảnh được lấy trong nhiều định dạng:

định dạnglợi ích
JPEGDung lượng cao, lý tưởng cho việc sử dụng web.
PNGMáy ép không mất mát cho hình ảnh chất lượng cao.
BmpĐịnh dạng Bitmap cho việc bảo tồn hình ảnh chi tiết.

Để save các hình ảnh được lấy trong các định dạng khác nhau, chỉ cần thay đổi phần mở rộng tệp trong phương pháp tiết kiệm.

4.Batch Image Extraction từ Multiple PDFs

Để lấy hình ảnh từ nhiều PDF cùng một lúc, bạn có thể xoay qua một thư mục như được hiển thị dưới đây:

string[] files = Directory.GetFiles("input_pdfs", "*.pdf");
foreach (string file in files)
{
    Document pdfDocument = new Document(file);
    foreach (var page in pdfDocument.Pages)
    {
        foreach (var image in page.Resources.Images)
        {
            FileStream stream = new FileStream("output_" + Path.GetFileName(file) + ".jpg", FileMode.Create);
            image.Save(stream, ImageFormat.Jpeg);
            stream.Close();
        }
    }
}

Phương pháp này tự động khai thác hình ảnh PDF một cách hiệu quả.

Nhận được giấy phép miễn phí

Để mở khóa các tính năng đầy đủ của Aspose.PDF, bạn có thể yêu cầu một tự do giấy phép tạm thời.

Để biết thêm chi tiết, hãy xem Dữ liệu chính thức ** hoặc đặt câu hỏi tại ** Thông tin diễn đàn.

Kết luận và tài nguyên bổ sung

Tổng hợp

Trong hướng dẫn này, chúng tôi bao gồm:

  • Làm thế nào để lấy hình ảnh từ PDF bằng cách sử dụng C#
  • Bảo vệ chất lượng hình ảnh và định dạng
  • Batch xử lý nhiều tệp PDF

Tìm hiểu thêm

Với Aspose.PDF for .NET, bạn có thể xem, xử lý, và quản lý hình ảnh từ PDF một cách hiệu quả. bắt đầu sử dụng Aspose.PDF hôm nay cho hiệu suất cao C# PDF image extraction bắt đầu từ chỉ $99! 🚀

More in this category