Extract Images from PDF in C#

Úvod

PDF súbory často obsahujú cenné obrázky, ktoré je potrebné vytiahnuť na opätovné použitie, analýzu, alebo konverziu. Tento článok poskytuje komplexný krok za krokom sprievodca o ako extrahovať obrazy z súborov PDF v C# pomocou Aspose.PDF pre .NET..Tento výkonný .NET Plugin zabezpečuje vysokú kvalitu image retrieval, zachovanie originálne formáty a rozlíšenia.

Prečo extrahovať obrázky z PDF?

Odstránenie obrázkov z PDF môže byť užitočné z niekoľkých dôvodov:

  • Použitie obrázkov pre správy, prezentácie alebo archívy.
  • Konvertovať PDF obrázky do samostatných súborov na úpravu alebo ďalšie spracovanie.
  • Automatická extrakcia obrazu pre veľkoobchodné spracovanie PDF.
  • Zachovávajte snímky s vysokým rozlíšením bez straty kvality.

Tabuľka obsahu

Nastavenie Aspose.PDF pre extrahovanie obrazu

Na extrahovanie obrázkov z PDF používame Aspose.PDF pre .NET. Táto knižnica podporuje:

  • Vysoká presnosť extrakcie obrazu bez straty údajov.
  • Podpora pre viaceré formáty obrazu (JPEG, PNG, BMP atď.).
  • Automatická extrakcia z viacstránkových PDF.

inštalácia

Knižnicu môžete jednoducho nainštalovať pomocou NuGet:

PM> Install-Package Aspose.PDF

Alternatívne, stiahnite DLL z Aspose Downloads stránka.

2. extrahovať obrázky z PDF súborov v C#

Postupujte podľa nasledujúcich krokov, aby ste programmaticky extrahovali obrázky z PDF:

  • Stiahnuť súbor PDF pomocou Document v triede.
  • Prejdite cez každú stránku pre prístup k obrázkom.
  • Vytiahnuť každý obrázok z Page.Resources.Images.
  • Zachráňte vytiahnuté obrázky vo vašom požadovanom formáte.

Kód príklad

Táto metóda zaisťuje bezstrannú extrakciu a zároveň zachováva originálnu kvalitu obrazu.

Ušetriť extrahované obrázky v rôznych formátoch

Aspose.PDF umožňuje uložiť extrahované obrázky v viacerých formátoch:

FormátVýhody
JPEGVysoká kompresia, ideálna pre webové použitie.
PNGBezproblémová kompresia pre kvalitné obrázky.
BMPBitmap formát pre detailné zachovanie obrazu.

Ak chcete save extrahované obrázky v rôznych formátoch, jednoducho zmeniť rozšírenie súboru v metóde ukladania.

Batch Image Extraction z viacerých PDF

Ak chcete extrahovať obrázky z mnoho PDF naraz, môžete prejsť priečinkom ako je uvedené nižšie:

string[] files = Directory.GetFiles("input_pdfs", "*.pdf");
foreach (string file in files)
{
    Document pdfDocument = new Document(file);
    foreach (var page in pdfDocument.Pages)
    {
        foreach (var image in page.Resources.Images)
        {
            FileStream stream = new FileStream("output_" + Path.GetFileName(file) + ".jpg", FileMode.Create);
            image.Save(stream, ImageFormat.Jpeg);
            stream.Close();
        }
    }
}

Táto metóda automatizuje hromadné PDF obrázok extrakcie efektívne.

5. získať bezplatnú licenciu

Ak chcete odomknúť plné funkcie programu Aspose.PDF, môžete požiadať o bezplatnú dočasnú licenciu.

Ďalšie podrobnosti nájdete v oficiálna dokumentácia ** alebo položte otázky na ** Aspose forum.

Záver a dodatočné zdroje

Zhrnutie

V tomto sprievodcovi sme pokrývali:

  • Ako extrahovať obrázky z PDF pomocou C#
  • Zachovanie kvality a formátu obrazu
  • Batch spracovanie viacerých PDF súborov

Naučte sa viac

S Aspose.PDF pre .NET môžete efektívne odstrániť, spracovávať a spravovať obrázky z PDF. Začnite používať C# PDF dnes pre vysoko výkonné C# PDF image extraction začínajúce len $99! 🚀

More in this category