PDF A fájlok népszerűek, mert támogatják a szöveget, képeket, animációkat, videókat és a különböző jegyzeteket. Mindazonáltal sok dokumentum számára a szöveg a legfontosabb része. Ez a cikk megmagyarázza, hogyan lehet PDF-fájlokat TXT-fiókokba és fordítva a C# .NET-t használva PDF‐ké alakítani.Ez az átalakítás különösen hasznos, ha kizárólag a pdf-dokumentum szövegtartalmára van szüksége, vagy összpontosít, mint például szövegelemzés elvégzése vagy a tartalom előkészítése a reformáláshoz.

Az ebben az útmutatóban felsorolt témák közé tartozik:

Tipp: Ön is érdekelhet egy ingyenes Szöveg a GIF konverter Ez lehetővé teszi, hogy animált GIF-eket hozzon létre a szövegből.

C# TXT PDF vagy PDF a TXT Converter

A PDF és a TXT formátumok átalakítása elengedhetetlen, ha a legfontosabb érdeklődésed a dokumentumon belüli szöveges adatokban rejlik. Akár az összes formázást egyszerű szövegelemzéshez kell kivágnia, vagy meg kell őriznie a strukturált elrendezést, a folyamat néhány egyszerű lépéssel érhető el. Az ASPOSE.PDF for .NET Ez az API sokoldalú, és támogatja mind a C# és a VB.NET, így könnyen integrálható a .NET alkalmazások.

Az API telepítéséhez az alkalmazásban letöltheti a DLL fájlokat Letöltés vagy használja a Nyugdíj Például telepítse a csomagkezelő konzolon keresztül:

PM> Install-Package Aspose.PDF

Miután az API be van telepítve, elkezdheti az átalakítási folyamatot több megközelítéssel, amelyek a különböző igényekhez igazodnak.

C# PDF átalakítása TXT formázás nélkül

Néha csak a PDF dokumentumból származó nyers szövegre van szüksége további formázás nélkül. Ez a módszer pontosan úgy kivonja a szöveget, ahogyan a dokumentumban jelenik meg, betűtípusok, térképek vagy stílusok megőrzése nélkül. Különösen hasznos a szöveges elemzéshez, a keresési indexeléshez, vagy amikor a layout irrelevant.

Lépés a nyers szöveg kivonásához

  • Töltse le a PDF dokumentumot: Használja az API-t, hogy a PDF fájlt dokumentumobjektumba töltse fel.

  • Kezdeményezzen egy StringBuilder: Hozzon létre egy példát a Stringépítő Az osztály hatékonyan összegyűjti a szövegadatokat.

  • Egy PDF oldalon keresztül írja le: A dokumentum minden oldalán fut. Minden oldalra:

  • Használat szövegszerkesztés A szöveg kivonása.

  • Foglalkozz a Raw mód annak biztosítása, hogy a formázást nem alkalmazzák.

  • Megmentse a kimeneti szöveget: Írja be az összegyűjtött szöveget egy TXT fájlba.

Az alábbi kódkészlet illusztrálja, hogyan lehet PDF-t TXT fájlba átalakítani a Raw kivonási módszerrel:

További betekintések

  • teljesítmény és egyszerűség: A nyers szöveg kivonata általában gyorsabb, mert nem próbál semmilyen formázási szabályt megszakítani vagy alkalmazni.
  • Használt esetek: Ideális a napló kivonásához, a keresési indexeléshez vagy a forgatókönyvekhez, ahol csak szöveges tartalomra van szükség.

Konvertálja a PDF-t a TXT-fájl formázási rutinokkal C# vagy VB.NET segítségével

Más forgatókönyvekben a szöveg formázásának megőrzése (például bekezdések, indentációk és oszlopok) elengedhetetlen.Ez a módszer a formázási rutinokat alkalmazza a dokumentum elrendezésének tükrözésére az eredményes TXT fájlban.

Text Extraction lépések formázással

  • Töltse le a forrás PDF fájlt: Mint korábban, töltse le a PDF dokumentumot az alkalmazásba.

  • Kezdeményezzen egy szalagváltozót: Készítsen egy szalagot a formázott szöveg kimenetelének összegyűjtésére.

  • A szöveg kivonása formázási módban: Minden oldalra használja a SzövegszerkesztésMode.Pure Ez a mód arra törekszik, hogy az eredeti formázást a lehető legközelebbi módon ismételje meg.

  • Megmentse a formázott szöveget: Hozza ki a gyűjtött szöveget egy TXT fájlba, amely strukturált formázást tart fenn, mint például a vonalszakadások, az indentsek és a táblák spacing.

Az alábbi kód példája azt mutatja, hogyan lehet PDF-t TXT fájlba konvertálni a C# szövegformázással:

A RAW és a Pure Extraction összehasonlítása

Az alábbi kép a két kivonási mód vizuális összehasonlítását nyújtja. bal oldalon a PDF szövege az eredeti formázással jelenik meg (Tiszta mód), míg a jobb oldalon a nyers szöveget formázás nélkül jelenik meg. Ez a összehasonlítás segít eldönteni, hogy melyik módszer a legjobban megfelel az Ön igényeinek.

Convert PDF TXT csharp

A TXT fájl PDF-re való konvertálása C# vagy VB.NET használatával

A TXT fájl PDF-re való átalakítása hasznos, ha egy polizált dokumentumot kell készíteni a tiszta szöveg tartalmából.Ez a folyamat magában foglalja a szöveg olvasását, majd a PDF formázást, hogy olyan dokumentumot hozzon létre, amely vizuálisan vonzó és elosztásra készen áll.

Lépések a TXT a PDF konverzióhoz

  • Hozzon létre egy TextReader beállítást: Használja a Textolvasó olvasni a tartalmat a TXT fájlból.

  • Kezdeményezzen egy új PDF-dokumentumot és adjon hozzá fehér oldalt: Hozzon létre egy példát a Dokumentumok Tanfolyam és adjon hozzá egy új oldalt.

  • A TextBuilder objektum beállítása: Használja a Szövegépítő a kívánt formázással rendelkező szöveges bekezdéseket, például betűtípusokat, méreteket és színeket építeni.

  • Olvassa el és bővítse a szöveg minden vonalát: Menj át a TXT fájlban található vonalakon, minden vonalat a TextBuilder objektumhoz csatolva.

  • mentse a PDF kimenetet: Használja a Térképek (Save String) módja annak, hogy a végső PDF fájlt a lemezre írja.

Az alábbi kódszerkesztés azt mutatja, hogyan lehet egy TXT fájlt PDF dokumentumba C# használatával átalakítani:

Vélemények A TXT-t PDF-re való átalakításakor

  • Térkép és stílus: Előfordulhat, hogy be kell igazítania a marginokat, a vonalterületeket és más szöveges tulajdonságokat annak biztosítása érdekében, hogy a PDF jól formázott és olvasható legyen.
  • • Hibaelhárítás: Végezze el a fájl olvasás és írási műveletek során végrehajtott hibaellenőrzést olyan forgatókönyvek kezelésére, mint a fájl-hozzáférési problémák vagy a hibák kódolása.

következtetések

Ebben a cikkben megmutattuk a PDF fájlokat a TXT-re, illetve a VB.NET-t a .NET Framework használatával PDF-be konvertálására szolgáló technikákat. függetlenül attól, hogy a gyors és egyszerű szöveg kivonását választja, vagy formázott szöveget igényel a dokumentum elrendezésének megőrzése érdekében, a Az ASPOSE.PDF for .NET Az API megbízható és rugalmas megoldásokat kínál.Ezek az átalakítási módszerek értéktelenek az adatok feldolgozásához, a dokumentumok archiválásához és a tartalom helyreállításához.

Ha bármilyen kérdése vagy további segítségre van szüksége, kérjük, látogasson el hozzánk. Ingyenes támogatási fórum vagy felülvizsgálja a Termékdokumentáció.

Lásd még

More in this category