PDF A fájlok népszerűek, mert támogatják a szöveget, képeket, animációkat, videókat és a különböző jegyzeteket. Mindazonáltal sok dokumentum számára a szöveg a legfontosabb része. Ez a cikk megmagyarázza, hogyan lehet PDF-fájlokat TXT-fiókokba és fordítva a C# .NET-t használva PDF‐ké alakítani.Ez az átalakítás különösen hasznos, ha kizárólag a pdf-dokumentum szövegtartalmára van szüksége, vagy összpontosít, mint például szövegelemzés elvégzése vagy a tartalom előkészítése a reformáláshoz.
Az ebben az útmutatóban felsorolt témák közé tartozik:
- C# TXT PDF vagy PDF a TXT Converter API
- C# PDF átalakítása TXT formázás nélkül
- Konvertálja a PDF-t a TXT-fájlba a C# vagy VB.NET formázási rutinokkal
- A TXT fájl PDF-re történő programozása C# vagy VB.NET használatával
Tipp: Ön is érdekelhet egy ingyenes Szöveg a GIF konverter Ez lehetővé teszi, hogy animált GIF-eket hozzon létre a szövegből.
C# TXT PDF vagy PDF a TXT Converter
A PDF és a TXT formátumok átalakítása elengedhetetlen, ha a legfontosabb érdeklődésed a dokumentumon belüli szöveges adatokban rejlik. Akár az összes formázást egyszerű szövegelemzéshez kell kivágnia, vagy meg kell őriznie a strukturált elrendezést, a folyamat néhány egyszerű lépéssel érhető el. Az ASPOSE.PDF for .NET Ez az API sokoldalú, és támogatja mind a C# és a VB.NET, így könnyen integrálható a .NET alkalmazások.
Az API telepítéséhez az alkalmazásban letöltheti a DLL fájlokat Letöltés vagy használja a Nyugdíj Például telepítse a csomagkezelő konzolon keresztül:
PM> Install-Package Aspose.PDF
Miután az API be van telepítve, elkezdheti az átalakítási folyamatot több megközelítéssel, amelyek a különböző igényekhez igazodnak.
C# PDF átalakítása TXT formázás nélkül
Néha csak a PDF dokumentumból származó nyers szövegre van szüksége további formázás nélkül. Ez a módszer pontosan úgy kivonja a szöveget, ahogyan a dokumentumban jelenik meg, betűtípusok, térképek vagy stílusok megőrzése nélkül. Különösen hasznos a szöveges elemzéshez, a keresési indexeléshez, vagy amikor a layout irrelevant.
Lépés a nyers szöveg kivonásához
Töltse le a PDF dokumentumot: Használja az API-t, hogy a PDF fájlt dokumentumobjektumba töltse fel.
Kezdeményezzen egy StringBuilder: Hozzon létre egy példát a Stringépítő Az osztály hatékonyan összegyűjti a szövegadatokat.
Egy PDF oldalon keresztül írja le: A dokumentum minden oldalán fut. Minden oldalra:
Használat szövegszerkesztés A szöveg kivonása.
Foglalkozz a Raw mód annak biztosítása, hogy a formázást nem alkalmazzák.
Megmentse a kimeneti szöveget: Írja be az összegyűjtött szöveget egy TXT fájlba.
Az alábbi kódkészlet illusztrálja, hogyan lehet PDF-t TXT fájlba átalakítani a Raw kivonási módszerrel:
További betekintések
- teljesítmény és egyszerűség: A nyers szöveg kivonata általában gyorsabb, mert nem próbál semmilyen formázási szabályt megszakítani vagy alkalmazni.
- Használt esetek: Ideális a napló kivonásához, a keresési indexeléshez vagy a forgatókönyvekhez, ahol csak szöveges tartalomra van szükség.
Konvertálja a PDF-t a TXT-fájl formázási rutinokkal C# vagy VB.NET segítségével
Más forgatókönyvekben a szöveg formázásának megőrzése (például bekezdések, indentációk és oszlopok) elengedhetetlen.Ez a módszer a formázási rutinokat alkalmazza a dokumentum elrendezésének tükrözésére az eredményes TXT fájlban.
Text Extraction lépések formázással
Töltse le a forrás PDF fájlt: Mint korábban, töltse le a PDF dokumentumot az alkalmazásba.
Kezdeményezzen egy szalagváltozót: Készítsen egy szalagot a formázott szöveg kimenetelének összegyűjtésére.
A szöveg kivonása formázási módban: Minden oldalra használja a SzövegszerkesztésMode.Pure Ez a mód arra törekszik, hogy az eredeti formázást a lehető legközelebbi módon ismételje meg.
Megmentse a formázott szöveget: Hozza ki a gyűjtött szöveget egy TXT fájlba, amely strukturált formázást tart fenn, mint például a vonalszakadások, az indentsek és a táblák spacing.
Az alábbi kód példája azt mutatja, hogyan lehet PDF-t TXT fájlba konvertálni a C# szövegformázással:
A RAW és a Pure Extraction összehasonlítása
Az alábbi kép a két kivonási mód vizuális összehasonlítását nyújtja. bal oldalon a PDF szövege az eredeti formázással jelenik meg (Tiszta mód), míg a jobb oldalon a nyers szöveget formázás nélkül jelenik meg. Ez a összehasonlítás segít eldönteni, hogy melyik módszer a legjobban megfelel az Ön igényeinek.

A TXT fájl PDF-re való konvertálása C# vagy VB.NET használatával
A TXT fájl PDF-re való átalakítása hasznos, ha egy polizált dokumentumot kell készíteni a tiszta szöveg tartalmából.Ez a folyamat magában foglalja a szöveg olvasását, majd a PDF formázást, hogy olyan dokumentumot hozzon létre, amely vizuálisan vonzó és elosztásra készen áll.
Lépések a TXT a PDF konverzióhoz
Hozzon létre egy TextReader beállítást: Használja a Textolvasó olvasni a tartalmat a TXT fájlból.
Kezdeményezzen egy új PDF-dokumentumot és adjon hozzá fehér oldalt: Hozzon létre egy példát a Dokumentumok Tanfolyam és adjon hozzá egy új oldalt.
A TextBuilder objektum beállítása: Használja a Szövegépítő a kívánt formázással rendelkező szöveges bekezdéseket, például betűtípusokat, méreteket és színeket építeni.
Olvassa el és bővítse a szöveg minden vonalát: Menj át a TXT fájlban található vonalakon, minden vonalat a TextBuilder objektumhoz csatolva.
mentse a PDF kimenetet: Használja a Térképek (Save String) módja annak, hogy a végső PDF fájlt a lemezre írja.
Az alábbi kódszerkesztés azt mutatja, hogyan lehet egy TXT fájlt PDF dokumentumba C# használatával átalakítani:
Vélemények A TXT-t PDF-re való átalakításakor
- Térkép és stílus: Előfordulhat, hogy be kell igazítania a marginokat, a vonalterületeket és más szöveges tulajdonságokat annak biztosítása érdekében, hogy a PDF jól formázott és olvasható legyen.
- • Hibaelhárítás: Végezze el a fájl olvasás és írási műveletek során végrehajtott hibaellenőrzést olyan forgatókönyvek kezelésére, mint a fájl-hozzáférési problémák vagy a hibák kódolása.
következtetések
Ebben a cikkben megmutattuk a PDF fájlokat a TXT-re, illetve a VB.NET-t a .NET Framework használatával PDF-be konvertálására szolgáló technikákat. függetlenül attól, hogy a gyors és egyszerű szöveg kivonását választja, vagy formázott szöveget igényel a dokumentum elrendezésének megőrzése érdekében, a Az ASPOSE.PDF for .NET Az API megbízható és rugalmas megoldásokat kínál.Ezek az átalakítási módszerek értéktelenek az adatok feldolgozásához, a dokumentumok archiválásához és a tartalom helyreállításához.
Ha bármilyen kérdése vagy további segítségre van szüksége, kérjük, látogasson el hozzánk. Ingyenes támogatási fórum vagy felülvizsgálja a Termékdokumentáció.
Lásd még
More in this category
- A PDF formanyomtatvány megjelenésének személyre szabása az Aspose.PDF-vel C#
- A PDF-k automatikus elosztása a .NET-ben
- Adatok importálása PDF táblák külső forrásokból .NET
- AI-támogatott PDF munkafolyamatok létrehozása .NET-ben a ChatGPT segítségével
- Aspose.PDF ChatGPT Plugin vs OpenAI API PDF feldolgozás .NET