Convert PDF to TXT in C#

Kaip programuotojas, dažnai turite ištraukti turinį iš PDF failų kaip plokščią tekstą tolesniam apdorojimui, pavyzdžiui, analizės ir informacijos ekstrakcijos. apdoroti PDF failius ir konvertuoti visą PDF į TXT formatą yra sudėtinga užduotis, kai neturite tinkamų įrankių. Taigi šiame tinklaraštyje mes ištirsime, kaip programuojamai konvertuoti PDF dokumentą į tXT formato C#.

C# biblioteka PDF į TXT konvertavimas

[Aspose.Words for .NET][1] yra nuostabus dokumentų apdorojimo API, kuris leidžia kūrėjams dirbti su “Word” dokumentais, taip pat įvairiais kitais formatais, įskaitant PDF. Su savo platų funkcijų rinkinį, “Aspoze.Vords” supaprastina dokumentu manipuliavimą, konvertavimą ir generavimo užduotis.

Galite įdiegti biblioteką iš [NuGet][5] naudodami toliau nurodytą komandą. arba atsisiųsti jos DLL iš puslapio [Releases][6].

PM> Install-Package Aspose.Words 

Konvertuokite PDF į TXT į C# {#Kaip konvertuoti-DOC į-TXT}

Aspose.Words for .NET slėpia visas sudėtingas tekstų ekstrakcijos operacijas iš PDF failų ir leidžia atlikti PDF į TXT konvertavimą keliais žingsniais, kaip nurodyta žemiau.

  • Atsisiųskite PDF failą.
  • Konvertuoti PDF į TXT formatą su vienu funkcijos skambučiu.

Taigi, su keliomis kodo eilutėmis, galite konvertuoti PDF failo turinį į paprastą tekstą, nesvarbu, kokio dydžio šaltinis yra PDF.

  • Pirmiausia įkraukite PDF naudojant Dokumento klasę.
  • Tada išsaugokite dokumentą kaip TXT failą naudojant Document.Save(filePath) metodą.

Kitas C# kodas Snippet konvertuoja PDF į TXT formatą.

Gaukite nemokamą API licenciją

Galite gauti [laisvą laikiną licenciją][2] konvertuoti PDF failus į TXT formatą be vertinimo apribojimų.

Conclusion

Šiame tinklaraštyje mes ištirėme, kaip konvertuoti PDF į TXT C# naudojant Aspose.Words .NET bibliotekoje. laikydamiesi gairių ir naudodami kodo šnipą, galite lengvai apdoroti didelius PDF failus ir paversti juos plokščiu tekstu. „Aspose.“Wordai supaprastina dokumentų apdorojimo užduotis, todėl tai yra vertingas įrankis kūrėjams, dirbantiems su įvairiais dokumento formatais jų programas.

More in this category