PDF faili ir populāri, jo tie atbalsta tekstu, attēlus, animācijas, video, un dažādas piezīmes. Tomēr, daudziem dokumentiem, teksts ir vissvarīgākā daļa. Šis raksts izskaidro, kā konvertēt PDF failus uz TXT failu un, otrādi, TXT fails uz PDF, izmantojot C# .NET. Šī konversija ir īpaši noderīga, ja jums ir nepieciešams, lai iegūtu vai koncentrēties tikai uz teksta saturu PDF dokumentu, piemēram, veicot tekstā analīzi vai sagatavojot saturam pārveidošanai.
Šajā vadlīnijā aprakstītās tēmas ietver:
- C# TXT uz PDF vai PDF uz TXT Converter API
- C# Konvertēt PDF uz TXT bez formatēšanas
- Konvertēt PDF uz TXT failu ar Formatēšanas rutīnas, izmantojot C# vai VB.NET
- Konvertēt TXT failu uz PDF Programmatiski, izmantojot C# vai VB.NET
Tip: Jums var būt arī interese par bezmaksas Teksts uz GIF Converter Tas ļauj jums radīt animētus GIF no teksta.
C# TXT uz PDF vai PDF uz TXT Converter
Konvertēšana starp PDF un TXT formātus ir svarīga, ja jūsu galvenais interese ir tekstūras dati dokumentā. Vai jums ir nepieciešams izslēgt visu formātu vienkāršai teksta analīzei vai saglabāt kādu strukturētu izkārtojumu, process var tikt pabeigts ar dažiem vienkāršiem soļiem, izmantojot ASPOSE.PDF par .NET Šis API ir daudzveidīgs un atbalsta gan C#, gan VB.NET, padarot to viegli integrēt jūsu .NET lietojumprogrammās.
Lai instalētu API savā lietojumprogrammā, varat lejupielādēt DLL failus no Downloads Vai arī izmantot NuGet Piemēram, instalējiet to, izmantojot Package Manager Console:
PM> Install-Package Aspose.PDF
Kad API ir uzstādīts, jūs varat sākt konversijas procesu ar vairākām pieejām, kas pielāgotas dažādām vajadzībām.
C# Konvertēt PDF uz TXT bez Formatēšanas
Dažreiz jums ir nepieciešams tikai grūts teksts no PDF dokumentu bez papildu formatēšanas. Šī metode izraksta tekstu tieši tā, kā tas parādās dokumentā, bez saglabāšanas burtiem, spacing, vai stiliem. Tas ir īpaši noderīgi teksta analīzei, meklēšanas indeksošanai vai, ja izkārtojums ir nesaderīgs.
Rāvas teksta ekstrakcijas soļi
Lai lejupielādētu PDF dokumentu: Izmantojiet API, lai lejupielādētu PDF failu dokumentā.
Izveidojiet StringBuilder: Izveidojiet piemēru no StringBuilder klases, lai efektīvi uzkrātu teksta datus.
Izveidojiet katru PDF lapu: Iepazīstiet visas lapas dokumentā. katrai lapai:
Use TextDevice Izrakstīt tekstu.
Nodarbināt šo Rauda modeļi lai nodrošinātu, ka formāts netiek piemērots.
Save output teksts: Ievadiet savāktā teksta uz TXT failu.
Zemāk minētais kods atspoguļo, kā konvertēt PDF uz TXT failu, izmantojot Raw ekstrakcijas metodi:
Papildu ieskati
- Darbība un vienkāršība: Grūts teksta ekstrakcija parasti ir ātrāka, jo tā mēģina neparsēt vai piemērot jebkādus formatēšanas noteikumus.
- lietošanas gadījumi: Ideāli piemērots log ekstrakcijai, meklēšanas indeksācijai vai scenārijām, kur nepieciešama tikai teksta saturs.
Konvertēt PDF uz TXT failu ar Formatēšanas rutīnas, izmantojot C# vai VB.NET
Citos scenārijos ir svarīgi saglabāt teksta formatēšanu (piemēram, daļas, indentācijas un kolonnas). šī metode attiecas uz formatēšanas rutīnas, lai atspoguļotu dokumentu izkārtojumu rezultātā TXT failā.
Sāpes teksta ekstrakcijai ar formātu
Lasīt avotu PDF failu: Tāpat kā iepriekš, lejupielādējiet PDF dokumentu savā pieteikumā.
Izveidojiet String Variable: Sagatavojiet rindi, lai savāktu formatētu teksta iznākumu.
Izrakstīt tekstu, izmantojot formatēšanas režīmu: Katrai lapai izmantojiet TextFormattingMode.Pure pārskats Šis režīms cenšas reproducēt oriģinālo formātu pēc iespējas tuvāk.
** Iegūstiet formāta tekstu:** Izveido savāktā teksta uz TXT failu, kas saglabā strukturētu formātu, piemēram, līnijas pārtraukumus, indentus un tabas telpas.
Nākamais kodu piemērs parāda, kā konvertēt PDF uz TXT failu ar teksta formātu, izmantojot C#:
RAW un Pure Extraction salīdzinājums
Nākamais attēls nodrošina divu ekstrakcijas režīmu vizuālo salīdzinājumu. kreisajā pusē PDF teksts parādās ar oriģinālo formātu (Pure mode), savukārt labajā virzienā tiek rādīts izejvielu bez jebkāda formāta.

Konvertēt TXT failu uz PDF Programmatiski, izmantojot C# vai VB.NET
Konvertēt TXT failu atpakaļ uz PDF ir noderīgi, ja jums ir nepieciešams, lai ražotu polizētu dokumentu no plaša teksta satura. Šis process ietver lasīt tekstu un pēc tam pielietot PDF formātā izveidot dokumentu, kas ir vizuāli pievilcīgs un gatavs izplatīšanai.
Sāpes TXT uz PDF konversiju
- Izveidojiet teksta lasītāja instanci:** Izmantojiet TextReader lasīt saturu no TXT faila.
Izveidojiet jaunu PDF dokumentu un pievienojiet balto lapu: Izveidojiet piemēru no Document klases un pievienojiet jaunu lapu.
Iestākt TextBuilder objektu: Izmantojiet TextBuilder veidot teksta daļas ar vēlamo formātu, piemēram, burtu, izmēru un krāsu.
Lasīt un pievienot katru teksta līniju: Pāriet caur rindām TXT failā, pievienojot katru rindas TextBuilder objektam.
Uzglabāt PDF iznākumu: Izmantojiet Dokumentu saglabāšana (String) metodi, lai uzrakstītu galīgo PDF failu uz disku.
Zemāk minētais kods rāda, kā konvertēt TXT failu PDF dokumentā, izmantojot C#:
Apsvērumi, kad konvertēt TXT uz PDF
- Layout un stils: Jums var būt nepieciešams pielāgot maržus, līnijas telpas un citas teksta īpašības, lai pārliecinātos, ka PDF ir labi formatēts un lasāms.
- kļūdu apstrāde: Izveidot kļūdu pārbaudi failu lasīšanas un rakstīšanas darbību, lai risinātu scenārijus, piemēram, failus piekļuves problēmas vai kodēšanas nepilnības.
Conclusion
Šajā rakstā mēs parādījām tehnikas, lai konvertētu PDF failus uz TXT un tXT failiem uz PDF, izmantojot C# vai VB.NET .NET Framework. neatkarīgi no tā, vai jūs izvēlaties izejvielu teksta ekstrakciju ātruma un vienkāršības dēļ vai nepieciešams formatēts teksts dokumentālo izkārtojumu saglabāšanai, ASPOSE.PDF par .NET API piedāvā uzticamus un elastīgus risinājumus. Šīs konversijas metodes nav vērtīgas datu apstrādei, dokumentu arhivēšanai un satura atjaunošanai.
Ja jums ir kādi jautājumi vai nepieciešama papildu palīdzība, lūdzu, apmeklējiet mūsu Bezmaksas atbalsta forums vai pārskatīt Produkta dokumentācija.