ПДФ Датотеке су популарне јер подржавају текст, слике, анимације, видео и различите анотације. међутим, за многе документе, текст је најважнији део. Овај чланак објашњава како да конвертујете ПДФ датотека у ТКТ фајлове и, обрнуто, ТЦТ-файлове у ППД користећи Ц# .НЕТ. Ова трансформација је посебно корисна када морате да извучете или фокусирате се искључиво на текстуални садржај ДФД документа, као што је при извођењу текстуалне анализе или припремање садржаја за реформисање.

Теме покривене у овом водичу укључују:

Тип: Можда ћете такође бити заинтересовани за бесплатну Текст на GIF конвертер То вам омогућава да генеришете анимиране ГИФ-а из текста.

C# TXT у PDF или PDF у TXT конвертер

Конвертација између ПДФ и ТКСТ формата је од суштинског значаја када ваш главни интерес лежи у текстуалним подацима унутар документа. било да морате да избришете све форматирање за једноставан текстуални анализа или да сачувате неки структурирани распоред, процес се може завршити са неколико једноставних корака користећи Аппосе.ПДФ за .NET Овај АПИ је свеобухватни и подржава и Ц # и ВБ.НЕТ, чинећи га лако интегрисати у ваше апликације .NET.

Да бисте инсталирали АПИ у вашој апликацији, можете или да преузмете ДЛЛ датотеке из Преузимање или користите НУГЕТ На пример, инсталирајте га путем конзоле за управљање пакетом:

PM> Install-Package Aspose.PDF

Када је АПИ инсталиран, можете започети процес конверзије са неколико приступа прилагођених различитим потребама.

C# Конвертује ПДФ у ТКСТ без форматирања {# секција2}

Понекад вам је потребан само сирови текст из ПДФ документа без било какве додатне форматирања. Овај метод извлачи текст баш као што се појављује у документу, без чувања шрифтова, простора или стилова. Посебно је корисно за текстуалну анализу, индексирање претраге, или када је распоред нерелевантан.

Корак за екстракцију сировог текста

  • Преузмите увод ПДФ документа: Користите АПИ да бисте преузели ПДФ датотеку у објекат Документа.

  • Иницијалишете StringBuilder: Стварање примера за StringBuilder Класа за ефикасно акумулирање текстуалних података.

  • Итерате кроз сваку ПДФ страницу: Пролази кроз све странице у документу. за сваку страницу:

  • Коришћење TextDevice да извуче текст.

  • запошљавајући Рав Мода Уверите се да се форматирање не примењује.

  • Сачувајте излазни текст: Напишите акумулирани текст у ТКСТ датотеку.

Снипт кода испод илуструје како конвертовати ПДФ у ТКСТ датотеку користећи методу извлачења:

Додатне инспирације

  • Извршеност и једноставност: Екстракција сировог текста је обично брже јер не покушава да парасе или примењује никакве правила форматирања.
  • Употреба случајева: Идеално за екстракцију дневника, индексирање претраге или сценарије у којима је потребан само текстуални садржај.

Конвертујете ПДФ у ТКСТ датотеку са Форматирање рутине користећи Ц# или ВБ.НЕТ

У другим сценаријама, одржавање форматирања текста (као што су параграфи, индентације и колоне) је од суштинског значаја. Ова метода се примењује за форматирање рутина како би се огледало распоред документа у резултатном ТКСТ датотеку.

Корак за текстуалну екстракцију са форматирањем

  • Преузмите извор ПДФ датотеке: Као и раније, преузмите ПДФ документ у вашу апликацију.

  • Покрените променљиву траку: Припремите траку да бисте прикупили форматирани текст излаза.

  • Екстракт текста користећи режим форматирања: За сваку страницу, користите TextFormattingМоде.Пуре Овај режим покушава да репродукује оригинални форматирање што је ближе могуће.

  • Сачувајте форматирани текст: Изводите прикупљени текст у ТКСТ датотеку која задржава структурирано форматирање као што су линија прекида, инденти, и таб простор.

Следећи пример кода показује како конвертовати ПДФ у ТКСТ датотеку са текстуалним форматирањем користећи Ц #:

Визуелно поређење РАВ-а и чисте екстракције

Слика испод пружа визуелно упоређивање два режима екстракције. на левој страни, текст ПДФ-а се појављује са својим оригиналним форматирањем (чисти режим), док десни приказује сирови текст без било какве форматирања.

Convert PDF TXT csharp

Конвертирајте ТКСТ датотеку у ПДФ Програмски користећи Ц# или ВБ.НЕТ

Конвертовање ТКСТ датотеке назад у ПДФ је корисно када морате да произведете полирани документ из плоског текстуалног садржаја. Овај процес укључује читање текста, а затим примењује ПДФ форматирање да би се створио документ који је визуелно привлачан и спреман за дистрибуцију.

Корак за ТКСТ у ПДФ конверзију

  • Стварање текстуалне инстанције за читање: Искористите је Текстови читач Клас за читање садржаја из ТКСТ датотеке.

  • Покрените нови ПДФ документ и додајте белу страницу: Стварање примера за Документ класе и додајте нову страницу.

  • Инсталирајте TextBuilder објекат: Искористите је Текстуар да изгради текстуалне параграфе са жељеним форматирањем, као што су шрифт, величина и боја.

  • Прочитајте и додајте сваку линију текста: Прођите кроз линије у ТКСТ датотеку, причвршћивајући сваку линију на објекат TextBuilder.

  • Сачувајте излаз ПДФ: Искористите је Документ.Спаси (Стринг) метода за писање коначног ПДФ датотеке на диск.

Код скрипт испод показује како конвертовати ТКСТ датотеку у ПДФ документ користећи Ц #:

Размишљања приликом конверзије ТКСТ у ПДФ

  • Распоред и стил: Можда ћете морати да прилагодите маргине, линије и друге текстуалне својства како би се осигурало да је ПДФ добро форматиран и читави.
  • Управљање грешкама: Имплементација грешке провера током читања датотеке и писања операција да се баве сценаријама као што су проблеми приступа датотеке или кодирање грешака.

Закључак

У овом чланку, демонстрирали смо технике за конверзију ПДФ датотека у ТКСТ и ТКТ датеке у ПРФ користећи Ц# или ВБ.НЕТ у .NET Рамворку. да ли бисте одабрали екстракцију сировог текста за брзину и једноставност или захтевају форматирани текст да би се задржао распоред документа, Аппосе.ПДФ за .NET АПИ нуди поуздане и флексибилне решења.Ове методе конверзије су непроцењиве за обраду података, архивирање докумената и репродукцију садржаја.

Ако имате било каквих питања или захтевате додатну помоћ, молимо вас да посетите наш Форум за бесплатну подршку или прегледати Документација производа.

Гледајте такође

More in this category