PDF에 대하여 파일은 텍스트, 이미지, 애니메이션, 비디오 및 다양한 메모를 지원하기 때문에 인기가 있습니다.그러나, 많은 문서에 대한,이 문서는 가장 중요한 부분입니다.이 기사는 PDF 파일을 TXT 파일로 변환하는 방법을 설명하고, 반대로, C# .NET을 사용하여 PDF에 TXT 파일.
이 가이드에 포함된 주제는 다음과 같습니다 :
- C# TXT to PDF 또는 PDF to TXT Converter API
- C# 형식화 없이 PDF를 TXT로 변환
- C# 또는 VB.NET을 사용하여 PDF를 TXT 파일로 변환
- C# 또는 VB.NET을 사용하여 PDF로 TXT 파일을 변환
팁: 당신은 또한 무료에 관심이있을 수 있습니다 GIF 변환기 GIF 변환기 그것은 당신이 텍스트에서 애니메이션 GIF를 생성 할 수 있습니다.
C# TXT to PDF 또는 PDF to TXT Converter
PDF 및 TXT 형식 사이의 변환은 문서 내의 텍스트 데이터에 대한 주요 관심이 있을 때 필수적입니다. 간단한 문자 분석을 위해 모든 형식을 제거하거나 구조화된 배열을 유지해야 하는지 여부, 이 과정은 단순한 단계를 사용하여 수행될 수 있습니다. ASPOSE.PDF 에서 .NET 이 API는 다양하며 C#와 VB.NET 모두를 지원하여 .NET 응용 프로그램에 쉽게 통합할 수 있습니다.
앱에 API를 설치하려면 DLL 파일을 다운로드할 수 있습니다. 다운로드 또는 사용하십시오 나그네 예를 들어, Package Manager Console를 통해 설치하십시오 :
PM> Install-Package Aspose.PDF
API가 설치되면 여러 가지 요구 사항에 맞게 맞는 여러 접근 방식으로 변환 과정을 시작할 수 있습니다.
C# 형식화 없이 PDF를 TXT로 변환
때때로 PDF 문서에서 원료 텍스트를 추가 형식화 없이만 필요합니다.이 방법은 문서에 나타나는 것처럼 텍스트를 추출하고, 글꼴, 공간 또는 스타일을 보존하지 않습니다.이 방법은 텍스트 분석, 검색 인덱스 또는 배열이 중요하지 않을 때 특히 유용합니다.
원료 텍스트 추출을 위한 단계
입력 PDF 문서를 다운로드하십시오 : API를 사용하여 PDF 파일을 문서 개체로 업로드합니다.
StringBuilder를 시작하십시오 : 하나의 사례를 만들기 위하여 스트링부이더 클래스는 효율적으로 텍스트 데이터를 축적합니다.
각 PDF 페이지를 통해 이터테이트: 문서의 모든 페이지를 통과하십시오. 각 페이지에 대 한 :
사용하기 텍스트기구 텍스트를 추출합니다.
일자리를 고용하세요 원시 모드 포맷이 적용되지 않도록 하기 위하여.
출력 텍스트를 저장하십시오 : 축적 된 텍스트를 TXT 파일에 입력합니다.
아래의 코드 스니프트는 Raw 추출 방법을 사용하여 PDF를 TXT 파일로 변환하는 방법을 보여줍니다.
추가 인식
- 성과 및 단순성 : 원료 텍스트 추출은 일반적으로 프레젠테이션 규칙을 파시하거나 적용하지 않기 때문에 더 빠릅니다.
- 사용한 경우 : 로그 추출, 검색 인덱스 또는 단지 텍스트 콘텐츠가 필요한 시나리오에 이상적입니다.
PDF를 C# 또는 VB.NET {#section3}를 사용하여 TXT 파일로 변환
다른 시나리오에서는 텍스트의 포맷을 유지하는 것이 중요합니다 (예 : 단락, 인센트 및 열).이 방법은 결과 TXT 파일에서 문서의 배열을 반영하기 위해 포맷 루틴을 적용합니다.
포맷을 사용하여 텍스트 추출 단계
원본 PDF 파일을 다운로드하십시오 : 이전과 마찬가지로 PDF 문서를 응용 프로그램에 업로드하십시오.
스트링 변수를 시작하십시오 : 포맷 된 텍스트 출력을 수집하기 위해 스트립을 준비하십시오.
포맷 모드를 사용하여 텍스트 추출: 각 페이지를 사용하려면 텍스트공식Mode.Pure 이 모드는 원본 포맷을 가능한 한 가까이 복제하려고합니다.
포맷 된 텍스트를 저장하십시오 : 수집된 텍스트를 구조화된 형식을 유지하는 TXT 파일로 출력하십시오, 예를 들어 라인 브레이크, 인덱스 및 탭 스파이킹.
다음 코드 예제는 C#를 사용하여 텍스트 형식을 사용하여 PDF를 TXT 파일로 변환하는 방법을 보여줍니다.
RAW와 Pure Extraction의 시각적 비교
아래 그림은 두 추출 모드의 시각적 비교를 제공합니다. 왼쪽에는 PDF의 텍스트가 원본 형식으로 표시됩니다 (순수 모드), 오른쪽에는 형식없이 원본 텍스트가 표시됩니다.이 비교는 어떤 방법이 당신의 요구에 가장 적합한지 결정하는 데 도움이 될 수 있습니다.

C# 또는 VB.NET을 사용하여 PDF로 TXT 파일을 변환하십시오
TXT 파일을 PDF로 다시 변환하는 것은 깔끔한 텍스트 콘텐츠에서 폴리화 된 문서를 생성해야 할 때 유용합니다.이 과정은 텍스트를 읽고 PDF 형식을 적용하여 시각적으로 매력적이고 배포 할 준비가 된 문서를 만드는 것을 포함합니다.
TXT에서 PDF로 변환하는 단계
TextReader 인스턴스 만들기: 사용하시기 바랍니다 텍스트 리더 클래스는 TXT 파일에서 콘텐츠를 읽을 수 있습니다.
새로운 PDF 문서를 시작하고 흰색 페이지를 추가하십시오: 하나의 사례를 만들기 위하여 문서 클래스 및 새로운 페이지를 추가합니다.
TextBuilder 개체를 즉시 설치하십시오 : 사용하시기 바랍니다 텍스트 제작자 원하는 형식으로 텍스트 구절을 구축하려면, 예를 들어 글꼴, 크기 및 색상.
읽기 및 각 문서 라인을 추가하십시오 : TXT 파일의 라인을 통과하여 TextBuilder 개체에 각 라인을 첨부합니다.
출력 PDF를 저장하십시오 : 사용하시기 바랍니다 원제 :Save (String) 최종 PDF 파일을 디스크로 작성하는 방법.
아래의 코드 스크립트는 C#를 사용하여 TXT 파일을 PDF 문서로 변환하는 방법을 보여줍니다.
TXT를 PDF로 변환할 때 고려 사항
- 레이아웃 및 스타일 : PDF가 잘 형식화되고 읽을 수 있는지 확인하기 위해 마진, 라인 공간 및 기타 텍스트 속성을 조정해야 할 수도 있습니다.
- 실수 처리 : 파일 읽기 및 작성 작업 중 실수를 확인하여 파일 액세스 문제 또는 오류 암호화와 같은 시나리오를 처리합니다.
결론
이 기사에서 우리는 .NET 프레임 워크에서 C# 또는 VB.NET을 사용하여 PDF 파일을 TXT 및 TXT 파일으로 PDF로 변환하는 기술을 보여주었습니다. 빠르고 간단한 원료 텍스트 추출을 선택하거나 문서 배열을 유지하기 위해 형식화 된 문서를 필요로하든, ASPOSE.PDF 에서 .NET API는 신뢰할 수 있고 유연한 솔루션을 제공합니다.이 변환 방법은 데이터 처리, 문서 아카이브 및 콘텐츠 재포지에 가치가 없습니다.
질문이 있거나 추가 지원이 필요하다면 저희를 방문하시기 바랍니다. 무료 지원 포럼 또는 검토 제품 문서화.