PDF ファイルは、テキスト、画像、アニメーション、ビデオ、およびさまざまなノートをサポートしているため人気があります. しかし、多くの文書にとって、文字は最も重要な部分です. この記事では、PDFファイルをTXTファイルに変換する方法を説明し、逆にC# .NETを使用してTCTファイルがPDFに変更することを説明します.このコンバージョンは特に役立ちます。

このガイドに含まれるテーマは、

タイプ: あなたも無料で興味があるかもしれません。 GIF コンバータへのテキスト これにより、テキストからアニメーションGIFを生成できます。

C# TXT to PDF または PDF to TXT Converter

PDF と TXT フォーマットの間の変換は、文書内のテキストデータにあなたの主な関心がある場合に不可欠です. 単純なテクスト分析のためにすべての形式を削除する必要があるか、あるいは構造化されたレイアウトを保存する必要がありますが、このプロセスはいくつかの簡単なステップで完了することができます。 ASPOSE.PDF for .NET このAPIは多様であり、C#とVB.NETの両方をサポートし、あなたの .NET アプリケーションに簡単に統合できます。

アプリケーションに API をインストールするには、DLL ファイルをダウンロードできます。 ダウンロード あるいは使用する ニュージーランド 例えば、パッケージマネージャーコンソールを介してインストールしてください。

PM> Install-Package Aspose.PDF

API がインストールされた後、複数のアプローチで変換プロセスを開始することができます。

C# フォーマットなしで PDF を TXT に変換

この方法は、文書に表示されているように、文字、スペース、またはスタイルを保存せずに、テキストを抽出します。それは特にテキスト分析、検索インデックス、またはランキングが無関係である場合に有用です。

原始テキスト抽出のステップ

  • PDFドキュメントの入力をダウンロードする: API を使用して PDF ファイルをドキュメント オブジェクトにロードします。

  • ストリングビルダーをスタートさせる: 例を生み出し、 ストリングビルダー テキストデータを効率的に収集するためのクラス。

  • 各PDFページを通じてイタレートする: ドキュメントのすべてのページを通過します. 各ページのために:

  • 利用 テキストデバイス テキストを抽出する。

  • 雇用を 原型モード フォーマットが適用されていないことを確認するために。

  • 出力テキストを保存する: 積み重ねられたテキストを TXT ファイルに書き込む。

下のコードスナイプは、Raw抽出方法を使用してPDFをTXTファイルに変換する方法を示しています。

追加情報

  • ◎実績とシンプルさ: 原始テキスト抽出は通常より速いので、パルスやフォーマットのルールを適用しようとしません。
  • 使用例: ログ抽出、検索インデックス、またはテキストコンテンツのみが必要なシナリオに最適です。

PDF を TXT ファイルに変換する C# または VB.NET {#section3} を使用してフォーマット ルーチン

他のシナリオでは、テキストのフォーマットを保存する(例えば、段落、インデント、コラムなど)は重要です この方法は、結果のTXTファイルに文書の配置を反映するためのフォーマットルーチンを適用します。

テキストエクストラクションのステップ フォーマット

  • PDFファイルのソースをダウンロードする: 以前のように、PDFドキュメントをアプリケーションにアップロードします。

  • ストレッチ変数を起動する: フォーマットされたテキスト出力を収集するためのシートを準備します。

  • フォーマットモードを使用してテキストを抽出する: それぞれのページで、使用してください。 タイトル:Mode.Pure このモードは、オリジナルのフォーマットをできるだけ密接に再生しようとします。

  • フォーマットされたテキストを保存する: 収集されたテキストを構造化されたフォーマットを保存する TXT ファイルにリリースし、ライン ブレイク、インデント、タブ スペースを保存します。

下記のコードの例では、C#を使用してテキストフォーマットでPDFをTXTファイルに変換する方法を示しています。

RAWとPure Extractionの比較

下の画像は、2つの抽出モードの視覚的な比較を提供します。左側には、PDFのテキストがオリジナルのフォーマット(純粋なモード)で表示されますが、右側はフォーマットなしで原文を表示します。この比較は、どの方法があなたのニーズに最適であるかを決定するのに役立ちます。

Convert PDF TXT csharp

TXT ファイルを PDF に変換する C# または VB.NET {#section4} を使用してプログラミング

TXT ファイルを PDF に変換することは、フラット テキスト コンテンツからポリッシュ ドキュメントを作成する必要があるときに役立ちます このプロセスは、テキストを読み、その後 PDF フォーマットを適用して、視覚的に魅力的なドキュメントを作成し、配布の準備ができています。

TXT を PDF に変換するためのステップ

  • テキストリーダーインスタンスを作成する: 使用する The テキストリーダー TXTファイルからコンテンツを読むためのクラス。

  • 新しいPDFドキュメントをスタートさせ、白いページを追加する: 例を生み出し、 文書 クラスと新しいページを追加します。

  • TextBuilder オブジェクトをインストールする: 使用する The テキストビルダー 望ましいフォーマットでテキスト段落を構築するには、文字、サイズ、色など。

  • 各文字の読み方と追加: TXT ファイルのラインを通過し、それぞれのラインを TextBuilder オブジェクトに貼り付けます。

  • PDFの出力を保存する: 使用する The ドキュメンタリー:Save(ストリング) 最後のPDFファイルをディスクに書き込む方法。

下のコードスナイプは、C#を使用して TXT ファイルを PDF ドキュメントに変換する方法を示しています。

TXTをPDFに変換する際の考慮事項

  • レイアウト&スタイル: マージン、ラインスペース、およびその他のテキスト属性を調整して、PDFがよくフォーマットされ、読みやすいことを確認する必要があります。
  • エラー処理: ファイル読み書き作業中にエラーチェックを実施して、ファイルアクセス問題やエラーコードなどのシナリオに対処します。

結論

この記事では、C#またはVB.NETを使用してPDFにPDFファイルを変換するためのテクニックを示しました .NET Framework. あなたがスピードとシンプルさのための原始テキスト抽出を選択するか、文書の配置を維持するためにフォーマットされた文字を必要とするかどうか、 ASPOSE.PDF for .NET API は信頼性と柔軟性の高いソリューションを提供します. これらの変換方法は、データ処理、ドキュメントアーカイブ、コンテンツ再配置に貴重です。

質問あるいはさらなる助けを必要とする場合は、当社を訪問してください。 無料サポートフォーラム あるいはレビュー 製品文書.

こちらも見る

More in this category