
プログラマーとして、あなたはしばしば、分析や情報抽出などのさらなる処理のためのフラットテキストとしてPDFファイルからコンテンツを抽出する必要があります。PDFファイルを処理し、TXTフォーマットにPDF全体を変換することは、あなたが正しいツールを持っていないときに困難な課題です。
C# Library for PDF to TXT 変換
[Aspose.Words for .NET][1]は、開発者がWordドキュメントやPDFを含むさまざまな他のフォーマットで働くことを可能にする素晴らしいドキュメント処理APIです。機能の幅広いセットで、Aspose.Wordsはドキュメント操作、変換、および生成作業を簡素化します。
あなたは次のコマンドを使用して [NuGet][5] から図書館をインストールすることができます. または [リリース][6] セクションから DLL をダウンロードします。
PM> Install-Package Aspose.Words
PDF を C# に TXT に変換する
Aspose.Words for .NET は、PDF ファイルからテキストを抽出するすべての複雑な操作を隠し、以下のように、いくつかのステップで PDF を TXT に変換することを可能にします。
- PDFファイルをダウンロード。
- PDF を単一機能通話で TXT 形式に変換します。
したがって、コードのいくつかのラインで、PDFファイルのコンテンツを平らなテキストに変換することができます、PDFのソースがどれほど大きいかに関係なく。
- まず、PDFを Document クラスでアップロードします。
- その後、Document.Save(filePath) 方法を使用して TXT ファイルとしてドキュメントを保存します。
次の C# コード スナイプは PDF を TXT 形式に変換します。
無料 API ライセンスを取得する
評価制限なしに PDF ファイルを TXT 形式に変換するために [無料の暫定ライセンス] を取得することができます。
結論
このブログ投稿では、Aspose.Words for .NET ライブラリのための Aspose.Words を使用して PDF を C# に変換する方法を調べました. ガイドラインに従ってコード スナイプを使用すると、簡単に大きな PDF ファイルを処理し、フラット テキストに変換することができます. Aspose.Words はドキュメント処理の課題を簡素化し、アプリケーションのさまざまなドキュメント フォーマットで働く開発者にとって貴重なツールとなります. この .NET ワード プロセッサ ライブラリの [ドキュメント] を参照してその素晴らしい機能を調べることができます。