Aspose.OCR for .NET は、編集可能なテキストフォーマットに画像を変換することによってこのプロセスを自動化するための強力なソリューションを提供します. このブログの投稿では、より効率的にフォームからデータを抽出するために必要なステップを通じてあなたを指導します。
完全例
迅速なスタートを得るには、Aspose.OCR for .NET を使用してデータ入力を自動化する方法の概要を参照してください。
- フォーマット画像をアップします。
- 最適な認識のためのOCR設定を設定します。
- 形式からテキストを抽出します。
- 認定されたテキストを望ましいフォーマットに輸出します。
ステップ・ステップ・ガイド
ステップ1:フォーム画像をアップロード
最初のステップは、スキャンまたは撮影されたフォームをアプリケーションにアップロードすることです。画像の質が正確なOCR処理に十分に高いことを確認します。 Image
クラスは画像ファイルをアップロードします。
ステップ2:OCR設定を設定する
最良の結果を達成するには、フォームの特性に応じてOCR設定を設定する必要があります. これは言語サポートの設定、対比と明るさを調整し、テキスト抽出のための関心地域(ROI)を指定することを含みます。
// Step 1: Load the form image
string imagePath = "path/to/your/form_image.png";
using (var image = new Aspose.Ocr.Image(imagePath))
{
// Image is now loaded and ready for OCR processing
}
ステップ3:フォームからテキストを抽出する
画像がアップロードされ、設定が設定された後、フォームからテキストを抽出することができます. Aspose.OCR は、特定の領域または全体の画像で文字を認識する方法を提供します。
// Step 2: Configure OCR Settings
var ocrEngine = new OcrEngine();
ocrEngine.Settings.Language = RecognitionLanguages.English;
ocrEngine.Settings.ContrastAdjustmentMode = ContrastAdjustmentMode.HighContrast;
ocrEngine.Settings.Brightness = 10;
ステップ4:認定テキストの輸出
テキストを抽出した後、さらなる処理に適したフォーマットにエクスポートしたいかもしれません、例えばCSV、JSON、またはフライトテックス。
// Step 3: Extract text from the form
using (var ocrEngine = new OcrEngine())
{
string extractedText = ocrEngine.RecognizeImage(imagePath);
Console.WriteLine("Extracted Text:\n" + extractedText);
}
ベストプラクティス
リアル・ワールド・レイアウト
これらの課題を効果的に処理するには、専門用語のカスタマイズ辞書などの高度な機能を使用するか、形式が異なる言語でテキストを含む場合、複数のOCR語を設定することを検討してください。
輸出オプション
認められたテキストを輸出する際には、作業流に最適な出力形式を選択します. たとえば、CSVはテーブルデータにとって理想的ですが、JSONは組織化されたオブジェクトで構成されたデータにより良いです。
これらのステップや最良の実践に従って、スキャンされたまたは撮影されたフォームからデータの入力を効率的に自動化することができます .NET のための Aspose.OCR. これは時間を節約するだけでなく、手動のデータ入力に関連するエラーのリスクも減少します。