L’automazione dell’ingresso dei dati dai moduli scansionati o fotografati può aumentare significativamente la produttività e l’accuratezza in varie industrie, come la sanità, le finanze e i servizi legali. Aspose.OCR per .NET offre una potente soluzione per automatizzare questo processo convertendo immagini di testo in formati text editabili. Questo post del blog vi guiderà attraverso i passaggi necessari per configurare e usare Asposa.OCR per …

Esempio completo

Per ottenere un rapido inizio, ecco una panoramica di come puoi automatizzare l’ingresso dei dati utilizzando Aspose.OCR per .NET:

  • Carica l’immagine della forma.
  • Configurare le impostazioni OCR per il riconoscimento ottimale.
  • Rimuovere il testo dalla forma.
  • Esportare il testo riconosciuto in un formato desiderato.

Guida passo dopo passo

Passo 1: Carica l’immagine del modulo

Il primo passo è quello di caricare il modulo scansionato o fotografato nella tua applicazione. Assicurarsi che la qualità dell’immagine sia abbastanza alta per un trattamento OCR accurato. Image classe per caricare il file immagine.

Passo 2: Configurare le impostazioni OCR

Per ottenere i migliori risultati, è necessario configurare le impostazioni OCR in base alle caratteristiche dei tuoi moduli.Questo include la configurazione del supporto linguistico, l’adeguamento del contrasto e della luminosità, e la specificazione delle regioni di interesse (ROI) per l’estrazione di testo.

// Step 1: Load the form image
string imagePath = "path/to/your/form_image.png";
using (var image = new Aspose.Ocr.Image(imagePath))
{
    // Image is now loaded and ready for OCR processing
}

Passo 3: estrarre il testo dalla forma

Una volta che l’immagine è caricata e le impostazioni sono configurate, è possibile procedere all’estrazione del testo dal modulo. Aspose.OCR fornisce metodi per riconoscere il testo in aree specifiche o in tutta la immagine.

// Step 2: Configure OCR Settings
var ocrEngine = new OcrEngine();
ocrEngine.Settings.Language = RecognitionLanguages.English;
ocrEngine.Settings.ContrastAdjustmentMode = ContrastAdjustmentMode.HighContrast;
ocrEngine.Settings.Brightness = 10;

Passo 4: Esportare il testo riconosciuto

Dopo aver estratto il testo, potrebbe voler esportarlo in un formato adatto per ulteriori elaborazioni, come CSV, JSON o testo piatto. Aspose.OCR supporta diversi formati di uscita, consentendo di adattare i dati alle vostre esigenze.

// Step 3: Extract text from the form
using (var ocrEngine = new OcrEngine())
{
    string extractedText = ocrEngine.RecognizeImage(imagePath);
    Console.WriteLine("Extracted Text:\n" + extractedText);
}

Migliori pratiche

Sviluppo di Real-World Layouts

I moduli del mondo reale hanno spesso layout complessi con fonti e dimensioni diverse.Per affrontare questi problemi in modo efficace, considerare l’utilizzo di funzionalità avanzate come i dizionari personalizzati per la terminologia specializzata o la configurazione di più lingue OCR se il modulo contiene testo in diversi linguaggi.

Opzioni di esportazione

Quando esporta il testo riconosciuto, scegli un formato di uscita che si adatta meglio al tuo flusso di lavoro. Ad esempio, CSV è ideale per i dati tabellari, mentre JSON è migliore per dati strutturati con oggetti nestati.

Seguendo questi passaggi e le migliori pratiche, è possibile automatizzare efficacemente l’ingresso dei dati dai moduli scansionati o fotografati utilizzando Aspose.OCR per .NET. Questo non solo risparmia tempo ma riduce anche il rischio di errori associati all’invio manuale di dati.

More in this category