Точне оптичне розпізнавання персонажів (OCR) починається з ідеально узгоджених зображень. Скріплені або обертані скани можуть значно знизити точність ОКР, роблячи ручне витягування сміливим і тривожним завданням – особливо при вирішенні великих пакетів документів. Для того, щоб ускладнити цей процес, ми можемо скористатися потужністю Aspose.Imaging для .NET для автоматичного розкидання сканованих картин, перш ніж годувати їх в двигун OCR.

Реальні проблеми світу

Двигуни OCR вимагають добре узгоджених зображень, щоб досягти високої точності в розпізнанні тексту. Крукісні скани часто призводять до пропущених персонажів або помилок під час процесу ОCR. Ручно витягувати кожну картину непрактично і неефективно, особливо для великих обсягів документів.

Огляд рішення

Використовуючи Aspose.Imaging для .NET, ми можемо автоматизувати процес відключення для сканованих зображень.Це гарантує, що всі вхідні знімки ідеально збігаються, перш ніж будуть оброблені зовнішнім інструментом OCR, таким як Tesseract або ASPOSE.OCR.

Передумови

Щоб почати, вам потрібно:

  • Visual Studio 2019 або вище
  • .NET 6.0 або вище (або .NET Framework 4.6.2+)
  • Aspose.Imaging для .NET від NuGet
  • Сканований документ або файл зображення (JPEG, PNG, TIFF і т.д.)

Ви можете встановити пакет Aspose.Imaging за допомогою консолі NuGet Package Manager:

PM> Install-Package Aspose.Imaging

Код Приклад: Автоматизація відключення сканованих зображень для

Нижче наведено всеосяжний приклад коду C#, який показує, як відключити скановані зображення за допомогою Aspose.Imaging для .NET.

More in this category