Оптимізація попереднього обробки зображення є критичним кроком у підвищенні точності систем оптичного розпізнавання персонажів (OCR). У цьому уроці ми розглянемо, як поліпшити ефективність OCR за допомогою Aspose.OCr для .NET шляхом застосування різноманітних методів попередньої оброби. Ці методи включають зниження шуму, корекцію контрасту, стандартизацію яскравості, оштрафування, виявлення і виправлення скеутів, перспективна виправка і бінарність. До кінця цього посібника ви отримаєте всебічне розуміння того, яким чином ефективно переробляти знімки, щоб забезпечити оптимальні результати ОКР.

Повний приклад

Крок 1: Завантажити зображення

Перший крок у попередньому обробці зображення для OCR полягає в тому, щоб завантажити його в вашу програму. Використовуйте Aspose.OCR для читання і переробки знімкового файлу.

Крок 2: Зниження шуму

Звук може значно вплинути на точність ОКР. Використання технологій зменшення шуму, таких як середній фільтр або гаузійський м’ясо для очищення зображення перед подальшою обробкою.

// Step 1: Load the Image
using (var ocrEngine = new AsposeOcr())
{
    var image = new Bitmap("path/to/image.png");
}

Крок 3: Налаштування контрасту та яскравості

Налаштування контрасту і яскравості допомагає зробити текст більш відмінним від фону. Використовуйте методи Aspose.OCR, щоб поліпшити ці властивості зображення.

// Step 2: Apply Noise Reduction using Median Filtering
ocrEngine.PreprocessingFilter.AddMedianFilter();

Крок 4: Знайдіть зображення

Скарпінг може зробити країни персонажів яскравішими, що корисно для двигунів OCR. Нанесіть на вашу зображення фільтр стрижки за допомогою Aspose.OCR.

// Step 3: Adjust Contrast and Brightness
var imageProcessing = new ImageProcessing(ocrEngine);
imageProcessing.SetContrast(20); // Adjust contrast level
imageProcessing.SetBrightness(10); // Adjust brightness level

Крок 5: Визначити і виправити скеу

Використання алгоритмів виявлення і виправлення скеу для того, щоб текст був належним чином збалансований.

// Step 4: Sharpen the Image
using (var image = Aspose.Ocr.ImageProcessing.Image.Load("input.jpg"))
{
    var sharpenFilter = new SharpenFilter();
    sharpenFilter.Apply(image);
    image.Save("sharpened.jpg");
}

Крок 6: Виконання перспективної корекції

Перспективна деформація може призвести до того, що текст виглядає закріпленим або схильним, впливаючи на точність OCR. Використовуйте Aspose.OCR, щоб виправити перспективу зображення.

// Step 5: Detect and Correct Skew
var preprocessingFilter = new PreprocessingFilter(PreprocessingFilterType.SkewCorrection);
ocrEngine.PreprocessingFilters.Add(preprocessingFilter);

Крок 7: Бінарнізуйте зображення

Binarization конвертує зображення в чорно-білий формат, який ідеально підходить для обробки OCR.

Найкращі практики

В кінцевому підсумку, ефективне попереднє обробка зображень є ключовим для досягнення високої точності в завданнях ОКР. Досліджуючи вищезазначені кроки, ви можете значно поліпшити якість ваших вхідних знімків і підвищити продуктивність вашої системи OCR. Пам’ятайте про те, щоб експериментувати з різними методами попереднього обчислення , щоб знайти найкращу комбінацію для вашого конкретного випадку використання.

Деякі додаткові поради:

  • Завжди перевіряйте вашу передобробну трубу на різних типах зображень, щоб забезпечити міцність.
  • Зберігайте спостереження за переробкою, оскільки надмірне стримування або корекція контрасту може ввести артефакти, які можуть збуджувати двигун OCR.
  • Регулярно оновлюйте свою бібліотеку Aspose.OCR, щоб скористатися останніми поліпшеннями та оптимізаціями.

Дотримуючись цих кращих практик, ви будете добре оснащені для вирішення широкого спектру проблем ОКР і надати точні результати у ваших додатках.

More in this category