Точное оптическое распознавание персонажей (OCR) начинается с идеально согласованных изображений. Сканированные или поворотные сканирования могут значительно снизить точность ОКР, делая вручную растягивание скучным и затратным временем заданием — особенно при обработке больших пакетов документов. Для упрощения этого процесса мы можем использовать мощность Aspose.Imaging для .NET для автоматического отключения скандированных картин, прежде чем кормить их в двигатель OCR.
Реальные мировые проблемы
ОКР-двигатели требуют хорошо спланированных изображений для достижения высокой точности в распознавании текста. Крукированные сканирования часто приводят к пропущенным персонажам или ошибкам во время процесса OCR. Ручно стягивание каждого изображения является непрактичным и неэффективным, особенно для больших объемов документов.
Решение обзор
Используя Aspose.Imaging для .NET, мы можем автоматизировать процесс отключения для сканированных изображений. Это обеспечивает то, что все входные изображения полностью согласуются, прежде чем обрабатываются внешним инструментом OCR, таким как Tesseract или ASPOSE.OCR. Изображения будут сохранены в бескрайном формате, таких как PNG или TIFF, чтобы сохранить качество.
Предупреждения
Чтобы начать, вам нужно:
- Visual Studio 2019 или позднее
- .NET 6.0 или более поздний (или .NET Framework 4.6.2+)
- Aspose.Imaging для .NET от NuGet
- Сканированный документ или изобразительный файл (JPEG, PNG, TIFF и т.д.)
Вы можете установить пакет Aspose.Imaging через консоль NuGet Package Manager:
PM> Install-Package Aspose.Imaging
Кодный пример: Автоматизация раскрытия сканированных изображений для
Ниже представлен комплексный пример кода C#, который демонстрирует, как раскрыть сканированные изображения с помощью Aspose.Imaging для .NET.