Екстрактирање табела из слика може бити изазов задатак, али са Асписе.ОЦР за .НЕТ, постаје много више управљајуће. Ова моћна библиотека омогућава програмерима да аутоматизују процес конверзије слика са садржајем табларних података у структурирани формати као што су Еццел, ЦСВ, или равни текст.

Потпуни пример

Да бисте почели, мораћете да имате Aspose.OCR за .NET инсталиран у вашем пројекту.Када је то учињено, можете пратити кораке испод да извучете табеле из слике и извозе их у жељени формат.

Корак 1: Иницијализација ОЦР мотора

Пре него што почнете да екстрактирате табеле, морате иницијализовати ОЦР мотор са неопходним конфигурацијама. ово укључује постављање језика препознавања и било које друге специфичне подешавања потребне за ваш случај коришћења.

Корак 2: Преузмите слику

Преузмите слику која садржи табеле податке у ОЦР мотор. Уверите се да је слика јасна и текст у њој је читав како би се осигурало тачно извлачење.

// Step 1: Initialize the OCR Engine
using (AsposeOcr ocrEngine = new AsposeOcr())
{
    // Set recognition language and other configurations as needed
    ocrEngine.Language = RecognitionLanguages.English;
}

Корак 3: Конфигуришите подешавања распознавања табеле

Ово укључује подешавање параметара као што су откривање ћелија, линија откривања, и друге напредне опције за фино-тонирање процеса екстракције.

// Step 2: Load the Image
using (var imageStream = new FileStream("table_image.png", FileMode.Open, FileAccess.Read))
{
    var image = new OcrInputStream(imageStream);
}

Корак 4: Покрените процес екстракције

Са свим конфигурацијама постављеним, сада можете да покренете процес екстракције табеле.Асписе.ОЦР ће анализирати слику и извући табуларне податке у структурирани формат.

// Step 3: Configure Table Recognition Settings
ocrEngine.TableRecognitionSettings = new TableRecognitionSettings
{
    CellDetection = true,
    LineDetection = true,
    AdvancedOptions = new AdvancedTableRecognitionOptions { MinCellWidth = 50, MinCellHeight = 20 }
};

Корак 5: Експортирање података

На крају, извозите извучене податке у ваш омиљени формат као што су Екцел, ЦСВ, или равни текст. Овај корак укључује складиштење података у датотеку или директно манипулисање унутар апликације.

// Step 4: Run the Extraction Process
var extractionResult = ocrEngine.RecognizeTable("path/to/image.png");
Console.WriteLine("Table extracted successfully!");

Најбоља пракса

Када радите са Aspose.OCR за .NET да бисте извукли табеле из слика, постоји неколико најбољих пракси које треба размотрити:

  • Осигуравање квалитета слике: Квалитет улазног слика је од суштинског значаја за тачну екстракцију табела.
  • Fine-Tune Settings: Експеримент са различитим подешавањама за оптимизацију процеса екстракције. прилагођавање параметара као што је осетљивост откривања ћелија може значајно побољшати резултате.
  • Развој грешака: Увођење снажног управљања грешкама за управљање случајевима у којима се ОЦР мотор може борити са сложеним или ниским квалитетом слика.

Закључак

Следећи ове упутства, можете ефикасно користити Aspose.OCR за .NET да бисте аутоматизовали процес извлачења табела из слика и конвертирали их у структуриране формати података.

More in this category