Tabloları görüntülerden çıkarmak zor bir görev olabilir, ancak .NET için Aspose.OCR ile çok daha yönetilebilir hale gelir. Bu güçlü kütüphane geliştiricilerin tablo verileri içeren görüntüleri Excel, CSV veya düz metin gibi yapılandırılmış biçimlere dönüştürme sürecini otomatikleştirmelerini sağlar.

Tam örnek

Başlamak için, projenizde .NET için Aspose.OCR yüklemeniz gerekecektir. tamamlandıktan sonra, bir görüntüden tabloları çıkarmak ve istenen biçime ihraç etmek için aşağıdaki adımları takip edebilirsiniz.

Adım 1: OCR motoru başlatın

Tabloları çıkarmaya başlamadan önce, gerekli konfigürasyonlarla OCR motorunu başlatmanız gerekir.Bu, kullanım durumunuz için gerekli olan tanıma dilini ve diğer özel ayarları ayarlar.

Adım 2: Görüntüyü yükleme

Tablo verilerini içeren görüntüyü OCR motoruna yükleyin. görüntü açık olduğundan ve içindeki metin doğru çıkarılmasını sağlamak için okunabilir olmasından emin olun.

// Step 1: Initialize the OCR Engine
using (AsposeOcr ocrEngine = new AsposeOcr())
{
    // Set recognition language and other configurations as needed
    ocrEngine.Language = RecognitionLanguages.English;
}

Adım 3: Tablo Tanıma Ayarları ayarlayın

Bu, hücre tespiti, çizgi tespit ve diğer gelişmiş seçenekler gibi parametrelerin ayarlanmasını içerir çıkarma sürecini düzeltmek için.

// Step 2: Load the Image
using (var imageStream = new FileStream("table_image.png", FileMode.Open, FileAccess.Read))
{
    var image = new OcrInputStream(imageStream);
}

Adım 4: Ekstraksiyon süreci çalıştırın

Tüm konfigürasyonlar ile, şimdi tablo çıkarma işlemi çalıştırabilirsiniz. Aspose.OCR görüntüyü analiz eder ve tabul verilerini yapılandırılmış bir biçimde çıkarır.

// Step 3: Configure Table Recognition Settings
ocrEngine.TableRecognitionSettings = new TableRecognitionSettings
{
    CellDetection = true,
    LineDetection = true,
    AdvancedOptions = new AdvancedTableRecognitionOptions { MinCellWidth = 50, MinCellHeight = 20 }
};

Adım 5: Bilgilerinizi çıkarın

Son olarak, elde edilen verileri Excel, CSV veya düz metin gibi tercih ettiğiniz biçime ihraç edin. bu adım, bir dosyaya veri kaydetmeyi veya doğrudan uygulamanızda manipüle etmeyi içerir.

// Step 4: Run the Extraction Process
var extractionResult = ocrEngine.RecognizeTable("path/to/image.png");
Console.WriteLine("Table extracted successfully!");

En İyi Uygulamalar

Görüntülerden tabloları çıkarmak için .NET için Aspose.OCR ile çalışırken, dikkate alınması gereken birkaç en iyi uygulama vardır:

  • Görüntü kalitesini sağlamak: Giriş görüntüsünün kalitesi doğru tablo çıkarımı için çok önemlidir. görüntüdeki metin açık ve iyi tanımlanmış olduğundan emin olun.
  • Fine-Tune Settings: Ekstraksiyon sürecini optimize etmek için farklı ayarlarla deneyin. hücre algılama hassasiyeti gibi parametreleri ayarlar, sonuçları önemli ölçüde geliştirebilir.
  • Error Handling: OCR motorunun karmaşık veya düşük kaliteli görüntülerle mücadele edebileceği durumları yönetmek için sağlam bir hata işleme uygulanır.

Sonuç

Bu yönergelere uymak, tabloların görüntülerden çıkarılması ve yapılandırılmış veri biçimlerine dönüştürülmesi sürecini otomatikleştirmek için .NET için Aspose.OCR’yi etkili bir şekilde kullanabilirsiniz.

More in this category