
PDF belgeleri, çeşitli iş süreçlerinin ayrılmaz bir parçasıdır ve genellikle taranmış içeriklerine programatik erişim gerektirir. Taranmış PDF dosyalarından metin çıkarmak karmaşık bir görev olabilir ve etkili araçlara olan ihtiyacı vurgular. Bu öğreticide, güvenilir Aspose.OCR for .NET API kullanarak PDF belgelerini nasıl OCR yapacağımızı ve C#’ta PDF’den metin çıkaracağımızı inceleyeceğiz; bu, ücretsiz değerlendirme için mevcut olan önde gelen C# OCR PDF çıkarım kütüphanesidir.
Öğrenecekleriniz
Bu makalede aşağıdaki konuları ele alacağız:
- Aspose.OCR for .NET API Genel Görünümü
- PDF’yi OCR Yapma ve Metin Çıkarma Adımları
- PDF Üzerinde OCR Nasıl Yapılır ve Metin Nasıl Kaydedilir
- OCR PDF’yi Word’e Dönüştürme
- OCR PDF’yi JSON’a Dönüştürme
Aspose.OCR for .NET API Genel Görünümü
Taranmış görüntülerden, akıllı telefon fotoğraflarından ve ekran görüntülerinden metin tanımak için tasarlanmış sağlam bir .NET PDF OCR API olan Aspose.OCR for .NET API kullanacağız; sonuçları çeşitli belge formatlarında döndürmektedir. Bu API, görüntüleri metne dönüştürmekle kalmaz, aynı zamanda taramalardan arama yapılabilir PDF’ler oluşturur ve tanınan metindeki yazım hatalarını düzeltir, böylece sadece $99 karşılığında mevcut olan en hızlı C# PDF OCR çözümlerinden biri haline gelir.
API, OCR işlemleri için birden fazla yöntem sunan AsposeOcr sınıfını içerir. Özellikle, belirli bir PDF belgesinden metin çıkarmak için gerekli olan RecognizePdf(string, DocumentRecognitionSettings) yöntemi bulunmaktadır. DocumentRecognitionSettings sınıfı tanıma sürecinin özelleştirilmesine olanak tanırken, RecognitionResult sınıfı tanıma sonuçlarını kapsüller.
API’nin DLL’sini indirebilirsiniz veya NuGet üzerinden yükleyebilirsiniz:
PM> Install-Package Aspose.OCR
PDF’yi OCR Yapma ve Metin Çıkarma Adımları C#
PDF belgeleri üzerinde OCR yapmak ve tanınan metni çıkarmak için şu adımları izleyin:
- AsposeOcr sınıfının bir örneğini oluşturun.
- DocumentRecognitionSettings sınıfının bir nesnesini başlatın.
- OCR için dili belirtin.
- RecognizePdf() yöntemini çağırarak RecognitionResult‘ı elde edin, görüntü yolunu ve DocumentRecognitionSettings nesnesini geçin.
- Tanımlanan metni görüntülemek için RecognitionResult listesini döngüye alın.
C#’ta PDF belgelerini nasıl OCR yapacağınızı ve tanınan metni çıkaracağınızı gösteren bir örnek:
PDF Üzerinde OCR Nasıl Yapılır ve Metin Nasıl Kaydedilir C#
PDF belgeleri üzerinde OCR yapmak ve tanınan metni kaydetmek için şu adımları izleyin:
- AsposeOcr sınıfının bir örneğini oluşturun.
- DocumentRecognitionSettings sınıfının bir nesnesini başlatın.
- OCR için dili belirtin.
- RecognitionResult‘ı almak için RecognizePdf() yöntemini çağırın.
- Çıktı dosyası yolunu, SaveFormat‘ı ve RecognitionResult nesnesini gerektiren SaveMultipageDocument() yöntemini kullanarak metni kaydedin.
C#’ta PDF belgelerini nasıl OCR yapacağınızı ve tanınan metni kaydedeceğinizi gösteren bir örnek:
OCR PDF’yi Word’e Dönüştürme C#
Taranmış PDF belgelerini Word’e dönüştürmek için daha önce belirtilen adımları izleyin, ancak son adımda SaveFormat.Docx belirtin.
C#’ta OCR yaparak tanınan metni Word belgesi olarak nasıl kaydedeceğinizi gösteren bir örnek:
OCR PDF’yi JSON’a Dönüştürme C#
PDF belgelerinden tanınan metni bir JSON dosyasında kaydetmek için önceki adımları izleyin, tek değişiklik son adımda SaveFormat.Json belirtmek olacaktır.
C#’ta OCR yaparak tanınan metni JSON dosyası olarak nasıl kaydedeceğinizi gösteren bir örnek:
Ücretsiz Değerlendirme Lisansı Alın
Aspose.OCR for .NET API’yi sınırlama olmaksızın değerlendirmek için ücretsiz geçici bir lisans alabilirsiniz.
Sonuç
Bu öğreticide, PDF belgeleri üzerinde OCR yapmayı ve C#’ta PDF’den metin çıkarmayı öğrendik. Ayrıca tanınan metni TXT, DOCX ve JSON dosyası olarak nasıl kaydedeceğimizi inceledik. Aspose.OCR for .NET API hakkında daha fazla bilgi için belgelere göz atın. Herhangi bir sorunuz varsa, lütfen forumumuza ulaşmaktan çekinmeyin.
Ayrıca Bakınız
- C#’ta Ekran Görüntüsünü Metne Dönüştürme
- C#’ta Görüntüyü Metne Dönüştürme ve Yazım Düzeltme
- C#’ta Taranmış PDF’yi Aranabilir PDF’ye Dönüştürme
Aspose.OCR for .NET API‘yi kullanarak, fatura işleme ve form yönetimi gibi çeşitli uygulamalar için C#’ta yüksek doğrulukta PDF OCR uygulayabilirsiniz. Bu uygun fiyatlı .NET PDF OCR çözümü, uygulamalarınıza OCR PDF yeteneklerini etkin bir şekilde entegre etmek isteyen geliştiriciler için idealdir.