
Dokumen PDF sangat penting dalam banyak proses bisnis, seringkali membutuhkan akses programmatik ke konten yang dipindai mereka. Mengekstrak teks dari file PDF yang disemai dapat menjadi tantangan, menekankan kebutuhan untuk alat yang efektif. Dalam tutorial ini, kami akan mengeksplorasi bagaimana untuk OCR dokumen PDF dan mengekstra tekst dari PDF dalam C# menggunakan yang dapat diandalkan Aspose.OCR untuk .NET API, perpustakaan ekstraksi PDF terkemuka C# OCR tersedia untuk penilaian gratis.
Apa yang akan Anda pelajari
Dalam artikel ini, kami akan membahas topik-topik berikut:
- Spesifikasi Aspose.OCR untuk .NET API
- Langkah ke OCR PDF dan Ekstrak Teks
- Bagaimana untuk melakukan OCR pada PDF dan menyimpan teks
- Konversi OCR PDF ke Word
- Konversi OCR PDF ke JSON
Aspose.OCR untuk .NET API
Kami akan menggunakan Aspose.OCR untuk .NET API, .
Api ini memiliki Asperger Kelas, yang menyediakan beberapa metode untuk operasi OCR Mengidentifikasi PDF (string, DocumentRecognitionSettings) metode adalah penting untuk mengekstrak teks dari dokumen PDF tertentu Pengenalan Dokumen kelas memungkinkan penyesuaian proses pengenalan, sementara Pengakuan Hasil Kelas menggambarkan hasil pengakuan.
Anda bisa Download DLL dari API atau instalasi melalui NUGET:
PM> Install-Package Aspose.OCR
Langkah ke OCR PDF dan Ekstrak teks dalam C# {# langkah-ke-ocr-pdf-and-ekstrak teks-in-c}
Untuk melakukan OCR pada dokumen PDF dan mengekstrak teks yang diakui, ikuti langkah-langkah berikut:
- Buat contoh dari kelas AsposeOcr.
- Initifikasi objek dari kelas DocumentRecognitionSettings.
- Menentukan bahasa untuk OCR.
- Dapatkan RecognitionResult dengan memanggil metode Pdf(), melewati jalur gambar dan Pengenalan Dokumen dengan objek.
- Pergi melalui daftar RecognitionResult untuk menampilkan teks yang diidentifikasi.
Berikut adalah contoh yang menggambarkan bagaimana untuk OCR PDF dokumen dan mengekstrak teks yang diakui dalam C#:
OCR PDF dan Ekstrak Teks dari PDF dalam C#
Bagaimana untuk melakukan OCR pada PDF dan menyimpan teks dalam C#
Untuk melakukan OCR pada dokumen PDF dan menyimpan teks yang diakui, ikuti langkah-langkah berikut:
- Buat contoh dari kelas AsposeOcr.
- Initifikasi objek dari kelas DocumentRecognitionSettings.
- Menentukan bahasa untuk OCR.
- Hubungi RecognizePdf() untuk mendapatkan RecognitionResult.
- Simpan teks menggunakan metode SaveMultipageDocument(), yang membutuhkan jalur file output Penyimpanan, dan yang Pengakuan Hasil dengan objek.
Berikut adalah contoh yang menunjukkan bagaimana untuk OCR PDF dokumen dan menyimpan teks yang diakui dalam C#:
Melakukan OCR pada PDF dan Simpan teks dalam C#
Konversi OCR PDF ke Word dalam C#
Untuk mengkonversi dokumen PDF yang dipindai ke Word, ikuti langkah yang sama seperti yang dinyatakan sebelumnya, tetapi tentukan SaveFormat.Docx dalam langkah terakhir.
Berikut adalah contoh yang menggambarkan bagaimana untuk OCR PDF dan menyimpan teks yang diakui sebagai dokumen Word dalam C#:
OCR PDF dan Konversi Scanned PDF ke Word dalam C#
Konversi OCR PDF ke JSON dalam C#
Untuk menyimpan teks yang diakui dari dokumen PDF dalam file JSON, ikuti langkah-langkah sebelumnya dengan satu-satunya perubahan adalah untuk menentukan SaveFormat.Json dalam langkah terakhir.
Berikut adalah contoh yang menunjukkan bagaimana untuk OCR PDF dan menyimpan teks yang diakui sebagai file JSON dalam C#:
Dapatkan Lisensi Penilaian Gratis
Anda bisa Dapatkan lisensi sementara gratis untuk menilai Aspose.OCR untuk .NET API tanpa batasan apa pun.
Kesimpulan
Dalam tutorial ini, kami belajar bagaimana melakukan OCR pada dokumen PDF dan mengekstrak teks dari PDF dalam C TXT, DOKX, dan JSON Untuk informasi lebih lanjut tentang Aspose.OCR untuk .NET API, periksa Dokumentasi. Jika Anda memiliki pertanyaan, berasa bebas untuk menghubungi kami di Forum.
Lihat juga
- Mengkonversi screenshot ke teks dengan OCR dalam C#
- OCR Image to Text dan Spelling Correction dalam C#
- Konversi PDF Scanned ke PDF yang dapat dicari dengan OCR dalam C#
Dengan menggunakan Aspose.OCR untuk .NET API, Anda dapat menerapkan ketepatan tinggi PDF OCR dalam C# untuk berbagai aplikasi, termasuk pemrosesan dan pengendalian formulir C# OCCR Invoice. Penyelesaian OECD PDF ini sangat cocok bagi para pengembang yang ingin mengintegrasikan kapasitas OCR PDF ke dalam aplikasi mereka dengan efisien.
Selain itu, jika Anda perlu convert PDF to text in C#, API ini menyediakan solusi yang mudah.Untuk mereka yang tertarik dengan C# OCR PDF ke text kemampuan, integrasi tidak dapat dipungkiri, memungkinkan ekstraksi teks yang efisien dari berbagai format dokumen.Anda juga dapat menggunakan fungsi c# Convert pdf to Text untuk mudah menangani ekstrak teks dari PDF, membuat proses pengembangan Anda lebih lancar.
Jika Anda sedang mencari Aspose OCR C# Example, panduan ini berfungsi sebagai sumber daya yang komprehensif.Selain itu, untuk tugas-tugas yang rumit seperti C# API penggunaan, tutorial ini mencakup semua elemen penting yang diperlukan untuk memulai secara efektif.
Bagi mereka yang ingin menilai SDK PDF dan perusahaan perangkat lunak pemprosesan dokumen Aspose pada OCR PDFSDK, tutorial ini berfungsi sebagai titik permulaan yang sangat baik untuk memahami kemampuan. apakah Anda membutuhkan C# O CR DLL untuk integrasi atau ** C# oCR tutorial** for guidance, Anda akan menemukan semua yang Anda butuhkan untuk menggunakan API secara efektif dalam proyek Anda.
Selain itu, jika Anda ingin memanfaatkan pengenalan teks C# atau menggunakan perpustakaan OCR untuk berbagai aplikasi, Anda dapat mengeksplorasi fitur yang ditawarkan oleh Aspose untuk mendukung fitur-fitur ini. penilaian SDK PDF adalah kesempatan yang sangat baik untuk bereksperimen dengan keupayaan library ini, memastikan Anda menemukan solusi yang tepat untuk kebutuhan oCR Anda.
Akhirnya, jika Anda perlu mengekstrak teks dari PDF dalam C#, atau menggunakan OCR API C # , fitur-fitur C# OCR PDF yang tersedia akan mempercepat proses pengembangan Anda dan meningkatkan fungsi aplikasi Anda. Anda juga dapat menggunakan Perpustakaan OCR untuk berbagai tugas OECD, termasuk Kenalpasti Teks dari Image dan **Sample **implementasi untuk meningkatkan proyek Anda lebih lanjut.