
Dokumen PDF adalah penting dalam banyak proses perniagaan, sering memerlukan akses programmatik kepada kandungan mereka yang disemak. Mengekstrak teks daripada fail PDF yang dipindai boleh menjadi mencabar, menekankan keperluan untuk alat-alat yang berkesan. Dalam tutorial ini, kami akan meneroka bagaimana untuk OCR dokumen PDF dan mengeluarkan teks dari PDF dalam C# menggunakan yang boleh dipercayai Aspose.OCR untuk .NET API, perpustakaan ekstraksi PDF terkemuka C# OCR boleh didapati untuk penilaian percuma.
Apa yang akan anda pelajari
Dalam artikel ini, kami akan membincangkan topik-topik berikut:
- Gambaran keseluruhan Aspose.OCR untuk .NET API
- Langkah-langkah untuk OCR PDF dan Ekstrak teks
- Bagaimana untuk menjalankan OCR pada PDF dan menyimpan teks
- Menukar OCR PDF kepada Word
- Menukar OCR PDF kepada JSON
Gambaran keseluruhan Aspose.OCR untuk .NET API
Kami akan menggunakan Aspose.OCR untuk .NET API, API OCR yang kukuh .NET PDF ** yang direka untuk mengenal pasti teks daripada imej yang disemak, gambar telefon pintar, dan screenshots, mengembalikan hasil dalam pelbagai format dokumen. API ini bukan sahaja menukar gambar kepada teks tetapi juga mencipta PDF yang boleh dicari daripada pemindaian dan membetulkan sebarang kesilapan penulisan dalam teks yang diiktiraf, menjadikannya salah satu penyelesaian oCR C# PDF ** yang paling cepat tersedia untuk hanya $ 99 .
Kebakaran ini mengandungi AsposeOcr kelas, yang menyediakan pelbagai kaedah untuk operasi OCR. PengenalanPdf(string, DocumentRecognitionSettings) kaedah adalah penting untuk mengekstrak teks daripada dokumen PDF tertentu. DocumentRecognitionSettings kelas membolehkan penyesuaian proses pengiktirafan, manakala RecognitionResult Kelas merangkumi hasil pengiktirafan.
Anda boleh Muat turun DLL daripada API atau meletakkannya melalui NuGet:
PM> Install-Package Aspose.OCR
Langkah-langkah untuk OCR PDF dan Mengekstrak teks dalam C# {# langkah-ke-ocr-pdf-and-extract-text-in-c}
Untuk melaksanakan OCR pada dokumen PDF dan mengekstrak teks yang diiktiraf, ikuti langkah-langkah berikut:
- Mencipta contoh kelas AsposeOcr .
- Memulakan objek dalam kelas DocumentRecognitionSettings .
- Menentukan bahasa untuk OCR.
- Dapatkan **RecognitionResult ** dengan merujuk kepada Pdf() kaedah, melepasi laluan imej dan DocumentRecognitionSettings objek yang
- Berjalan melalui senarai RecognitionResult untuk memaparkan teks yang dikenal pasti.
Berikut ialah contoh yang menggambarkan bagaimana untuk OCR dokumen PDF dan mengekstrak teks yang diiktiraf dalam C# :
OCR PDF dan Mengekstrak teks daripada PDF dalam C#
Bagaimana untuk melaksanakan OCR pada PDF dan menyimpan teks dalam C#
Untuk melaksanakan OCR pada dokumen PDF dan menyimpan teks yang diiktiraf, ikuti langkah-langkah berikut:
- Mencipta contoh kelas AsposeOcr .
- Memulakan objek dalam kelas DocumentRecognitionSettings .
- Menentukan bahasa untuk OCR.
- Panggilan kaedah **RecognizePdf() ** untuk mendapatkan Result Recognition .
- Simpan teks menggunakan kaedah SaveMultipageDocument() , yang memerlukan laluan fail output, SaveFormat, dan yang RecognitionResult objek yang
Berikut ialah contoh yang menunjukkan bagaimana untuk OCR dokumen PDF dan menyimpan teks yang diiktiraf dalam C# :
Melaksanakan OCR pada PDF dan Simpan teks dalam C#
Menukar OCR PDF kepada Word dalam C#
Untuk menukar dokumen PDF yang disemak ke Word, ikuti langkah-langkah yang sama seperti yang dinyatakan sebelum ini, tetapi tentukan SaveFormat.Docx dalam langkah terakhir.
Berikut ialah contoh yang menggambarkan bagaimana untuk OCR PDF dan menyimpan teks yang diiktiraf sebagai dokumen Word dalam C# :
OCR PDF dan Konversi PDF Dipindai ke Word dalam C#
Menukar OCR PDF kepada JSON dalam C#
Untuk menyimpan teks yang diiktiraf daripada dokumen PDF dalam fail JSON, ikuti langkah-langkah terdahulu dengan satu-satunya perubahan yang perlu ditentukan SaveFormat.Json dalam langkah terakhir.
Berikut ialah contoh yang menunjukkan bagaimana untuk OCR PDF dan menyimpan teks yang diiktiraf sebagai fail JSON dalam C# :
Dapatkan lesen penilaian percuma
Anda boleh Dapatkan lesen sementara percuma untuk menilai Aspose.OCR untuk .NET API tanpa sebarang sekatan.
Conclusion
Dalam tutorial ini, kami belajar bagaimana untuk menjalankan OCR pada dokumen PDF dan mengekstrak teks daripada PDF dalam C#. TXT, Perbezaan DOCX, dan JSON Untuk maklumat lanjut mengenai Aspose.OCR untuk .NET API, lihat DokumentasiJika anda mempunyai sebarang soalan, berasa bebas untuk mencapai kami di Forum.
Lihat juga
- Menukar imej skrin kepada teks dengan OCR dalam C#
- OCR Image to Text dan Spelling Correction dalam C#
- Menukar PDF yang disemak ke PDF boleh dicari dengan OCR dalam C#
Dengan menggunakan **Aspose.OCR untuk API .NET ** , anda boleh melaksanakan ketepatan tinggi **PDF OCR ** dalam C# untuk pelbagai aplikasi, termasuk pemprosesan **C# O CR Invoice ** dan pengendalian borang. penyelesaian .NET PDF yang boleh dibayar ** ini sesuai untuk pemaju yang ingin mengintegrasikan OCR PDF keupayaan ke dalam aplikasi mereka dengan cekap.
Selain itu, jika anda perlu **convert PDF ke teks dalam C# ** , API ini menyediakan penyelesaian yang mudah. bagi mereka yang berminat dalam **C# OCR PDF kepada teks ** keupayaan, integrasi adalah tanpa wayar, membolehkan pengekstrakan teks yang cekap dari pelbagai format dokumen. anda juga boleh menggunakan fungsi c# Convert pdf ke Text untuk mudah mengendalikan ekstrak teks daripada PDF, menjadikan proses pembangunan anda lebih lancar.
Jika anda sedang mencari **Aspose OCR C# Contoh ** , panduan ini berkhidmat sebagai sumber yang komprehensif.Selain itu, untuk tugas-tugas yang rumit seperti C# API penggunaan, tutorial ini meliputi semua elemen penting yang diperlukan untuk memulakan secara berkesan.
Bagi mereka yang ingin **menilai SDK PDF dan perisian pemprosesan dokumen syarikat Aspose pada OCR PDFSDK ** , tutorial ini berkhidmat sebagai titik permulaan yang sangat baik untuk memahami keupayaannya. sama ada anda memerlukan **C# CCR DLL ** untuk integrasi atau c# oCR tutorial bagi bimbingan, anda akan mendapati segala-galanya yang anda perlukan untuk menggunakan API secara berkesan dalam projek anda.
Selain itu, jika anda ingin memanfaatkan pengiktirafan teks C# atau menggunakan perpustakaan OCR ** untuk pelbagai aplikasi, anda boleh meneroka ciri-ciri yang ditawarkan oleh Aspose untuk menyokong fungsi-fungsi ini. penilaian SDK PDF merupakan peluang yang sangat baik untuk bereksperimen dengan keupayaan perpustusannya ini, memastikan anda mencari penyelesaian yang betul untuk keperluan oCR anda.
Akhirnya, jika anda perlu **mengekstrak teks daripada PDF dalam C# ** , atau menggunakan **OCR API C # ** , ciri-ciri C# OCR PDF yang tersedia akan mempercepatkan proses pembangunan anda dan meningkatkan fungsi aplikasi anda.