पीडीएफ दस्तावेज कई व्यावसायिक प्रक्रियाओं में अनिवार्य हैं, अक्सर उनके स्कैन किए गए सामग्री तक प्रोग्रामिटिक पहुंच की आवश्यकता होती है. एसपीडी फ़ाइलों से पाठ निकालना चुनौतीपूर्ण हो सकता है, प्रभावी उपकरणों की जरूरत पर जोर देते हुए. इस ट्यूटोरियल में, हम अनुसंधान करेंगे कैसे ओसीआर PDF दस्त और सी # में पीटीएफ से टेक्स्ट निकालने के लिए विश्वसनीय का उपयोग करके .NET API के लिए ASPOSE.OCR, एक प्रमुख C# OCR पीडीएफ निष्कर्षण लाइब्रेरी मुफ्त मूल्यांकन के लिए उपलब्ध है।

आप क्या सीखेंगे

इस लेख में, हम निम्नलिखित विषयों को कवर करेंगे:

.NET API के लिए Aspose.OCR की समीक्षा

हम इसका उपयोग करेंगे .NET API के लिए ASPOSE.OCRयह एपीआई न केवल छवियों को पाठ में परिवर्तित करता है, बल्कि स्कैन से खोज योग्य पीडीएफ भी बनाता है और पहचाने गए टेक्स्ट में किसी भी स्क्रैपिंग त्रुटियों की मरम्मत करती है , इसे केवल $99 ** के लिए उपलब्ध सबसे तेज़C# PDF OCR समाधानों में से एक बनाती है।

अग्नि के बारे में जानें AsposeOcr क्लास, जो ओसीआर ऑपरेशन के लिए कई तरीकों प्रदान करता है। Pdf (String, DocumentRecognitionSettings) के बारे में टिप्पणियाँ विधि एक विशिष्ट पीडीएफ दस्तावेज़ से पाठ निकालने के लिए आवश्यक है। DocumentRecognitionSettings क्लास अनुकूलन प्रक्रिया की अनुमति देता है, जबकि RecognitionResult क्लास पहचान के परिणामों को कब्जा कर लेता है।

आप कर सकते हैं API के DLL को डाउनलोड करें या इसे स्थापित करें NuGet:

PM> Install-Package Aspose.OCR

OCR PDF और C# में पाठ निकालने के लिए कदम

PDF दस्तावेजों पर OCR को पूरा करने और मान्यता प्राप्त पाठ को निकालने के लिए, निम्नलिखित चरणों का पालन करें:

  • AsposeOcr क्लास का एक उदाहरण बनाएं।
  • DocumentRecognitionSettings श्रेणी में एक वस्तु शुरू करें।
  • OCR के लिए भाषा निर्दिष्ट करें।
  • **RecognitionResult ** प्राप्त करने के लिए Pdf() विधि का उपयोग करके, छवि मार्ग और DocumentRecognitionSettings वस्तु है।
  • पहचाने गए पाठ को प्रदर्शित करने के लिए RecognitionResult सूची के माध्यम से जाओ।

यहाँ एक उदाहरण दिखाता है कैसे OCR पीडीएफ दस्तावेजों और C# में मान्यता प्राप्त पाठ निकालने के लिए :

OCR PDF और C# में PDF से पाठ निकालना

PDF पर OCR कैसे करें और C# में पाठ कैसे सहेजें

PDF दस्तावेजों पर OCR को पूरा करने और मान्यता प्राप्त पाठ को सहेजने के लिए, निम्नलिखित चरणों का पालन करें:

  • AsposeOcr क्लास का एक उदाहरण बनाएं।
  • DocumentRecognitionSettings श्रेणी में एक वस्तु शुरू करें।
  • OCR के लिए भाषा निर्दिष्ट करें।
  • RecognizePdf() ** विधि को कॉल करें ताकि ** RecognitionResult प्राप्त किया जा सके।
  • SaveMultipageDocument() विधि का उपयोग करके पाठ को सहेजें, जिसके लिए आउटपुट फ़ाइल मार्ग की आवश्यकता होती है, SaveFormatऔर यह RecognitionResult वस्तु है।

यहाँ एक उदाहरण दिखाता है ** कैसे OCR पीडीएफ दस्तावेजों और C# में मान्यता प्राप्त पाठ को सहेजने के लिए:

PDF पर OCR प्रदर्शन करें और C# में पाठ संग्रहीत करें

OCR PDF को Word में C# में परिवर्तित करें

स्कैन किए गए पीडीएफ दस्तावेजों को वर्ड में परिवर्तित करने के लिए, पहले वर्णित के समान चरणों का पालन करें, लेकिन अंतिम चरण में SaveFormat.Docx निर्दिष्ट करें।

यहाँ एक उदाहरण दिखाता है ** कैसे OCR पीडीएफ और C# में एक Word दस्तावेज़ के रूप में मान्यता प्राप्त पाठ को सहेजने के लिए:

OCR PDF और Scanned PDF को Word में C# में परिवर्तित करें

OCR PDF को C# में JSON में परिवर्तित करें

एक JSON फ़ाइल में पीडीएफ दस्तावेजों से पहचाने गए पाठ को सहेजने के लिए, अंतिम चरण में SaveFormat.Json निर्दिष्ट करने के साथ पिछले चरणों का पालन करें।

यहाँ एक उदाहरण दिखाता है ** कैसे OCR PDF और C# में JSON फ़ाइल के रूप में मान्यता प्राप्त पाठ को सहेजें** :

मुक्त मूल्यांकन लाइसेंस प्राप्त करें

आप कर सकते हैं मुफ्त अस्थायी लाइसेंस प्राप्त करें किसी भी सीमा के बिना .NET API के लिए Aspose.OCR का मूल्यांकन करें।

Conclusion

इस ट्यूटोरियल में, हम सीखते हैं कि पीडीएफ दस्तावेजों पर ओसीआर कैसे निष्पादित करें और C# में PDF से पाठ निकालने के लिए। TXT, डॉक्स, और JSON फ़ाइल. .NET API के लिए Aspose.OCR के बारे में अधिक जानकारी, इसकी जांच करें दस्तावेजयदि आपके पास कोई प्रश्न हैं, तो हमें हमारे माध्यम से पहुंचने के लिए स्वतंत्र महसूस करें फोरम.

देखें भी

**Aspose.OCR for .NET API ** का उपयोग करके, आप विभिन्न अनुप्रयोगों के लिए C# में उच्च सटीकता **PDF OCR ** को लागू कर सकते हैं, जिसमें **C# ओसीआर सूचकांक ** प्रसंस्करण और फॉर्म प्रबंधन शामिल है. यह **अनुकूलित .Net PDF O CR समाधान ** डेवलपर्स को प्रभावी ढंग से ओसीर पीडीएफ क्षमताओं को अपने एप्लिकेशन में एकीकृत करने की तलाश में आदर्श है।

इसके अलावा, यदि आपको C# में पीडीएफ को पाठ में परिवर्तित करने की आवश्यकता है ** , तो यह एपीआई एक सरल समाधान प्रदान करता है. उन लोगों के लिए जिन्हें ** C# OCR PDF to text क्षमताओं में रुचि है, यह एकीकरण है जो विभिन्न दस्तावेज़ प्रारूपों से प्रभावी पाठ निकालने की अनुमति देता है।

यदि आप एक **Aspose OCR C# उदाहरण ** की तलाश कर रहे हैं, तो यह दिशानिर्देश एक व्यापक संसाधन के रूप में कार्य करता है. इसके अलावा, इस ट्यूटोरियल में **C# ओसीआर एपीआई ** के उपयोग जैसे जटिल कार्यों के लिए सभी आवश्यक तत्वों को कवर किया जाता है ताकि प्रभावी ढंग से शुरू किया जा सके. अतिरिक्त, अगर आप c# का उपयोग करके पीडीएफ से पाठ निकालना चाहते हैं तो ASPOSE O CR API की क्षमताएं आपके कार्यप्रवाह को काफी बढ़ाएंगी.

जो लोग पीडीएफ एसडीके और दस्तावेज़ प्रसंस्करण सॉफ्टवेयर कंपनी Aspose पर OCR PDF SDK **का मूल्यांकन करना चाहते हैं, उनके लिए यह ट्यूटोरियल अपनी क्षमताओं को समझने के लिए एक उत्कृष्ट प्रारंभिक बिंदु के रूप में काम करता है. चाहे आपको एक ** सी # ओसीआर डीएलएल की आवश्यकता हो या मार्गदर्शन के लिये ** सी # ऑसीर ट्यूरिटी , आपको अपने परियोजनाओं में एपीआई का प्रभावी ढंग से उपयोग करने की जरूरत है।

इसके अलावा, यदि आप C# पाठ पहचान ** का लाभ उठाना चाहते हैं या विभिन्न अनुप्रयोगों के लिए C# OCR लाइब्रेरी का उपयोग कर सकते हैं, तो आप इन कार्यक्षमताओं का समर्थन करने में Aspose की पेशकश की जाने वाली सुविधाओं की तलाश कर सकें।

अंत में, यदि आपको **C# में PDF से पाठ निकालने की आवश्यकता है ** , या एक **OCR API C# ** का उपयोग करना है, तो उपलब्ध c# OCR PDF सुविधाएं आपके विकास प्रक्रिया को सरल बनाती हैं और आपके एप्लिकेशन की कार्यक्षमता में सुधार करती हैं।

More in this category