पीडीएफ फ़ाइलें लोकप्रिय हैं क्योंकि वे पाठ, छवियों, एनीमेशन, वीडियो, और विभिन्न नोटों का समर्थन करते हैं. हालांकि, कई दस्तावेजों के लिए, पाठ सबसे महत्वपूर्ण हिस्सा है. इस लेख में यह समझाया गया है कि कैसे पीडीएफ फाइलों को टीएचटी फाइलें में परिवर्तित करें और, इसके विपरीत, सी # .NET का उपयोग करके पीडिएफ में टीएसटी फाइनलों. यह रूपांतरण विशेष रूप से उपयोगी है जब आपको निकालने की जरूरत है या केवल एक पीपीडी दस्त की पाठ सामग्री पर ध्यान केंद्रित करने की आवश्यकता है, जैसे कि पाठ विश्लेषण करने या सुधार के लिये सामग्री तैयार करने के दौरान.

इस गाइड में कवर किए गए विषयों में शामिल हैं:

** टिप:** आप मुफ्त में भी रुचि रख सकते हैं GIF Converter के बारे में जानकारी जो आपको पाठ से एनिमेटेड जीआईएफ उत्पन्न करने की अनुमति देता है।

C# TXT to PDF या PDF to TXT Converter

PDF और TXT प्रारूपों के बीच रूपांतरण तब आवश्यक है जब आपका मुख्य रुचि एक दस्तावेज़ के भीतर पाठ डेटा में है. चाहे आपको सरल पाठ विश्लेषण के लिए सभी स्वरूपण को हटाने की आवश्यकता हो या कुछ संरचित लेआउट को बनाए रखना, प्रक्रिया को कुछ साधारण चरणों का उपयोग करके पूरा किया जा सकता है .NET के लिए Aspose.PDF यह एपीआई बहुमुखी है और C# और VB.NET दोनों का समर्थन करता है, जिससे यह आपके .NET अनुप्रयोगों में एकीकृत करना आसान बनाता है।

अपने एप्लिकेशन में एपीआई स्थापित करने के लिए, आप या तो DLL फ़ाइलों को डाउनलोड कर सकते हैं Downloads या इसका उपयोग करें NuGet उदाहरण के लिए, इसे पैकेज मैनेजर कंसोल के माध्यम से स्थापित करें:

PM> Install-Package Aspose.PDF

एक बार एपीआई स्थापित किया गया है, आप विभिन्न आवश्यकताओं के लिए अनुकूलित कई दृष्टिकोणों के साथ रूपांतरण प्रक्रिया शुरू कर सकते हैं।

C# प्रारूपण के बिना PDF को TXT में परिवर्तित करें

कभी-कभी, आपको केवल एक पीडीएफ दस्तावेज़ से कच्चे पाठ की आवश्यकता होती है बिना किसी अतिरिक्त प्रारूपण के. यह विधि पाठ को ठीक उसी तरह निकालती है जैसा कि यह दस्त में दिखाई देता है, बिना फ़ॉन्ट्स, स्पेसिंग, या शैलियों को बनाए रखने के। यह विशेष रूप से पाठ विश्लेषण, खोज इंडेक्सिंग या जब लेआउट अप्रासंगिक है तो उपयोगी है.

Raw Text Extraction के लिए कदम

  • ** इनपुट पीडीएफ दस्तावेज़ डाउनलोड करें:** PDF फ़ाइल को एक दस्तावेज़ वस्तु में लोड करने के लिए एपीआई का उपयोग करें।

  • ** एक StringBuilder शुरू करें:** एक उदाहरण बनाने के लिए StringBuilder पाठ डेटा को प्रभावी ढंग से जमा करने के लिए क्लास।

  • ** प्रत्येक पीडीएफ पृष्ठ के माध्यम से इट्रेट करें:** दस्तावेज़ में सभी पृष्ठों के माध्यम से चलता है. प्रत्येक पृष्ठ के लिए:

  • Use TextDevice पाठ निकालने के लिए।

  • रोजगार के लिए राउंड मोड यह सुनिश्चित करने के लिए कि प्रारूप का उपयोग नहीं किया जाता है।

  • आउटपुट पाठ को सहेजें: एक TXT फ़ाइल में एकत्रित पाठ लिखें।

नीचे दिए गए कोड स्नैपेट में दिखाया गया है कि रॉय निकालने के तरीके का उपयोग करके PDF को एक TXT फ़ाइल में कैसे परिवर्तित किया जाए:

अतिरिक्त जानकारी

  • ** प्रदर्शन और सरलता:** कच्चे पाठ निकालना आमतौर पर तेजी से होता है क्योंकि यह किसी भी प्रारूपण नियम को पार करने या लागू करने की कोशिश नहीं करता है।
  • उपयोग के मामले: लॉग निकालने, खोज सूचकांक, या परिदृश्य के लिए आदर्श जहां केवल पाठ सामग्री की आवश्यकता होती है।

C# या VB.NET का उपयोग करके प्रारूपण रूटीन के साथ PDF को TXT फ़ाइल में परिवर्तित करें

अन्य परिदृश्यों में, पाठ के प्रारूपण को बनाए रखना (जैसे पैराग्राफ, सूचकांक, और स्तंभ) महत्वपूर्ण है. इस विधि का उपयोग परिणामस्वरूप TXT फ़ाइल में दस्तावेज़ के क्रम को दर्शाने के लिए रूटीनों को स्वरूपित करना है।

प्रारूपण के साथ पाठ निकालने के लिए कदम

  • ** स्रोत PDF फ़ाइल डाउनलोड करें:** पहले की तरह, अपने एप्लिकेशन में पीडीएफ दस्तावेज़ लोड करें।

  • ** एक स्ट्रिंग वेरिएबल शुरू करें:** प्रारूपित पाठ आउटपुट को इकट्ठा करने के लिए एक श्रृंखला तैयार करें।

  • ** फॉर्मेटिंग मोड का उपयोग करके पाठ निकालना:** प्रत्येक पृष्ठ के लिए, उपयोग करें TextFormattingMode.Pure के बारे में जानकारी यह मोड मूल प्रारूपण को जितना संभव हो उतना करीब दोहराने का प्रयास करता है।

  • ** संपादित पाठ को सहेजें:** संग्रहीत पाठ को एक TXT फ़ाइल में आउटपुट करें जो संरचित प्रारूपण जैसे लाइन ब्रेक, इंडेंट और टैब स्पेसिंग को बनाए रखता है।

निम्नलिखित कोड उदाहरण दिखाता है कि C# का उपयोग करके पाठ प्रारूपण के साथ एक TXT फ़ाइल में एक PDF को कैसे परिवर्तित किया जाए:

RAW और Pure Extraction का दृश्य तुलना

नीचे दी गई छवि दो निष्कर्षण मोडों की एक दृश्य तुलना प्रदान करती है. बाईं ओर, पीडीएफ का पाठ अपने मूल प्रारूपण (शुद्ध स्थिति) के साथ दिखाई देता है, जबकि दाहिने में किसी भी स्वरूपन के बिना कच्चे पाठ प्रदर्शित होता है।

Convert PDF TXT csharp

TXT फ़ाइल को PDF में परिवर्तित करें C# या VB.NET का उपयोग करके प्रोग्राम

एक TXT फ़ाइल को फिर से एक पीडीएफ में परिवर्तित करना उपयोगी है जब आपको स्पष्ट पाठ सामग्री से पॉलिश किए गए दस्तावेज़ का उत्पादन करने की आवश्यकता होती है. इस प्रक्रिया में पाठ को पढ़ना शामिल होता है और फिर PDF प्रारूपण का अनुप्रयोग किया जाता है ताकि एक दस्त बनाया जा सके जो दृश्य रूप से आकर्षक और वितरित के लिए तैयार हो।

TXT में PDF रूपांतरण के लिए कदम

  • ** एक TextReader इंस्टेंस बनाएं:** का उपयोग करें TextReader TXT फ़ाइल से सामग्री पढ़ने के लिए क्लास।

  • एक नया पीडीएफ दस्तावेज़ शुरू करें और एक सफेद पृष्ठ जोड़ें: एक उदाहरण बनाने के लिए Document क्लास और एक नया पृष्ठ जोड़ें।

  • एक TextBuilder ऑब्जेक्ट स्थापित करें: का उपयोग करें TextBuilder वांछित प्रारूपण के साथ पाठ पैराग्राफ बनाने के लिए, जैसे फ़ॉन्ट, आकार, और रंग।

  • ** प्रत्येक पाठ लाइन को पढ़ें और जोड़ें:** TXT फ़ाइल में लाइनों के माध्यम से जाओ, TextBuilder ऑब्जेक्ट के लिए प्रत्येक पंक्ति को जोड़ें।

  • ** PDF आउटपुट को सहेजें:** का उपयोग करें रजिस्ट्रेशन (String ) अंतिम पीडीएफ फ़ाइल को डिस्क में लिखने का तरीका।

नीचे दिए गए कोड स्निपेट में दिखाया गया है कि कैसे एक TXT फ़ाइल को C# का उपयोग करके एक PDF दस्तावेज़ में परिवर्तित करें:

TXT को PDF में परिवर्तित करते समय विचार

  • लेआउट और स्टाइल: आपको यह सुनिश्चित करने के लिए मार्जिन, लाइन स्पेसिंग और अन्य पाठ विशेषताओं को समायोजित करने की आवश्यकता हो सकती है कि पीडीएफ अच्छी तरह से स्वरूपित और पढ़ने योग्य है।
  • त्रुटि से निपटने के लिए: फ़ाइल पढ़ने और लिखने के दौरान त्रुटि की जांच को लागू करने के लिए परिदृश्यों को संभालने, जैसे कि फाइल एक्सेस समस्याओं या गलतफहमी को एन्कोडिंग।

Conclusion

इस लेख में, हमने .NET फ्रेमवर्क में C# या VB.NET का उपयोग करके पीडीएफ फ़ाइलों को टीएचटी और टीकेटी फ़ील्ड में परिवर्तित करने की तकनीकों को दिखाया. चाहे आप गति और सरलता के लिए कच्चे पाठ निकालने का विकल्प चुनते हों या प्रारूपित पाठ की आवश्यकता होती है ताकि दस्तावेज़ के लेआउट को बनाए रखा जा सके. .NET के लिए Aspose.PDF एपीआई विश्वसनीय और लचीला समाधान प्रदान करता है. इन रूपांतरण विधियों को डेटा प्रसंस्करण, दस्तावेज़ संग्रह, और सामग्री पुनर्वितरण के लिए मूल्यवान नहीं हैं.

यदि आपके कोई प्रश्न हैं या अतिरिक्त सहायता की आवश्यकता है, तो कृपया हमारा दौरा करें मुफ्त समर्थन फोरम या समीक्षा करें उत्पाद दस्तावेज.

देखें भी

More in this category