एआई के साथ पीडीएफ दस्तावेजों को संक्षेप में रखने की प्रक्रिया को स्वचालित करना डेवलपर्स, ज्ञान कार्यकर्ताओं और स्वचालन टीमों के लिए उत्पादकता में काफी वृद्धि कर सकता है. इस गाइड में, आप सीखेंगे कि कैसे एक .NET प्लगइन का उपयोग करें PDF फ़ाइलों से पाठ निकालें, उस सामग्री को ChatGPT को सारांश भेजें, और परिणामस्वरूप समीक्षाओं को एक ।NET अनुप्रयोग में संबोधित करें.

Introduction

एआई के साथ पीडीएफ दस्तावेजों को संक्षेप में रखने की प्रक्रिया को स्वचालित करना डेवलपर्स, ज्ञान कार्यकर्ताओं और स्वचालन टीमों के लिए उत्पादकता में काफी वृद्धि कर सकता है. इस गाइड में, आप सीखेंगे कि कैसे एक .NET प्लगइन का उपयोग करें PDF फ़ाइलों से पाठ निकालें, उस सामग्री को ChatGPT को सारांश भेजें, और परिणामस्वरूप समीक्षाओं को एक ।NET अनुप्रयोग में संबोधित करें.

Prerequisites

इससे पहले कि हम शुरू करें, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:

  • Aspose.PDF.Plugin NuGet के माध्यम से स्थापित
  • OpenAI API एक्सेस और कुंजी (या Azure OpenAI सेवा)
  • एक .NET 6+ प्रोजेक्ट स्थापित करें
  • ChatGPT अनुरोधों के लिए इंटरनेट एक्सेस

PDF से पाठ निकालना

शुरू करने के लिए, आपको एक पीडीएफ फ़ाइल से पाठ निकालना होगा. Aspose.PDF.Plugin प्रदान करता है TextExtractor एक कक्षा जो इसे प्राप्त करने के लिए इस्तेमाल किया जा सकता है।

using Aspose.Pdf.Plugins;

string inputPath = "C:\\Docs\\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();

यह कोड snippet दिखाता है कि कैसे प्रारंभ करने के लिए TextExtractor, निष्कर्षण विकल्प स्थापित करें, और इसकी सामग्री निकालने के लिए एक पीडीएफ फ़ाइल को संसाधित करें।

Subsection: निष्कर्षण त्रुटियों को संभालना

उदाहरण के लिए, यदि इनपुट मार्ग गलत है या फ़ाइल स्वरूप Aspose.PDF.Plugin द्वारा समर्थित नहीं है, तो उचित त्रुटि प्रबंधन लागू किया जाना चाहिए।

ChatGPT के लिए सामग्री भेजें

एक बार जब आप एक पीडीएफ से पाठ निकालते हैं, तो अगला कदम संक्षेप में इस सामग्री को ChatGPT को भेजना है। HttpClient अपने API कुंजी के साथ OpenAI के अंत बिंदु पर एपीआई कॉल करने के लिए और एक प्रॉम्प्ट।

using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;

string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";

var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new {{
    model = "gpt-3.5-turbo",
    messages = new[]
    {
        new {{ role = "system", content = "You are a helpful assistant that summarizes PDF content." }},
        new {{ role = "user", content = prompt }}
    }
}};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
    "https://api.openai.com/v1/chat/completions",
    new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString

इस खंड में दिखाया गया है कि अनुरोध शरीर को कैसे बनाया जाए और इसे ChatGPT पर भेजा जाए. जवाब फिर एक पंक्ति के रूप में पढ़ा जाता है.

पदों की सूची: Parsing Responses

जवाब प्राप्त करने के बाद, आपको सारांशित सामग्री को बाहर निकालना होगा. यह JSON जवाब के विशिष्ट हिस्सों को निकालकर किया जा सकता है जिसमें संक्षेप पाठ शामिल है.

सैमसंग को बचाएं

एक बार जब आप ChatGPT के एपीआई प्रतिक्रिया से सारांश को पार कर चुके हैं, तो आप इसे बाद में उपयोग के लिए एक डेटाबेस या फ़ाइल सिस्टम में संग्रहीत करना चाहते हैं. यहाँ एक उदाहरण है कि कैसे एक नया पीडीएफ दस्तावेज़ में वापस लिखें Aspose.PDF का उपयोग करके.

गलतियों का प्रबंधन

इस तरह के प्रक्रियाओं को स्वचालित करने के लिए सही त्रुटि प्रबंधन महत्वपूर्ण है. ऐसे परिदृश्यों को ध्यान में रखें जैसे कि एपीआई दर सीमाएं, नेटवर्क समस्याएं और खराब प्रतिक्रियाएं. निष्कर्ष निकाले गए पाठ को चेक करने से पहले इसे ChatGPT को भेजें.

Subsection: लॉगिंग ऑपरेशन

सभी ऑपरेशनों को रिकॉर्ड करना डिबगिंग और ऑडिटेशन के उद्देश्यों में मदद कर सकता है. सारांशकरण प्रक्रिया के दौरान महत्वपूर्ण घटनाओं को लॉग करने के लिए Serilog या NLog जैसे एक रजिस्टर फ्रेम का उपयोग करें.

सुरक्षा नोट

गोपनीय दस्तावेजों को संभालते समय सावधान रहें. यह सुनिश्चित करें कि आपके गोपनीयता आवश्यकताओं को पूरा किया जाता है, इससे पहले कि आप क्लाउड-आधारित एआई सेवाओं जैसे चैटजीपीटी को डेटा भेजते हैं. संवेदनशील सामग्री के लिए, बाहरी एपीआई पर भरोसा करने के बजाय एक स्थानीय भाषा मॉडल को तैनात करने पर विचार करें.

अक्सर पूछे जाने वाले प्रश्न

** Q: क्या मैं स्कैन किए गए पीडीएफ को संक्षेप में संकलित कर सकता हूं?**A: केवल अगर वे OCR’d हो गए हैं या इसमें चयन योग्य पाठ होता है. अन्यथा, पहली बार छवियों को खोज योग्य टेक्स्ट में परिवर्तित करने के लिए एक ओसीआर प्लगइन का उपयोग करें.

** Q: क्या यह गोपनीय दस्तावेजों के लिए सुरक्षित है?**A: केवल यदि आपकी गोपनीयता आवश्यकताएं अनुमति देती हैं, तो ChatGPT को डेटा भेजें. संवेदनशील सामग्री के लिए, एक तैनात भाषा मॉडल के साथ स्थानीय प्रसंस्करण पर विचार करें.

More in this category