एआई के साथ पीडीएफ दस्तावेजों को संक्षेप में रखने की प्रक्रिया को स्वचालित करना डेवलपर्स, ज्ञान कार्यकर्ताओं और स्वचालन टीमों के लिए उत्पादकता में काफी वृद्धि कर सकता है. इस गाइड में, आप सीखेंगे कि कैसे एक .NET प्लगइन का उपयोग करें PDF फ़ाइलों से पाठ निकालें, उस सामग्री को ChatGPT को सारांश भेजें, और परिणामस्वरूप समीक्षाओं को एक ।NET अनुप्रयोग में संबोधित करें.
Introduction
एआई के साथ पीडीएफ दस्तावेजों को संक्षेप में रखने की प्रक्रिया को स्वचालित करना डेवलपर्स, ज्ञान कार्यकर्ताओं और स्वचालन टीमों के लिए उत्पादकता में काफी वृद्धि कर सकता है. इस गाइड में, आप सीखेंगे कि कैसे एक .NET प्लगइन का उपयोग करें PDF फ़ाइलों से पाठ निकालें, उस सामग्री को ChatGPT को सारांश भेजें, और परिणामस्वरूप समीक्षाओं को एक ।NET अनुप्रयोग में संबोधित करें.
Prerequisites
इससे पहले कि हम शुरू करें, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:
- Aspose.PDF.Plugin NuGet के माध्यम से स्थापित
- OpenAI API एक्सेस और कुंजी (या Azure OpenAI सेवा)
- एक .NET 6+ प्रोजेक्ट स्थापित करें
- ChatGPT अनुरोधों के लिए इंटरनेट एक्सेस
PDF से पाठ निकालना
शुरू करने के लिए, आपको एक पीडीएफ फ़ाइल से पाठ निकालना होगा. Aspose.PDF.Plugin प्रदान करता है TextExtractor
एक कक्षा जो इसे प्राप्त करने के लिए इस्तेमाल किया जा सकता है।
using Aspose.Pdf.Plugins;
string inputPath = "C:\\Docs\\sample.pdf";
var extractor = new TextExtractor();
var options = new TextExtractorOptions();
options.AddInput(new FileDataSource(inputPath));
var resultContainer = extractor.Process(options);
string textContent = resultContainer.ResultCollection[0].ToString();
यह कोड snippet दिखाता है कि कैसे प्रारंभ करने के लिए TextExtractor
, निष्कर्षण विकल्प स्थापित करें, और इसकी सामग्री निकालने के लिए एक पीडीएफ फ़ाइल को संसाधित करें।
Subsection: निष्कर्षण त्रुटियों को संभालना
उदाहरण के लिए, यदि इनपुट मार्ग गलत है या फ़ाइल स्वरूप Aspose.PDF.Plugin द्वारा समर्थित नहीं है, तो उचित त्रुटि प्रबंधन लागू किया जाना चाहिए।
ChatGPT के लिए सामग्री भेजें
एक बार जब आप एक पीडीएफ से पाठ निकालते हैं, तो अगला कदम संक्षेप में इस सामग्री को ChatGPT को भेजना है। HttpClient
अपने API कुंजी के साथ OpenAI के अंत बिंदु पर एपीआई कॉल करने के लिए और एक प्रॉम्प्ट।
using System.Net.Http;
using System.Net.Http.Headers;
using System.Text;
using Newtonsoft.Json;
string apiKey = "YOUR_OPENAI_API_KEY";
string prompt = $"Summarize the following PDF content in 5 bullet points:\n{textContent}";
var httpClient = new HttpClient();
httpClient.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", apiKey);
var requestBody = new {{
model = "gpt-3.5-turbo",
messages = new[]
{
new {{ role = "system", content = "You are a helpful assistant that summarizes PDF content." }},
new {{ role = "user", content = prompt }}
}
}};
string jsonBody = JsonConvert.SerializeObject(requestBody);
var response = await httpClient.PostAsync(
"https://api.openai.com/v1/chat/completions",
new StringContent(jsonBody, Encoding.UTF8, "application/json")
);
string responseString = await response.Content.ReadAsStringAsync();
// Parse summary from responseString
इस खंड में दिखाया गया है कि अनुरोध शरीर को कैसे बनाया जाए और इसे ChatGPT पर भेजा जाए. जवाब फिर एक पंक्ति के रूप में पढ़ा जाता है.
पदों की सूची: Parsing Responses
जवाब प्राप्त करने के बाद, आपको सारांशित सामग्री को बाहर निकालना होगा. यह JSON जवाब के विशिष्ट हिस्सों को निकालकर किया जा सकता है जिसमें संक्षेप पाठ शामिल है.
सैमसंग को बचाएं
एक बार जब आप ChatGPT के एपीआई प्रतिक्रिया से सारांश को पार कर चुके हैं, तो आप इसे बाद में उपयोग के लिए एक डेटाबेस या फ़ाइल सिस्टम में संग्रहीत करना चाहते हैं. यहाँ एक उदाहरण है कि कैसे एक नया पीडीएफ दस्तावेज़ में वापस लिखें Aspose.PDF का उपयोग करके.
गलतियों का प्रबंधन
इस तरह के प्रक्रियाओं को स्वचालित करने के लिए सही त्रुटि प्रबंधन महत्वपूर्ण है. ऐसे परिदृश्यों को ध्यान में रखें जैसे कि एपीआई दर सीमाएं, नेटवर्क समस्याएं और खराब प्रतिक्रियाएं. निष्कर्ष निकाले गए पाठ को चेक करने से पहले इसे ChatGPT को भेजें.
Subsection: लॉगिंग ऑपरेशन
सभी ऑपरेशनों को रिकॉर्ड करना डिबगिंग और ऑडिटेशन के उद्देश्यों में मदद कर सकता है. सारांशकरण प्रक्रिया के दौरान महत्वपूर्ण घटनाओं को लॉग करने के लिए Serilog या NLog जैसे एक रजिस्टर फ्रेम का उपयोग करें.
सुरक्षा नोट
गोपनीय दस्तावेजों को संभालते समय सावधान रहें. यह सुनिश्चित करें कि आपके गोपनीयता आवश्यकताओं को पूरा किया जाता है, इससे पहले कि आप क्लाउड-आधारित एआई सेवाओं जैसे चैटजीपीटी को डेटा भेजते हैं. संवेदनशील सामग्री के लिए, बाहरी एपीआई पर भरोसा करने के बजाय एक स्थानीय भाषा मॉडल को तैनात करने पर विचार करें.
अक्सर पूछे जाने वाले प्रश्न
** Q: क्या मैं स्कैन किए गए पीडीएफ को संक्षेप में संकलित कर सकता हूं?**A: केवल अगर वे OCR’d हो गए हैं या इसमें चयन योग्य पाठ होता है. अन्यथा, पहली बार छवियों को खोज योग्य टेक्स्ट में परिवर्तित करने के लिए एक ओसीआर प्लगइन का उपयोग करें.
** Q: क्या यह गोपनीय दस्तावेजों के लिए सुरक्षित है?**A: केवल यदि आपकी गोपनीयता आवश्यकताएं अनुमति देती हैं, तो ChatGPT को डेटा भेजें. संवेदनशील सामग्री के लिए, एक तैनात भाषा मॉडल के साथ स्थानीय प्रसंस्करण पर विचार करें.