
A PDF dokumentumok sok üzleti folyamatban elengedhetetlenek, gyakran szoftveres hozzáférést igényelnek a szkennelt tartalmukhoz. A szöveg kivonása a skannált PDF-fájlokból kihívást jelenthet, hangsúlyozva a hatékony eszközök szükségességét. Ebben a tananyagban meg fogjuk vizsgálni hogyan lehet OCR PDF Dokumentumokat és a szövegeket a C#-ból kivonatolni a megbízható Az ASPOSE.OCR a .NET API használatához, egy vezető C# OCR PDF kivonat könyvtár elérhető ingyenes értékelés.
Mit fogsz megtanulni
Ebben a cikkben a következő témákat fogjuk foglalni:
- Az Aspose.OCR áttekintése a .NET API-n
- Lépések az OCR PDF-hez és a szöveg kivonatához
- Hogyan készítsünk OCR-t PDF-ben és mentse a szöveget
- Konvertálás OCR PDF-t a Word-re
- OCR PDF átalakítása JSON-ra
Áttekintés Aspose.OCR for .NET API
Használjuk a Az ASPOSE.OCR a .NET API használatához, egy robusztus .NET PDF OCR API célja, hogy felismerje a szöveget a szkennelt képek, okostelefon fényképek és képernyőfelvételek, visszaküldi az eredményeket a különböző dokumentum formátumok. Ez az API nem csak átalakítja a képeket szövegre, hanem létrehozza a kereshető PDF-k a scans és javítja bármilyen lejátszó hibák a felismert szöveg, így az egyik leggyorsabb C# PDF oCR megoldások elérhető csak $99.
A tűz a AsposeOcr az osztályt, amely több módszert biztosít az OCR műveletekhez RecognizePdf (string, dokumentumfelismerési beállítások) módszer nélkülözhetetlen a szöveg kivonásához egy meghatározott PDF dokumentumból DocumentRecognitionSettings az osztály lehetővé teszi a felismerési folyamat személyre szabását, miközben a RecognitionResult Az osztály a felismerés eredményeit kapszulálja.
Te tudsz Töltse le a DLL-t a tűzről vagy telepítse a NuGet:
PM> Install-Package Aspose.OCR
Lépések OCR PDF és kivonat szöveg C# {# lépések-to-ocr-pdf-and-extract-text-in-c}
Ahhoz, hogy az OCR-t PDF dokumentumokon végezze el, és kivonja az elismert szöveget, kövesse az alábbi lépéseket:
- Hozzon létre egy példát az AsposeOcr osztályból.
- Indítsa el egy objektumot a DocumentRecognitionSettings osztályba.
- Az OCR nyelvének meghatározása.
- Szerezze meg a RecognitionResult-t az Pdf() módszerre való hivatkozással, a képpálya és a DocumentRecognitionSettings Az objektum.
- Menj át a RecognitionResult listán, hogy megjelenítse az azonosított szöveget.
Íme egy példa, amely illusztrálja hogyan lehet OCR PDF dokumentumok és kivonat elismert szöveg C#:
OCR PDF és kivonat szöveg a PDF-ből C#
Hogyan készítsünk OCR-t a PDF-en és mentse a szöveget a C#-ban
Ahhoz, hogy az OCR-t PDF dokumentumokon végezze el, és megőrizze az elismert szöveget, kövesse az alábbi lépéseket:
- Hozzon létre egy példát az AsposeOcr osztályból.
- Indítsa el egy objektumot a DocumentRecognitionSettings osztályba.
- Az OCR nyelvének meghatározása.
- Hívja meg a RecognizePdf() módszert, hogy megkapja az RekognitionResult.
- A szöveg mentése a SaveMultipageDocument() módszerrel, amely a kimeneti fájlútot igényli, a SaveFormat, És a RecognitionResult Az objektum.
Íme egy példa, amely megmutatja hogyan lehet OCR PDF dokumentumokat és mentse az elismert szöveget a C#:
Töltse ki az OCR-t a PDF-ben és mentse a szöveget a C#-ban#
Az OCR PDF átalakítása Word-be C#
A szkennelt PDF-dokumentumok Wordba történő átalakításához kövesse a korábban felsorolt lépéseket, de a végső lépésben SaveFormat.Docx jelölje be.
Íme egy példa, amely illusztrálja hogyan kell OCR PDF és mentse az elismert szöveget, mint a Word dokumentum C#:
OCR PDF és Convert Scanned PDF to Word in C#
Átalakítása OCR PDF a JSON a C#
Ahhoz, hogy a felismert szöveget a PDF dokumentumok egy JSON fájl, kövesse az előző lépéseket az egyetlen változás a jelölni SaveFormat.Json a végső lépésben.
Íme egy példa, amely megmutatja hogyan OCR PDF és mentse az elismert szöveget, mint egy JSON fájl C#:
Szerezzen ingyenes értékelési engedélyt
Te tudsz Ingyenes ideiglenes licenc a .NET API Aspose.OCR értékelése korlátozások nélkül.
következtetések
Ebben a kézikönyvben megtanultunk, hogyan kell végrehajtani az OCR-t a PDF dokumentumokon és kivonni a szöveget a C#-ban TXT, DOCX, és JSON További információkért a Aspose.OCR for .NET API, ellenőrizze a Dokumentáció. Ha bármilyen kérdése van, légy szabad hozzáférni hozzánk a mi Fórum.
Lásd még
- Átalakítsa a képernyőfelvételt szövegre az OCR-vel C#-ra#
- OCR Image to Text és Spelling Correction a C#-ban#
- Átalakítsa a szkennelt PDF-t kereshető PDF-re az OCR-vel C#-ban#
A Aspose.OCR for .NET API használatával a C#-ban nagy pontosságú PDF OCR alkalmazást végezhet a különböző alkalmazásokhoz, beleértve a C# OECR számla feldolgozást és a formanyomtatványok kezelést. Ez az megfelelő.NET PDF O CR megoldás tökéletes a fejlesztők számára, akik a OCr PDF képességeket hatékonyan szeretnék integrálni alkalmazásaikba.
Továbbá, ha a PDF-t C# szövegre kell átalakítania, ez az API egyszerű megoldást nyújt. Azok számára, akik érdeklődnek a C# OCR PDF szöveghez képességek iránt, az integráció szelíd, lehetővé téve a különböző dokumentumformátumokból származó hatékony szöveges kivonatot.
Ha keres egy Aspose OCR C# Példát, ez az útmutató átfogó erőforrásként szolgál. Ezen túlmenően, az olyan érdekes feladatokhoz, mint a C# API használata, a tankönyv tartalmazza az összes alapvető elemet, amely szükséges ahhoz, hogy hatékonyan elkezdődjön.
Azok számára, akik szeretnék értékelni a PDF SDK és a dokumentumfeldolgozó szoftver cég Aspose az OCR PDFSDK, ez a tutorial kiváló kiindulópontként szolgál, hogy megértsék annak képességeit. Akár szükség van egy C# O CR DLL integrációhoz, vagy egy** C# oCR tutorial** útmutatáshoz, megtalálja mindent, amire szüksége van az API hatékony használatához a projektekben.
Továbbá, ha szeretné használni a C# szöveges felismerést vagy különböző alkalmazásokra használja az C# OCR könyvtárat, akkor felfedezheti az Aspose által kínált funkciókat, hogy támogassa ezeket a funkcionalitásokat.
Végül, ha a C#-ban a PDF-ből a szöveg kivonására van szükség, vagy egy OCR API-t használ, a rendelkezésre álló C# OCR PDF funkciók rugalmasabbá teszik a fejlesztési folyamatot és javítják az alkalmazás funkcionalitását.