A PDF dokumentumok sok üzleti folyamatban elengedhetetlenek, gyakran szoftveres hozzáférést igényelnek a szkennelt tartalmukhoz. A szöveg kivonása a skannált PDF-fájlokból kihívást jelenthet, hangsúlyozva a hatékony eszközök szükségességét. Ebben a tananyagban meg fogjuk vizsgálni hogyan lehet OCR PDF Dokumentumokat és a szövegeket a C#-ból kivonatolni a megbízható Az ASPOSE.OCR a .NET API használatához, egy vezető C# OCR PDF kivonat könyvtár elérhető ingyenes értékelés.

Mit fogsz megtanulni

Ebben a cikkben a következő témákat fogjuk foglalni:

Áttekintés Aspose.OCR for .NET API

Használjuk a Az ASPOSE.OCR a .NET API használatához, egy robusztus .NET PDF OCR API célja, hogy felismerje a szöveget a szkennelt képek, okostelefon fényképek és képernyőfelvételek, visszaküldi az eredményeket a különböző dokumentum formátumok. Ez az API nem csak átalakítja a képeket szövegre, hanem létrehozza a kereshető PDF-k a scans és javítja bármilyen lejátszó hibák a felismert szöveg, így az egyik leggyorsabb C# PDF oCR megoldások elérhető csak $99.

A tűz a AsposeOcr az osztályt, amely több módszert biztosít az OCR műveletekhez RecognizePdf (string, dokumentumfelismerési beállítások) módszer nélkülözhetetlen a szöveg kivonásához egy meghatározott PDF dokumentumból DocumentRecognitionSettings az osztály lehetővé teszi a felismerési folyamat személyre szabását, miközben a RecognitionResult Az osztály a felismerés eredményeit kapszulálja.

Te tudsz Töltse le a DLL-t a tűzről vagy telepítse a NuGet:

PM> Install-Package Aspose.OCR

Lépések OCR PDF és kivonat szöveg C# {# lépések-to-ocr-pdf-and-extract-text-in-c}

Ahhoz, hogy az OCR-t PDF dokumentumokon végezze el, és kivonja az elismert szöveget, kövesse az alábbi lépéseket:

  • Hozzon létre egy példát az AsposeOcr osztályból.
  • Indítsa el egy objektumot a DocumentRecognitionSettings osztályba.
  • Az OCR nyelvének meghatározása.
  • Szerezze meg a RecognitionResult-t az Pdf() módszerre való hivatkozással, a képpálya és a DocumentRecognitionSettings Az objektum.
  • Menj át a RecognitionResult listán, hogy megjelenítse az azonosított szöveget.

Íme egy példa, amely illusztrálja hogyan lehet OCR PDF dokumentumok és kivonat elismert szöveg C#:

OCR PDF és kivonat szöveg a PDF-ből C#

Hogyan készítsünk OCR-t a PDF-en és mentse a szöveget a C#-ban

Ahhoz, hogy az OCR-t PDF dokumentumokon végezze el, és megőrizze az elismert szöveget, kövesse az alábbi lépéseket:

  • Hozzon létre egy példát az AsposeOcr osztályból.
  • Indítsa el egy objektumot a DocumentRecognitionSettings osztályba.
  • Az OCR nyelvének meghatározása.
  • Hívja meg a RecognizePdf() módszert, hogy megkapja az RekognitionResult.
  • A szöveg mentése a SaveMultipageDocument() módszerrel, amely a kimeneti fájlútot igényli, a SaveFormat, És a RecognitionResult Az objektum.

Íme egy példa, amely megmutatja hogyan lehet OCR PDF dokumentumokat és mentse az elismert szöveget a C#:

Töltse ki az OCR-t a PDF-ben és mentse a szöveget a C#-ban#

Az OCR PDF átalakítása Word-be C#

A szkennelt PDF-dokumentumok Wordba történő átalakításához kövesse a korábban felsorolt lépéseket, de a végső lépésben SaveFormat.Docx jelölje be.

Íme egy példa, amely illusztrálja hogyan kell OCR PDF és mentse az elismert szöveget, mint a Word dokumentum C#:

OCR PDF és Convert Scanned PDF to Word in C#

Átalakítása OCR PDF a JSON a C#

Ahhoz, hogy a felismert szöveget a PDF dokumentumok egy JSON fájl, kövesse az előző lépéseket az egyetlen változás a jelölni SaveFormat.Json a végső lépésben.

Íme egy példa, amely megmutatja hogyan OCR PDF és mentse az elismert szöveget, mint egy JSON fájl C#:

Szerezzen ingyenes értékelési engedélyt

Te tudsz Ingyenes ideiglenes licenc a .NET API Aspose.OCR értékelése korlátozások nélkül.

következtetések

Ebben a kézikönyvben megtanultunk, hogyan kell végrehajtani az OCR-t a PDF dokumentumokon és kivonni a szöveget a C#-ban TXT, DOCX, és JSON További információkért a Aspose.OCR for .NET API, ellenőrizze a Dokumentáció. Ha bármilyen kérdése van, légy szabad hozzáférni hozzánk a mi Fórum.

Lásd még

A Aspose.OCR for .NET API használatával a C#-ban nagy pontosságú PDF OCR alkalmazást végezhet a különböző alkalmazásokhoz, beleértve a C# OECR számla feldolgozást és a formanyomtatványok kezelést. Ez az megfelelő.NET PDF O CR megoldás tökéletes a fejlesztők számára, akik a OCr PDF képességeket hatékonyan szeretnék integrálni alkalmazásaikba.

Továbbá, ha a PDF-t C# szövegre kell átalakítania, ez az API egyszerű megoldást nyújt. Azok számára, akik érdeklődnek a C# OCR PDF szöveghez képességek iránt, az integráció szelíd, lehetővé téve a különböző dokumentumformátumokból származó hatékony szöveges kivonatot.

Ha keres egy Aspose OCR C# Példát, ez az útmutató átfogó erőforrásként szolgál. Ezen túlmenően, az olyan érdekes feladatokhoz, mint a C# API használata, a tankönyv tartalmazza az összes alapvető elemet, amely szükséges ahhoz, hogy hatékonyan elkezdődjön.

Azok számára, akik szeretnék értékelni a PDF SDK és a dokumentumfeldolgozó szoftver cég Aspose az OCR PDFSDK, ez a tutorial kiváló kiindulópontként szolgál, hogy megértsék annak képességeit. Akár szükség van egy C# O CR DLL integrációhoz, vagy egy** C# oCR tutorial** útmutatáshoz, megtalálja mindent, amire szüksége van az API hatékony használatához a projektekben.

Továbbá, ha szeretné használni a C# szöveges felismerést vagy különböző alkalmazásokra használja az C# OCR könyvtárat, akkor felfedezheti az Aspose által kínált funkciókat, hogy támogassa ezeket a funkcionalitásokat.

Végül, ha a C#-ban a PDF-ből a szöveg kivonására van szükség, vagy egy OCR API-t használ, a rendelkezésre álló C# OCR PDF funkciók rugalmasabbá teszik a fejlesztési folyamatot és javítják az alkalmazás funkcionalitását.

More in this category