Aplicación Web de búsqueda con Aspose.OCR y ASP.NET Core | File Format Processing Plugins for C# .NET Core

En la era digital de hoy, la capacidad de extraer texto de las imágenes se vuelve cada vez más importante. Ya sea que se trate de documentos escaneados, tarjetas de negocio, o cualquier otra forma de datos basados en la imagen, ser capaz de buscar y manipular esta información de manera eficiente puede ahorrar mucho tiempo y esfuerzo. Este tutorial le guiará a través de la construcción de una aplicación web interactiva utilizando Aspose.OCR y ASP.NET Core que permite a los usuarios cargar imágenes, buscar palabras clave específicas dentro del texto extraído, y ver resultados en tiempo real con partidos destacados.

Fonte de verdad: El código y el flujo a continuación están alineados con el helado al final de este artículo (controladores puntos finales, AsposeOcr uso, y la forma de respuesta JSON).

Ejemplo completo

Prerequisitos

NET 8 (o .NET 6+) SDK
Visual Studio / VS Código
NuGet acceso para Aspose.OCR
(Opcional) Un archivo de licencia Aspose si planea superar los límites de evaluación

Paso 1: Crear el Proyecto ASP.NET Core MVC

dotnet new mvc -n ImageTextSearchApp -f net8.0
cd ImageTextSearchApp

# Add Aspose.OCR
dotnet add package Aspose.OCR

¿Por qué MVC? El gesto utiliza controladores (HomeControllerLas vistas, y un clásico Startup—un patrón fácil y bien conocido para las cargas de archivos + OCR del lado del servidor.

Paso 2: Prepara los activos estáticos y las cargas

El controlador escribe las cargas bajo wwwroot/uploadsCrea esa carpeta y asegúrese de que la aplicación pueda escribir sobre ella.

mkdir -p wwwroot/uploads

También permitimos archivos estáticos middleware en Startup (Más tarde) así que el wwwroot El árbol se sirve correctamente.

Paso 3: Añadir el Controlador (Upload + OCR + Search)

Crea Controllers/HomeController.cs y implementa Index + SearchText Esta acción salva la imagen cargada, realiza OCR, busca una palabra clave (insensible al caso) y devuelve a JSON.

using System;
using System.IO;
using System.Threading.Tasks;
using Aspose.Ocr;
using Microsoft.AspNetCore.Hosting;
using Microsoft.AspNetCore.Http;
using Microsoft.AspNetCore.Mvc;

namespace ImageTextSearchApp
{
    public class HomeController : Controller
    {
        private readonly IWebHostEnvironment _environment;

        public HomeController(IWebHostEnvironment environment)
        {
            _environment = environment;
        }

        [HttpGet]
        public IActionResult Index()
        {
            return View();
        }

        [HttpPost]
        [RequestSizeLimit(20_000_000)] // ~20MB max, adjust as needed
        public async Task<IActionResult> SearchText(IFormFile imageFile, string searchKeyword)
        {
            if (imageFile == null || imageFile.Length == 0)
                return BadRequest("Image file is required.");
            if (string.IsNullOrWhiteSpace(searchKeyword))
                return BadRequest("Search keyword is required.");

            // Ensure uploads directory exists
            var uploadsDir = Path.Combine(_environment.WebRootPath, "uploads");
            Directory.CreateDirectory(uploadsDir);

            // Sanitize filename and save
            var safeName = Path.GetFileName(imageFile.FileName);
            var filePath = Path.Combine(uploadsDir, safeName);
            using (var stream = new FileStream(filePath, FileMode.Create))
            {
                await imageFile.CopyToAsync(stream);
            }

            // Perform OCR on the uploaded image
            using (var ocrEngine = new AsposeOcr())
            {
                var extractedText = await ocrEngine.RecognizeImageAsync(filePath);

                // Case-insensitive keyword check
                var found = extractedText?.IndexOf(searchKeyword, StringComparison.OrdinalIgnoreCase) >= 0;
                var searchResult = found ? "Keyword found!" : "Keyword not found.";

                // Return minimal JSON (exact shape matches the gist)
                return Json(new { extractedText, searchResult });
            }
        }
    }
}

Notas

Hemos añadido un pequeño límite de tamaño de archivo y la creación de directorios para la robustez.
Para la producción, validar los tipos de archivos (.png/.jpg/.jpeg/.tifConsidere el escáner de virus.

Paso 4: Wire Up Startup y Programa

Crea Startup.cs y Programa.ts como en el gesto para permitir MVC, archivos estáticos, itinerancia y redireción HTTPS.

Inicio » CS

using Microsoft.AspNetCore.Builder;
using Microsoft.AspNetCore.Hosting;
using Microsoft.Extensions.DependencyInjection;
using Microsoft.Extensions.Hosting;

namespace ImageTextSearchApp
{
    public class Startup
    {
        public void ConfigureServices(IServiceCollection services)
        {
            services.AddControllersWithViews();
        }

        public void Configure(IApplicationBuilder app, IWebHostEnvironment env)
        {
            if (env.IsDevelopment())
            {
                app.UseDeveloperExceptionPage();
            }
            else
            {
                app.UseExceptionHandler("/Home/Error");
                app.UseHsts();
            }

            app.UseHttpsRedirection();
            app.UseStaticFiles();         // serves wwwroot (including /uploads)

            app.UseRouting();

            app.UseAuthorization();

            app.UseEndpoints(endpoints =>
            {
                endpoints.MapControllerRoute(
                    name: "default",
                    pattern: "{controller=Home}/{action=Index}/{id?}");
            });
        }
    }
}

El programa.cs*

using Microsoft.AspNetCore.Hosting;
using Microsoft.Extensions.Hosting;

namespace ImageTextSearchApp
{
    public class Program
    {
        public static void Main(string[] args)
        {
            CreateHostBuilder(args).Build().Run();
        }

        public static IHostBuilder CreateHostBuilder(string[] args) =>
            Host.CreateDefaultBuilder(args)
                .ConfigureWebHostDefaults(webBuilder =>
                {
                    webBuilder.UseStartup<Startup>();
                });
    }
}

Paso 5: Crea el UI de la búsqueda (Razor View)

Crea Views/Home/Index.cshtml con un simple formulario de descarga y una caja de búsqueda.El JavaScript publica el archivo + palabra clave para /Home/SearchText, imprime texto OCR, y destaca las coincidencias en el navegador (no se necesitan cambios de servidor).

@{
    ViewData["Title"] = "Image Text Search";
}

<h1 class="mb-3">Image Text Search (Aspose.OCR + ASP.NET Core)</h1>

<form id="ocrForm" enctype="multipart/form-data" class="mb-4">
    <div class="form-group mb-2">
        <label for="imageFile">Select image</label>
        <input type="file" id="imageFile" name="imageFile" accept=".png,.jpg,.jpeg,.tif,.tiff,.bmp" class="form-control" required />
    </div>

    <div class="form-group mb-2">
        <label for="searchKeyword">Keyword</label>
        <input type="text" id="searchKeyword" name="searchKeyword" class="form-control" placeholder="Enter a word to find..." required />
    </div>

    <button type="submit" class="btn btn-primary">Upload & Search</button>
</form>

<div id="result" class="mt-3">
    <h3>Result</h3>
    <p id="searchStatus" class="fw-bold"></p>
    <pre id="extractedText" style="white-space: pre-wrap"></pre>
</div>

@section Scripts {
<script>
(function () {
    const form = document.getElementById('ocrForm');
    const statusEl = document.getElementById('searchStatus');
    const textEl = document.getElementById('extractedText');

    function escapeHtml(s) {
        return s.replace(/[&<>"']/g, c => ({
            '&': '&amp;', '<': '&lt;', '>': '&gt;', '"': '&quot;', "'": '&#39;'
        }[c]));
    }

    function highlight(text, keyword) {
        if (!keyword) return escapeHtml(text);
        const pattern = new RegExp(`(${keyword.replace(/[.*+?^${}()|[\]\\]/g, '\\$&')})`, 'gi');
        return escapeHtml(text).replace(pattern, '<mark>$1</mark>');
    }

    form.addEventListener('submit', async (e) => {
        e.preventDefault();
        statusEl.textContent = 'Processing...';
        textEl.textContent = '';

        const formData = new FormData(form);
        try {
            const res = await fetch('/Home/SearchText', {
                method: 'POST',
                body: formData
            });
            if (!res.ok) {
                const msg = await res.text();
                statusEl.textContent = `Error: ${msg}`;
                return;
            }
            const data = await res.json();
            statusEl.textContent = data.searchResult || '';
            const kw = document.getElementById('searchKeyword').value;
            textEl.innerHTML = highlight(data.extractedText || '', kw);
        } catch (err) {
            statusEl.textContent = 'Unexpected error. See console.';
            console.error(err);
        }
    });
})();
</script>
}

Esto implementa el enfoque en tiempo real en el bloque de texto extraído.El rendimiento de los destacados en la imagen en sí requeriría OCR enlazar las cajas y dibujar las superlamas (no cubiertas por el hierro).

Paso 6: Elegir la aplicación

dotnet run

Abre la URL que se muestra en la consola (por ejemplo, https://localhost:5001).).Descarga una imagen, introduzca una palabra clave y haga clic en Upload & Search.

Keyword found! o Keyword not found. (Generado por el servidor)
El Texto extraído con el lado del cliente <mark> Destacados

Paso 7: Consideraciones preparadas para la producción (opcional)

Validación del archivo: Véase los tipos/extensiones de MIME y considere el análisis antivirus.
Límites de tamaño: Uso RequestSizeLimit (Show) y reversa los límites de proxy/web.config según sea necesario.
Cleanup: Elimina periódicamente los archivos antiguos de wwwroot/uploads.
Localización: Si necesita varios idiomas, configure las opciones de idioma OCR en el lado del servidor.
Error UX: reemplaza las alertas con los toastes; añade giradores de carga y barras de progreso.

Troubleshooting

Rezultado OCR vacío: prueba entrada de alta calidad, orientación correcta o formato diferente (PNG/TIFF).
CORS: Si el front-end es separado, habilite CORS y utilice la URL completa de la API.
HTTPS: Asegurar la confianza (dotnet dev-certs https --trustSi el navegador bloquea contenido mixto.

Ejemplo completo#

Prerequisitos#

Paso 1: Crear el Proyecto ASP.NET Core MVC#

Paso 2: Prepara los activos estáticos y las cargas#

Paso 3: Añadir el Controlador (Upload + OCR + Search)#

Paso 4: Wire Up Startup y Programa#

Paso 5: Crea el UI de la búsqueda (Razor View)#

Paso 6: Elegir la aplicación#

Paso 7: Consideraciones preparadas para la producción (opcional)#

Troubleshooting#

More in this category