Tự động nhập dữ liệu từ các biểu mẫu được quét hoặc chụp ảnh có thể cải thiện đáng kể năng suất và độ chính xác trong các ngành công nghiệp khác nhau, chẳng hạn như chăm sóc sức khỏe, tài chính và dịch vụ pháp lý. Aspose.OCR cho .NET cung cấp một giải pháp mạnh mẽ để tự động hóa quá trình này bằng cách chuyển đổi hình ảnh văn bản thành các định dạng Văn bản được chỉnh sửa. Bài viết blog này sẽ hướng dẫn bạn thông qua các bước cần thiết để thiết lập và sử dụng Asposa.ocR for .Net để lấy data từ biểu thức một cách hiệu quả.
Một ví dụ đầy đủ
Để bắt đầu nhanh chóng, đây là một tổng quan về cách bạn có thể tự động nhập dữ liệu bằng cách sử dụng Aspose.OCR cho .NET:
- tải hình dạng hình ảnh.
- Thiết lập các cài đặt OCR để nhận dạng tối ưu.
- Thu thập văn bản từ hình thức.
- Xuất khẩu văn bản được công nhận vào định dạng mong muốn.
Hướng dẫn Step-by-Step
Bước 1: Tải hình dạng
Bước đầu tiên là tải các hình thức được quét hoặc chụp vào ứng dụng của bạn. đảm bảo rằng chất lượng hình ảnh là đủ cao để xử lý OCR chính xác. Image lớp để tải file hình ảnh.
Bước 2: Cài đặt OCR
Để đạt được kết quả tốt nhất, bạn cần thiết lập các cài đặt OCR theo các đặc điểm của biểu mẫu của bạn. Điều này bao gồm cấu hình hỗ trợ ngôn ngữ, điều chỉnh sự tương phản và độ sáng, và xác định các khu vực quan tâm (ROI) cho khai thác văn bản.
// Step 1: Load the form image
string imagePath = "path/to/your/form_image.png";
using (var image = new Aspose.Ocr.Image(imagePath))
{
// Image is now loaded and ready for OCR processing
}
Bước 3: Xóa văn bản từ hình thức
Một khi hình ảnh được tải lên và cài đặt được cấu hình, bạn có thể tiếp tục trích xuất văn bản từ biểu mẫu. Aspose.OCR cung cấp các phương pháp để nhận ra văn Bản trong các khu vực cụ thể hoặc trên toàn bộ hình dạng.
// Step 2: Configure OCR Settings
var ocrEngine = new OcrEngine();
ocrEngine.Settings.Language = RecognitionLanguages.English;
ocrEngine.Settings.ContrastAdjustmentMode = ContrastAdjustmentMode.HighContrast;
ocrEngine.Settings.Brightness = 10;
Bước 4: Xuất khẩu văn bản được công nhận
Sau khi lấy văn bản, bạn có thể muốn xuất nó sang một định dạng phù hợp cho việc xử lý tiếp theo, chẳng hạn như CSV, JSON, hoặc chữ bằng phẳng. Aspose.OCR hỗ trợ các hình thức phát hành khác nhau, cho phép bạn tùy chỉnh dữ liệu theo nhu cầu của bạn.
// Step 3: Extract text from the form
using (var ocrEngine = new OcrEngine())
{
string extractedText = ocrEngine.RecognizeImage(imagePath);
Console.WriteLine("Extracted Text:\n" + extractedText);
}
Thực hành tốt nhất
Hướng dẫn cài đặt Real-World Layouts
Các biểu mẫu thế giới thực thường có bố trí phức tạp với các phông chữ và kích cỡ khác nhau. Để giải quyết những thách thức này một cách hiệu quả, hãy xem xét việc sử dụng các tính năng tiên tiến như từ vựng tùy chỉnh cho thuật ngữ chuyên môn hoặc thiết lập nhiều ngôn ngữ OCR nếu hình thức chứa văn bản trong các ngoại ngữ.
Lựa chọn xuất khẩu
Khi xuất văn bản được công nhận, hãy chọn một định dạng xuất khẩu phù hợp nhất với dòng công việc của bạn. Ví dụ, CSV là lý tưởng cho dữ liệu bảng, trong khi JSON là tốt hơn cho các dữ kiện có cấu trúc với các đối tượng sơn.
Bằng cách làm theo những bước này và thực hành tốt nhất, bạn có thể tự động hóa hiệu quả nhập dữ liệu từ các biểu mẫu được quét hoặc chụp bằng cách sử dụng Aspose.OCR cho .NET. Điều này không chỉ tiết kiệm thời gian mà còn làm giảm nguy cơ mắc lỗi liên quan đến nhập thông tin thủ công.