Hệ thống Số hoá nhận dạng tiếng Việt

Giải pháp nhận dạng văn bản được thiết kế toàn diện từ hệ thống Server đến các Client, vận hành Standalone hoặc tích hợp Cloud, với hệ thống Bigdata. Triển khai hoàn toàn trên các nền tảng Open Source Tiết kiệm, An ninh Bảo mật và Dễ dàng mở rộng hệ thống

HỆ THỐNG ĐƯỢC THIẾT KẾ ĐÁP ỨNG HAI MÔ HÌNH

 • Dịch vụ cloud: Triển khai khai cung cấp dịch vụ số hoá trên cloud cho khối lượng lớn doanh nghiệp/ người dùng
 • Đơn lập: Triển khai cài đặt cho một doanh nghiệp sử dụng trên hạ tầng của chính doanh nghiệp

MÔ HÌNH KIẾN TRÚC DỊCH VỤ CLOUD

Hệ thống xử lý nhận dạng song song, hoạt động trên nền tảng Cloud SAAS, WebApi Service, Open Source. Phù hợp với doanh nghiệp lớn có nhu cầu quản lý hệ thống riêng đáp ứng tốt số lượng nhận dạng lớn, hoặc doanh nghiệp triển khai cung cấp dịch vụ nhận dạng văn bản online cho các khách hàng

 • Client UI từ Internet, LAN, WAN giao diện ứng dụng cho người dùng thực hiện thao tác số hoá tài liệu, số hoá CMND/CCCD…
 • Load Balancing: 1 hay nhiều hệ thống cân bằng tải cứng hoặc mềm giúp đáp ứng số lượng lớn yêu cầu nhận dạng đến các OCR Masters giúp tăng tính vận hành xuyên suốt của hệ thống
 • FTP Share và DB Master Share: Hệ thống chia sẻ tài nguyên dùng chung cho các OCR Master và OCR Nodes, hoạt động trên các hệ thống High Availability clusters với SAN, Network Shares & NAS hoặc trên nền tảng Big Data
 • OCR Masters: Các node Master hoạt động backup xử lý yêu cầu nhận dạng và phân phối công việc nhận dạng cho các OCR Nodes giúp tăng khả năng xử lý đồng thời, giảm thời gian nhận dạng
 • OCR Nodes: Các node xử lý nhận dạng host trên các máy chủ dễ dàng mở rộng kết nối vào hệ thống

MÔ HÌNH KIẾN TRÚC ĐƠN LẬP

Giải pháp trọn gói độc lập triển khai trên hệ thống với cấu hình tối thiểu, phù hợp các doanh nghiệp vừa và nhỏ có nhu cầu tự vận hành hệ thống riêng, dễ quản lý, dễ sử dụng

 • Client UI từ Internet, LAN, WAN giao diện ứng dụng cho người dùng thực hiện thao tác số hoá tài liệu, số hoá CMND/CCCD…
 • Load Balancing / Router
 • OCR API: Dịch vụ tiếp nhận yêu cầu nhận dạng và xử lý nhận dạng chuẩn Restful API

CÁC THÀNH PHẦN HỆ THỐNG

Cung cấp giao tiếp Restful API. Giao diện quản trị ứng dụng và giao diện client mặc định. Hỗ trợ giao tiếp ứng dụng rich-client với các kết nối API đa dạng và được mô tả đầy đủ rõ ràng.

 • Nhận dạng đa ngôn ngữ – Cho phép nhận dạng đa ngôn ngữ kết hợp khả năng huấn luyện máy học chữ in, chữ viết chuyên sâu.
 • Restful API – Cho phép đa ứng dụng tích hợp kết nối nhận dạng văn bản với các chế độ đồng bộ, bất đồng bộ (kích hoạt nhận kết quả tự động) và tự động xử lý nhận dạng với đầu vào thay đổi, khả năng bóc tách dữ liệu thành cấu trúc cho phép client tùy biến xử lý dữ liệu.
 • Client UI – Client UI mẫu mặc định kèm theo cho phép người dùng khai thác sử dụng ngay lập tức hoặc dễ dàng tùy biến.

ƯU ĐIỂM KỸ THUẬT CỦA GIẢI PHÁP

 • Triển khai được trên đa nền tảng: Windows, Solaris, Linux/Unix, Mac OS X…
 • Hỗ trợ nhiều đầu vào PDF, TIFF, JPEG, GIF, PNG, BMP, Multi-page TIFF images
 • Hỗ trợ nhiều đầu ra các chuẩn TEXT, XML, DOC và PDF 2 lớp lưu trữ công tác số hóa
 • Lõi nhận dạng được cộng đồng nghiên cứu mã nguồn mở Google phát triển lâu dài
 • Tỷ lệ nhận dạng ngôn ngữ Tiếng Anh cao đạt trên 95%, nhận dạng ngôn ngữ Tiếng Việt 90%-95% với mẫu đầu vào theo tiêu chuẩn

CÁC CHỨC NĂNG HỆ THỐNG

Hỗ trợ giao diện Web form và Mobile app. Cho phép chạy số hoá tự động dưới dạng Background Service. Giao diện Client minh họa theo các tính năng:

 • Quản lý tài khoản người dùng, đăng ký người dùng
 • Yêu cầu nhận dạng, chụp ảnh hoặc scan ảnh văn bản, CMND/CCCD… kèm các chức năng tiền xử lý ảnh. Nhập số lượng lớn file cần nhận dạng
 • Quản lý lịch sử yêu cầu nhận dạng
 • Cấu hình nhận dạng
 • Cấu hình mẫu bóc tách thông tin thành cấu trúc hướng đối tượng giúp tích hợp với các ứng dụng Client crawl thông tin để import vào CSDL doanh nghiệp hoặc hệ thống Big Data

+84363906489