Dữ liệu giấy đang làm “mù mắt” AI và chính quyền số? Đừng để hạ tầng dữ liệu lạc nhịp sau sáp nhập – khám phá giải pháp số hóa tài liệu và chuẩn hóa ngay.
Tưởng rằng đã có AI – nhưng lại vấp phải “điểm mù” dữ liệu giấy
Trong bối cảnh các địa phương đang gấp rút triển khai các chương trình chuyển đổi số hậu sáp nhập, trí tuệ nhân tạo (AI) được xem là công cụ chiến lược giúp nâng cao hiệu quả quản trị và phục vụ người dân. Không ít địa phương kỳ vọng AI sẽ đóng vai trò “bộ não thông minh” xử lý hàng loạt quy trình hành chính một cách chính xác và hiệu quả hơn.
Thế nhưng trên thực tế, một rào cản căn bản đã nhanh chóng bộc lộ – đó chính là nền tảng dữ liệu chưa sẵn sàng. Khi phần lớn thông tin vẫn nằm rải rác trên giấy tờ, hồ sơ vật lý, việc tích hợp vào hệ thống để AI xử lý gần như là bất khả thi. Những tập hồ sơ dân cư, bản đồ đất đai, hay giấy tờ hộ tịch còn nằm trong tủ sắt, chưa được số hóa, đã trở thành “điểm mù” khiến AI không thể đọc – không thể học – và không thể thực hiện bất kỳ tác vụ nào.
Theo Báo Chính phủ ngày 16/6/2025: “AI là công cụ giúp xử lý thủ tục nhanh gọn hơn sau sáp nhập. Tuy nhiên, cần hạ tầng dữ liệu đủ sạch, đủ số, đủ chuẩn.”

Tác động thực tế: Chính quyền địa phương đang đối mặt với điều gì?
Sau các quyết định sáp nhập hành chính cấp xã, huyện trên toàn quốc, hàng nghìn đơn vị hành chính mới được thiết lập. Điều này kéo theo yêu cầu bắt buộc về việc cập nhật lại toàn bộ thông tin hành chính trong cơ sở dữ liệu – từ địa giới hành chính, mã đơn vị, đến các hồ sơ dân cư, đất đai, hộ tịch.
Tuy nhiên, một phần lớn dữ liệu vẫn đang nằm dưới dạng giấy tờ vật lý, chưa được số hóa, dẫn đến:
- Việc cập nhật thông tin mất nhiều thời gian do phải tra cứu và chỉnh lý thủ công
- Tình trạng thông tin cũ/lỗi chưa được đồng bộ khiến quy trình xử lý hồ sơ bị nghẽn, kéo dài thời gian giải quyết
- Dữ liệu không chính xác dẫn đến sai lệch trong quản lý hộ tịch, đất đai, ảnh hưởng đến quyền lợi chính đáng của người dân và gây áp lực cho cán bộ tiếp nhận hồ sơ.
Vì sao AI cần dữ liệu số hóa để hoạt động hiệu quả?
AI không thể hoạt động hiệu quả nếu không có nguồn dữ liệu phù hợp để “nuôi” nó. Điều mà nhiều người lầm tưởng là AI có thể tự động hóa mọi thứ – nhưng thực tế, để một mô hình AI vận hành đúng cách, nó cần được cung cấp dữ liệu có cấu trúc, đầy đủ, chuẩn hóa và dễ truy xuất. Khi dữ liệu còn nằm trong các tài liệu giấy rời rạc, hệ thống AI sẽ bị “bịt mắt”, không thể thực hiện chức năng phân tích, học hỏi hay đưa ra đề xuất chính xác.
Những hạn chế cụ thể khi dữ liệu chưa số hóa bao gồm:
- AI không thể đọc hiểu: vì dữ liệu không thể được truy cập, phân tích tự động.
- AI không thể học được: vì dữ liệu thiếu gắn nhãn, không theo cấu trúc chuẩn khiến mô hình không thể huấn luyện.
- AI không thể hành động: do thiếu dữ liệu đầu vào, mô hình không thể tạo ra dự đoán hay hỗ trợ ra quyết định.
Trường hợp điển hình:
- Một hệ thống AI hỗ trợ cấp sổ đỏ tại địa phương không thể xử lý yêu cầu nếu thông tin địa giới, diện tích và mã thửa vẫn nằm trên bản đồ giấy hoặc biên bản viết tay.
- Chatbot AI triển khai tại bộ phận một cửa không thể trả lời chính xác nếu thiếu dữ liệu dân cư được gắn nhãn, liên kết với quy trình xử lý cụ thể.

Giải pháp: Từ số hóa tài liệu đến xây dựng hệ thống dữ liệu dùng chung
Để chuyển đổi số không chỉ dừng lại ở “hình thức điện tử hóa”, các địa phương cần triển khai đồng bộ nhiều lớp giải pháp – từ việc chuyển đổi dữ liệu giấy sang dạng số, chuẩn hóa dữ liệu để dễ tích hợp, đến xây dựng hệ thống dữ liệu dùng chung phục vụ vận hành thông minh và hỗ trợ AI. Cụ thể:
Chuẩn hóa dữ liệu: Tạo nền tảng cho tích hợp và ra quyết định
Việc chuẩn hóa dữ liệu không chỉ giúp giảm trùng lặp, sai lệch mà còn là điều kiện bắt buộc để các hệ thống số và AI có thể “hiểu” và phân tích. Các bước then chốt gồm:
- Gắn định danh thống nhất cho các mã địa giới hành chính, dân cư, hộ tịch, cán bộ, tránh xung đột khi kết nối liên thông.
- Áp dụng cấu trúc dữ liệu chuẩn mở như XML, JSON – cho phép tích hợp dễ dàng với các hệ thống quản lý hiện có và nền tảng chia sẻ LGSP cấp tỉnh.
- Thiết lập cơ chế kiểm tra chéo và đối soát định kỳ giữa các cấp xã – huyện – tỉnh nhằm phát hiện và xử lý xung đột dữ liệu.
Năm 2024, tỉnh Lạng Sơn đã hoàn tất chuẩn hóa hơn 600.000 bản ghi hộ tịch qua hệ thống phần mềm dùng chung của Bộ Tư pháp và phát hiện hơn 25.000 trường hợp trùng thông tin nhờ kiểm tra chéo liên cấp.
Số hóa thông minh bằng công nghệ OCR + AI/KIE
Không phải mọi dữ liệu đều đã có sẵn dạng điện tử. Vì vậy, ứng dụng công nghệ số hóa thông minh đang trở thành đòn bẩy quan trọng:
- Công nghệ OCR hiện đại có khả năng nhận diện chữ viết tay, chữ in, chữ ký từ bản scan và tài liệu gốc – kể cả mẫu không cố định.
- Kết hợp AI trích xuất thông tin quan trọng (Key Information Extraction – KIE), hệ thống có thể tự động bóc tách họ tên, địa chỉ, số định danh, ngày tháng… và chuyển đổi thành dữ liệu có cấu trúc, sẵn sàng đưa vào hệ thống.
Triển khai công nghệ AI trích xuất dữ liệu tại hơn 15 bang tại Mỹ đã giúp giảm từ 40–60% thời gian xử lý hồ sơ giấy so với nhập liệu thủ công.
Tại Việt Nam, tỉnh Quảng Nam và Bình Phước đã áp dụng công nghệ tương tự trong số hóa sổ hộ tịch, với tốc độ bóc tách nhanh gấp 10 lần và độ chính xác trên 95%.
Xây dựng hệ thống dữ liệu dùng chung – nền tảng cho AI và liên thông số
Một hệ thống AI không thể hoạt động hiệu quả nếu chỉ tiếp cận thông tin một chiều hoặc dữ liệu phân mảnh. Giải pháp là hình thành hệ thống dữ liệu dùng chung cấp tỉnh:
- Thiết lập kho dữ liệu tập trung, kết nối đa nguồn từ các sở – ngành: nội vụ, tư pháp, tài nguyên môi trường, y tế, giáo dục, hành chính công…
- Áp dụng mô hình kết nối phân quyền: mỗi đơn vị được phân cấp truy cập theo vai trò, vừa bảo mật, vừa đảm bảo truy xuất hiệu quả.
- Cung cấp API mở để các nền tảng quản lý, trợ lý ảo AI có thể truy cập thông tin đa chiều, hỗ trợ phân tích và ra quyết định hành chính nhanh chóng.
“Các phương pháp này phục vụ hai mục tiêu chính gồm, dữ liệu cho AI – hỗ trợ tự động hóa và phân tích thông minh; dữ liệu cho quản trị – phục vụ hoạch định và ra quyết định chính sách.”
– Bà Đặng Thị Ánh Tuyết, CEO & Founder MedCAT, tại tọa đàm “Xử lý và phân tích dữ liệu – Động lực cho chuyển đổi số quốc gia” ngày 28/5/2025.
FSI – Nhà cung cấp giải pháp số hóa hàng đầu Việt Nam

Với hơn 17 năm kinh nghiệm, FSI là đơn vị tiên phong cung cấp giải pháp số hóa tài liệu và chuẩn hóa dữ liệu phục vụ cho chính quyền điện tử.
- Đã triển khai cho hơn 1.600 khách hàng là các cơ quan, đơn vị hành chính, doanh nghiệp lớn trên toàn quốc.
- Sở hữu công nghệ hiện đại: AI, Maching Learning, … do FSI nghiên cứu và phát triển giúp dễ dàng tích hợp với phần mềm nghiệp vụ hiện có của khách hàng.
- Quy trình triển khai an toàn, bảo mật được chuẩn hóa theo tiêu chuẩn ISO/IEC 27001: 2013.
- Đội ngũ hơn 300 kỹ sư và chuyên gia hàng đầu Việt Nam đồng hành từ tư vấn chiến lược đến triển khai vận hành.
- Ghi dấu ấn với hàng loạt dự án lớn, được đánh giá cao bởi các tổ chức nhà nước và doanh nghiệp lớn.
Dữ liệu chưa số hóa đang là “điểm mù” cản trở chính quyền số và trí tuệ nhân tạo vận hành hiệu quả sau sáp nhập. Hãy bắt đầu ngay từ hôm nay – chuẩn hóa và số hóa dữ liệu theo đúng chuẩn, xây dựng hệ thống dữ liệu dùng chung vững chắc để không lỡ nhịp trong hành trình chuyển đổi số toàn diện.
FSI cam kết đồng hành cùng cơ quan nhà nước và doanh nghiệp trong chuyển đổi dữ liệu – chuyển đổi số – chuyển hóa hiệu quả!
Xem thêm: