Đan Mạch là quốc gia dẫn đầu thế giới về phát triển Chính phủ điện tử trong năm 2018 và năm 2020. Bài viết giới thiệu mục tiêu, nội dung trọng tâm của Chương trình dữ liệu cơ bản và kinh nghiệm xây dựng cơ sở dữ liệu cơ bản của Đan Mạch. Trên cơ sở đó gợi mở một số vấn đề có thể tham khảo trong quá trình hoạch định các cơ sở dữ liệu dùng chung, cơ sở dữ liệu của bộ, ngành, địa phương ở Việt Nam.
Cơ sở dữ liệu cơ bản hay còn gọi là cơ sở dữ liệu lõi của Đan Mạch là khái niệm đề cập đến kho lưu trữ dữ liệu hoặc cơ sở dữ liệu trung tâm chứa dữ liệu cơ bản và cần thiết cho một lĩnh vực, một khu vực hoặc một tổ chức cụ thể. Những cơ sở dữ liệu này đóng vai trò là một nguồn thông tin quan trọng có thẩm quyền và là nền tảng để hỗ trợ các chức năng, dịch vụ và quy trình ra quyết định khác nhau. Trong bối cảnh chính phủ và nền hành chính công, cơ sở dữ liệu cơ bản của Đan Mạch thường bao gồm các thông tin quan trọng được sử dụng rộng rãi ở các phòng, ban, đơn vị, các cơ quan bộ, ngành, địa phương khác nhau.
Dữ liệu cơ bản của Đan Mạch
Chính phủ Đan Mạch đã xây dựng “Chương trình dữ liệu cơ bản” (hay còn gọi là dữ liệu lõi) nhằm cải thiện các cơ sở dữ liệu cơ bản trong khu vực nhà nước và cung cấp cho khu vực tư quyền truy cập miễn phú vào một số dữ liệu được chọn lọc trong các lĩnh vực như tài sản, địa chỉ, nước, khí hậu, địa lý, pháp nhân và cá nhân. Đối với đơn vị thuộc khối nhà nước, mục tiêu chính là tạo ra dữ liệu chung có thể sử dụng chung, có thể tham chiếu chung và được quản lý chung trên toàn bộ các lĩnh vực công ở Đan Mạch.
Hình 1. Dữ liệu cơ bản của Đan Mạch được sử dụng hàng ngày trong nhiều lĩnh vực khác nhau trong cơ quan hành chính công cũng như trong khu vực tư nhân.
Dữ liệu cơ bản của Đan Mạch bao gồm các dữ liệu về cá nhân; doanh nghiệp; bất động sản; địa chỉ, đường và khu vực; bản đồ địa lý được sử dụng hàng ngày trong nhiều lĩnh vực khác nhau (người lao động, phản hồi ứng cứu, dự án xây dựng, chăm sóc sức khỏe, lợi ích xã hội, thuế và các lợi ích khác…).
Chương trình Dữ liệu Cơ bản tạo ra một sổ đăng ký chung của Chính phủ để phân phối dữ liệu, được gọi là Nhà phân phối dữ liệu chung cho khu vực công. Chương trình này giới thiệu nguyên tắc chỉ một lần. Các tổ chức chính phủ, doanh nghiệp và công dân là ba bên hưởng lợi chính của chương trình này. Các cơ quan công quyền không thể yêu cầu người dùng cung cấp cùng một dữ liệu đã được cung cấp trước đó và phải lấy dữ liệu đó từ chính hệ thống. Yêu cầu này tránh việc sao chép các giao dịch thông tin giữa công dân và Chính phủ, đồng thời giảm đáng kể gánh nặng cho người dùng trong việc báo cáo thông tin và cho nhà cung cấp trong việc quản lý thông tin. Nhà phân phối Dữ liệu Cơ bản dựa trên việc chia sẻ và tái sử dụng các thông tin cốt lõi sau (thu thập trong 10 sổ đăng ký điện tử) mà các cơ quan công quyền sử dụng trong các quy trình dữ liệu hàng ngày của họ, chẳng hạn như: Dữ liệu cá nhân, dữ liệu doanh nghiệp, dữ liệu bất động sản, dữ liệu địa chỉ, dữ liệu địa lý, dữ liệu thu nhập. Chương trình này được chính quyền trung ương Đan Mạch phát triển hợp tác với chính quyền địa phương (hiệp hội các thành phố) và chia sẻ dữ liệu công dân và doanh nghiệp giữa tất cả các cơ quan công quyền ở các cấp khác nhau. Điều này ngăn chặn việc cung cấp nhiều lần cùng một thông tin cho các bộ phận khác nhau của khu vực công và giảm gánh nặng hành chính cho cả công dân và doanh nghiệp. Mục tiêu chính trong việc phát triển Nhà phân phối dữ liệu cơ bản là:
- Dữ liệu cơ bản cần phải chính xác, đầy đủ và cập nhật nhất có thể;
- Dữ liệu phải được thống nhất theo cùng một định dạng;
- Tất cả các cơ quan công quyền phải sử dụng dữ liệu cơ bản có trong Nhà phân phối trong các thủ tục hàng ngày của họ;
- Trong khả năng có thể, dữ liệu cơ bản (trừ dữ liệu cá nhân nhạy cảm) phải được cung cấp miễn phí cho cả doanh nghiệp và công chúng; cụ thể, mỗi sở sẽ chỉ được truy cập vào dữ liệu có liên quan đến hoạt động của mình và không phải tất cả dữ liệu sẽ được cung cấp cho tất cả mọi người (ví dụ: dữ liệu cá nhân từ Hệ thống đăng ký hộ tịch);
- Dữ liệu cơ bản phải được phân phối hiệu quả, đáp ứng nhu cầu của người dùng.
Văn bản thỏa thuận của Dự án chương trình dữ liệu cơ bản của Đan Mạch mô tả “quyền truy cập mở vào dữ liệu cơ bản đối với khối tư là một nguồn tiềm năng cho sự đổi mới, tăng trưởng và việc làm mới,… thúc đẩy thông tin có sẵn trong dữ liệu công có thể được sử dụng cho những loại sản phẩm và giải pháp kỹ thuật số hoàn toàn mới”.
Chương trình dữ liệu cơ bản đã và đang là một chương trình số hóa có ý nghĩa lịch sử và được coi là nền tảng quốc gia về cơ sở hạ tầng kỹ thuật số. Để đạt được một mục tiêu với một chương trình trải rộng bao gồm nhiều cơ quan công quyền thì cần có một định hướng chung và đặc biệt trong khu vực công và là một ví dụ về việc Đan Mạch đi đầu trên toàn cần về số hóa trong khu vực công.
Khi mới thành lập, Chương trình dữ liệu cơ bản của Đan Mạch là chương trình số hóa công cộng lớn nhất từ trước đến nay ở Đan Mạch và đã đặt ra các tiêu chuẩn mới cho những gì có thể đạt được thông qua hợp tác chung giữa các cơ quan thuộc Chính phủ. Chương trình bao gồm hàng trăm nhân viên ở các bộ, cơ quan, thành phố, khu vực, cơ quan phụ trách các cơ sở dữ liệu, tại các nhà cung cấp công nghệ thông tin và trong các nhóm người dùng.
Tầm nhìn của Dự án chương trình dữ liệu cơ bản được xây dựng vào năm 2010, cơ sở hợp đồng cho chương trình được xây dựng vào năm 2012 và chương trình được hoàn thành vào năm 2017 và đến năm 2019 tất cả các dữ liệu cơ bản được phân phối trên Nền tảng phân phối dữ liệu.
Chương trình dữ liệu cơ bản đã cải thiện chất lượng dữ liệu của các dữ liệu cơ bản thuộc khu vực khối công, bao gồm dữ liệu trong lĩnh vực tài sản và địa chỉ, bảo đảm việc sử dụng dữ liệu miễn phí cũng như thực hiện việc làm sạch dữ liệu một cách rộng rãi.
Chương trình dữ liệu cơ bản đã được đưa vào hoạt động với nền tảng phân phối chung đó là Nền tảng phân phối dữ liệu Đan Mạch. Nền tảng phân phối dữ liệu Đan Mạch cho phép cung cấp dữ liệu cơ bản miễn phí cho mục đích thương mại và phi thương mại. Việc phát triển Nền tảng phân phối dữ liệu Đan Mạch được coi là một đổi mới trong bối cảnh chung và đây là một lựa chọn mạnh mẽ và can đảm của Đan Mạch để thiết lập một sự tham vọng tạo ra quyền truy cập chung vào dữ liệu công cộng.
Các cơ sở dữ liệu cơ bản của Đan Mạch
Theo Chương trình dữ liệu cơ bản của Đan Mạch, các cơ sở dữ liệu cơ bản, cốt lõi được xác định từ năm 2012, bao gồm:
- Cơ sở dữ liệu về con người
- Cơ sở dữ liệu về pháp nhân
- Cơ sở dữ liệu về tài sản (ví dụ như các tòa nhà, nhà ở,…)
- Cơ sở dữ liệu về địa chỉ (ví dụ như đường, vị trí,…)
- Cơ sở dữ liệu về địa chính (ví dụ như thửa đất,…)
- Cơ sở dữ liệu về địa lý (ví dụ như bản đồ, địa hình,..)
Tính đến thời điểm hiện tại (tháng 12/2024), Đan Mạch đã đưa vào sử dụng thêm các cơ sở dữ liệu cơ bản khác, bao gồm:
- Cơ sở dữ liệu về chủ sở hữu: chứa các thông tin về cá nhân hoặc pháp nhân sở hữu bất động sản và người nhận thông báo liên quan đến bất động sản.
- Cơ sở dữ liệu về đánh giá tài sản: chứa các đánh giá về giá trị tài sản công cộng và đất đai để sử dụng cho việc tính thuế.
- Cơ sở dữ liệu về vị trí của tài sản: tham chiếu giữa tài sản và địa chỉ được sử dụng như là địa chỉ vị trí.
- Cơ sở dữ liệu các bức ảnh không gian quốc gia đã được xử lý sau khi chụp để sử dụng trong các bản đồ.
Cơ sở dữ liệu về con người của Đan Mạch
Cơ sở dữ liệu cơ bản về con người của Đan Mạch là cơ sở dữ liệu cấp quốc gia. Cơ sở dữ liệu này gán cho người dân sống ở Đan Mạch một số mã định danh (hay còn gọi là mã CPR) để xác định duy nhất các thông tin cơ bản của người dân đó. Cơ sở dữ liệu này sẽ hình thành những thông tin cơ bản nhất liên quan đến công dân, bất kể bối cảnh hay vai trò nào. Cơ sở dữ liệu sẽ lưu trữ các trường thông tin cơ bản của một cá nhân như: ngày tháng năm sinh, nơi sinh, gia đình, họ hàng, tình trạng hôn nhân và gia đình, nơi ở,…
Cơ sở dữ liệu này chỉ giới hạn các trường thông tin cơ bản, thông tin chính và các sự kiện chính trong cuộc đời của một con người. Việc truy cập cơ sở dữ liệu con người của Đan Mạch sẽ cung cấp thông tin cụ thể về tình trạng của một cá nhân, thường trú, pháp lý và mối quan hệ gia đình của một cá nhân cụ thể. Dữ liệu trong Cơ sở dữ liệu về con người của Đan Mạch có thể được sử dụng bởi cơ quan Chính phủ và các doanh nghiệp hoặc cá thể tư nhân mà được hợp pháp hóa và được chấp nhận bởi các bên liên quan.
Cơ sở dữ liệu pháp nhân
Cơ sở dữ liệu pháp nhân là cơ sở dữ liệu thông tin tổng thể về tất cả các pháp nhân tại Đan Mạch. Cơ sở dữ liệu này là cơ sở dữ liệu toàn diện và tập trung, chứa thông tin cơ bản về doanh nghiệp và các thực thể pháp lý khác (ví dụ như tổ chức, công ty,…) hoạt động tại Đan Mạch. Cơ sở dữ liệu pháp nhân gán một số nhận dạng duy nhất cho mỗi thực thể pháp nhân được đăng ký. Thông tin về sở hữu và quản lý pháp nhân bao gồm: tên lãnh đạo, giám đốc, đối tác, chủ sở hữu, hoặc các thông tin liên lạc của pháp nhân như địa chỉ, số điện thoại và địa chỉ email. Mỗi pháp nhân được phân loại theo ngành hoặc hoạt động kinh tế bằng cách sử dụng các hệ thống phân loại chuẩn hóa.
Cơ sở dữ liệu tài sản
Cơ sở dữ liệu tài sản thường được gọi là hệ thống Cơ sở dữ liệu tòa nhà, nhà ở hoặc hệ thống Cơ sở dữ liệu tài sản là một hồ sơ toàn diện về thông tin liên quan đến cấu trúc và tòa nhà trong một phạm vi lãnh thổ cụ thể. Cơ sở dữ liệu tài sản phục vụ các mục đích khác nhau, bao gồm quy hoạch đô thị, quản lý xây dựng, đánh giá tài sản và quản lý hành chính công.
Ví dụ một số thông tin về thực thể:
- Số tòa nhà: Thông tin định danh duy nhất một tòa nhà, trong bối cảnh của một tài sản. Một tài sản bao gồm một hoặc nhiều tòa nhà, một mảnh đất,…
- Thửa đất: Thông tin hệ thống địa chính được thiết kế để mô tả các thửa đất có chủ sở hữu và các đối tượng có thể có (tòa nhà,…). Một tòa nhà hoặc một tài sản sẽ liên quan đến một hoặc nhiều địa chính.
- Mối quan hệ với tài sản: Các tòa nhà (và các đối tượng khác, chẳng hạn như các hệ thống kỹ thuật được lắp đặt,…) đặt trong bối cảnh tài sản, nơi sở hữu được xác định. Các tài sản có thể chứa nhiều tòa nhà, đặt trên các địa chính khác nhau. Sở hữu của một tài sản bao gồm các tòa nhà trong tài sản, nhưng có thể không bao gồm địa chính mà tòa nhà đặt trên đó.
- Xây dựng và thiết bị: Một loạt các trường thông tin được lưu trữ trong cơ sở dữ liệu, mô tả các liệu xây dựng được sử dụng trong nền, tường, mái,… (gỗ, bê tông,…), thiết bị hoặc cài đặt như bếp, nhà vệ sinh, thang máy, điện, hệ thống sưởi,…
- Địa chỉ: Vị trí của tòa nhà với địa chỉ chính thức và vị trí địa lý (hay còn gọi là toạ độ của tòa nhà).
Cơ sở dữ liệu địa chỉ
Cơ sở dữ liệu địa chỉ đóng một vai trò quan trọng trong việc duy trì thông tin chính xác và cập nhật địa chỉ vật lý trong một khu vực địa lý cụ thể. Cơ sở dữ liệu địa chỉ là một yếu tố cơ bản trong cơ sở hạ tầng của một quốc gia, là một yếu tố nền tảng trong cơ sở hạ tầng của một quốc gia, hỗ trợ một loạt các chức năng hành chính, lập kế hoạch và định hướng dịch vụ.
Cơ sở dữ liệu địa chính
Cơ sở dữ liệu địa chính chứa thông tin về tất cả các số địa chính tại Đan Mạch, có nghĩa là tất các vị trí đất đai đã đăng ký trong quốc gia nơi quyền sở hữu được xác định.
Cơ sở dữ liệu địa chính chứa thông tin về các khu vực, bao gồm mọi khu vực đường hoặc nguồn nước liệt kê các điều kiện (ví dụ về tài sản nông nghiệp, tổng số bất động dản hoặc rừng).
Ví dụ một số thông tin về thực thể
- Tên/ID: Mỗi địa chính có một định danh duy nhất được xây dựng bởi hội chủ sở hữu và một số tham chiếu. Số tham chiếu là một số thứ tự trong hội, với mỗi số được chia nhỏ bằng một chữ cái để cho phép phân chia địa chính thành hai hoặc nhiều hơn.
- Vị trí địa lý: Bản đồ địa hình là một khu vực được mô tả bằng một hình đa giác. Ngoài khu vực địa hình, các vị trí của các đối tượng trong bản đồ địa hình (các tòa nhà, cài đặt, đường,…) cũng được mô tả.
- Khu vực sử dụng: Một số lượng lớn các thuộc tính khác nhau mô tả việc sử dụng khu vực. Việc sử dụng có thể do môi trường (rừng, hồ, bãi biển,…) hoặc do quyết định có kế hoạch (nhà thờ, đường sắt,…).
- Biên giới: Các ranh giới giữa các khu vực địa hình liên quan đến quyền sở hữu tài sản, được lưu trong cơ sở dữ liệu.
Cơ sở dữ liệu địa lý
Đây là cơ sở dữ liệu chứa các đại diện địa lý của các thực thể được tìm thấy trong các cơ sở dữ liệu cơ bản khác. Dữ liệu được lưu dưới dạng:
- Dữ liệu véctor (thông tin không gian địa lý sử dụng các yếu tố kỹ thuật số như điểm, đường và hình đa giác để biểu thị các mốc địa lý).
- Dữ liệu raster (mô hình dữ liệu không gian địa lý xác định không gian dưới dạng lưới gồm các ô có kích cỡ bằng nhau).
- Dữ liệu Point Cloud (các điểm dữ liệu trong không gian, mô tả kết cấu hoặc một vật thể địa lý dưới dạng 3D).
Mục đích của Cơ sở dữ liệu địa lý là thêm khả năng không gian cho các cơ sở dữ liệu khác, hỗ trợ biểu diễn hình ảnh của dữ liệu cho bản đồ hoặc phân tích.
Một số gợi mở đối với Việt Nam
Một là, các bộ, ngành, địa phương cần sớm hoạch định các cơ sở dữ liệu dùng chung, cơ sở dữ liệu chuyên ngành của các bộ, ngành, địa phương, xác định rõ mục tiêu, yêu cầu, lộ trình thực hiện cụ thể cho từng cơ sở dữ liệu, tập trung triển khai hiệu quả theo định hướng của Chính phủ, Thủ tướng Chính phủ.
Hai là, xây dựng môi trường pháp lý, chính sách bảo đảm an toàn an ninh, tin cậy cho việc xây dựng các cơ sở dữ liệu. Ban hành các quy định để chuẩn hóa, phát triển, kết nối, chia sẻ, cập nhật dữ liệu; trách nhiệm, phân cấp, quản lý, kết nối dữ liệu.
Ba là, Chính phủ chỉ đạo các bộ, ngành, địa phương xây dựng đồng bộ cơ sở dữ liệu quốc gia, cơ sở dữ liệu dùng chung, cơ sở dữ liệu chuyên ngành trên tất cả các lĩnh vực từ Trung ương đến địa phương, hình thành các hệ thống dữ liệu tin cậy, ổn định của các cơ quan nhà nước, tổ chức, doanh nghiệp. Các bộ, ngành xây dựng khung kiến trúc dữ liệu đối với từng ngành, lĩnh vực, xác định rõ trách nhiệm cập nhật cơ sở dữ liệu của các cấp, tránh thông tin của cơ sở dữ liệu bị lạc hậu, không đúng với hiện trạng, giảm giá trị khai thác, tra cứu, đáp ứng yêu cầu theo Nghị định số 47/2020/NĐ-CP ngày 09/4/2020 của Chính phủ quy định về quản lý, kết nối và chia sẻ dữ liệu số của cơ quan nhà nước.
Trần Chí Nam
Tài liệu tham khảo
The Danish Basic Data Program, the Data-Distributor (Datafordeleren) and the Covid-19 Pandemic June 2022.
The basic data program.