Dữ liệu là nền tảng vô cùng quan trọng đối với mọi tổ chức và doanh nghiệp ngày nay. Dữ liệu là tập hợp các thông tin và các sự kiện được tổng hợp và tổ chức thành dạng có thể được lưu trữ, xử lý và truyền tải. Trong bối cảnh kỹ thuật số, văn bản, hình ảnh, âm thanh… có thể được xử lý bởi máy tính.
Mạch sống của xã hội số là dữ liệu. Chính phủ nắm giữ một lượng dữ liệu lớn, tiềm ẩn giá trị đáng kể cho cả khu vực công và khu vực tư. Nếu sử dụng hiệu quả nguồn dữ liệu này, đồng thời tuân thủ các yêu cầu ngày càng cao về bảo vệ dữ liệu và quyền riêng tư, chúng ta có thể đơn giản hóa quy trình cung cấp dịch vụ công, giảm thiểu gian lận và sai sót do yếu tố con người, cũng như thúc đẩy hiệu quả hoạt động của chính phủ.
Mặc dù tiềm năng là rất lớn, nhiều chính phủ trên thế giới vẫn chưa khai thác hiệu quả cơ hội này. Nguyên nhân chủ yếu là do dữ liệu thường phân tán trong nhiều hệ thống quản lý riêng biệt (các tập dữ liệu được các đơn vị chính phủ sử dụng cho các mục đích cụ thể) và được quản lý bởi các bộ phận hoạt động độc lập. Dữ liệu thường được lưu trữ ở các định dạng khó xử lý hoặc không thể truy cập bằng phương tiện kỹ thuật số. Điều này dẫn đến tình trạng thiếu hụt dữ liệu khi cần thiết, cản trở tiến trình xây dựng chính phủ số và hạn chế tính minh bạch về dữ liệu mà chính phủ lưu trữ về người dân cũng như cách thức dữ liệu được sử dụng.
Trong bối cảnh các xã hội đang nỗ lực tăng cường quản lý dữ liệu, các vấn đề như quyền sở hữu dữ liệu, bảo vệ quyền riêng tư và các biện pháp phòng chống vi phạm bảo mật cần được mỗi chính phủ xem xét và giải quyết. Mục tiêu của văn bản này là phân tích những lợi ích của việc quản lý dữ liệu hiện đại và đề xuất các phương hướng để đạt được mục tiêu đó.
I. Dữ liệu chính phủ có thể tương tác và kết nối mang lại những lợi ích đáng kể.
Cuộc khủng hoảng COVID-19 đã làm nổi bật tầm quan trọng của dữ liệu, vốn là yếu tố then chốt trong việc quản lý tác động của đại dịch tại nhiều quốc gia. Đơn cử, Đức đã sử dụng dữ liệu để theo dõi số lượng giường hồi sức tích cực (ICU) và quản lý số ca nhập viện gia tăng đột biến. Tương tự, một số quốc gia khác, bao gồm Vương quốc Anh, Ireland, Bồ Đào Nha và Hàn Quốc, đã xây dựng các bảng điều khiển (dashboard) nhằm hỗ trợ các nhà hoạch định chính sách theo dõi diễn biến của đại dịch.
Giá trị của dữ liệu khu vực công không chỉ giới hạn trong bối cảnh đại dịch mà còn lan tỏa đến nhiều khía cạnh của xã hội và nền kinh tế. Tuy nhiên, thách thức đối với nhiều chính phủ nằm ở khả năng tiếp cận dữ liệu, thường bị hạn chế do sự phân tán dữ liệu trong nhiều hệ thống đăng ký chuyên biệt, phục vụ các mục đích riêng lẻ. Việc liên kết và tích hợp thông tin tốt hơn có thể mang lại những lợi ích đáng kể.
Để khai thác tối đa tiềm năng của dữ liệu, các chính phủ có thể xây dựng một hệ thống dữ liệu tương tác và kết nối, đảm bảo dữ liệu do bất kỳ cơ quan chính phủ nào thu thập đều sẵn sàng khi cần thiết, đồng thời bảo vệ an ninh và quyền riêng tư dữ liệu, cũng như áp dụng đầy đủ các biện pháp (pháp lý, kỹ thuật và tổ chức) nhằm ngăn chặn việc lạm dụng dữ liệu. Nếu các chính phủ có thể triển khai thành công hệ thống này, sẽ có những lợi ích thiết thực trong sáu lĩnh vực chính (Hình 1).
(Hình 1: Sơ đồ minh họa sáu lĩnh vực lợi ích)
1. Nâng cao trải nghiệm người dân
Việc tiếp cận dịch vụ công thường đòi hỏi người dân và doanh nghiệp cung cấp dữ liệu và tài liệu đã được cung cấp trước đó. Nếu dữ liệu được thu thập trên toàn hệ thống chính phủ dễ dàng tiếp cận hơn, các dịch vụ công có thể áp dụng nguyên tắc "chỉ một lần", theo đó dữ liệu chỉ cần được cung cấp một lần duy nhất, giúp tiết kiệm thời gian và giảm thiểu các thao tác nhập liệu thủ công. Một lợi ích khác là khả năng cung cấp dịch vụ một cách chủ động; dữ liệu mới sẽ tự động kích hoạt phản hồi khi có nhu cầu. Estonia đã triển khai hiệu quả chức năng này. Đơn cử, việc đăng ký khai sinh cho trẻ sơ sinh sẽ tự động kích hoạt việc chi trả các khoản trợ cấp chăm sóc trẻ em, với dữ liệu từ sổ đăng ký thuế được sử dụng để xác định số tiền và tài khoản ngân hàng thụ hưởng.
2. Tăng hiệu quả hành chính
Việc tra cứu và thu thập dữ liệu thủ công từ các cơ quan chính phủ khác và từ người dân thường là yêu cầu đối với cán bộ, công chức. Dữ liệu tương tác và kết nối sẽ cho phép các cơ quan chính phủ tối ưu hóa quy trình nghiệp vụ, giảm thiểu khó khăn và rút ngắn thời gian xử lý. Lợi ích tiềm năng là rất lớn, áp dụng cho cả việc cung cấp dịch vụ công và các hoạt động định kỳ như điều tra dân số. Tại Đức, việc triển khai hệ thống dữ liệu tương tác và kết nối được ước tính sẽ giúp giảm 60% thời gian xử lý hồ sơ đối với các dịch vụ công chủ yếu. Trong lĩnh vực điều tra dân số, các quốc gia tiên tiến về công nghệ như Hà Lan đã khai thác hoàn toàn dữ liệu từ các cơ sở dữ liệu hiện có. Cách tiếp cận này giúp tiết kiệm đến 99% chi phí so với phương pháp điều tra truyền thống dựa trên khảo sát.
3. Hỗ trợ hoạch định chính sách dựa trên dữ liệu
Dữ liệu chất lượng cao và khả năng tiếp cận dữ liệu đóng vai trò quan trọng trong việc hoạch định chính sách hiệu quả. Đơn cử, tại Đan Mạch, Chính phủ đã ứng dụng dữ liệu địa lý để mô phỏng các kịch bản lũ lụt, qua đó nâng cao năng lực quản lý khủng hoảng và cải thiện các quyết định đầu tư dài hạn. Để xây dựng các mô hình phức tạp, dữ liệu từ một số cơ sở dữ liệu chính (ví dụ: Sổ địa chính, thông tin về tòa nhà và địa chỉ) được kết hợp với dữ liệu địa hình 3D. Các nghiên cứu đã chỉ ra rằng việc ứng dụng dữ liệu theo hình thức này mang lại hiệu quả kinh tế cao.
4. Cung cấp giá trị dữ liệu mở
Chính phủ có vai trò then chốt trong việc cung cấp dữ liệu, bao gồm cả dữ liệu thô và số liệu thống kê chính thức, từ đó tạo ra cơ hội khai thác giá trị dữ liệu mở ước tính trị giá 3 nghìn tỷ đô la cho khu vực tư nhân và xã hội dân sự. Tuy nhiên, nhiều tập dữ liệu được công bố trên các cổng dữ liệu mở hiện nay vẫn còn được trích xuất từ các nguồn thông tin riêng lẻ. Việc xây dựng và vận hành các hệ thống dữ liệu tương tác và kết nối, kết hợp với các biện pháp bảo vệ phù hợp, sẽ cho phép công bố các tập dữ liệu toàn diện và chuyên sâu hơn.
5. Tăng cường bảo vệ dữ liệu và quyền riêng tư
Việc xây dựng hệ thống dữ liệu chính phủ tương tác và kết nối có thể làm phát sinh quan ngại về khả năng chính phủ giám sát quá mức. Tuy nhiên, hệ thống quản lý dữ liệu hiện tại cũng tiềm ẩn những thách thức về bảo vệ quyền riêng tư. Thông thường, người dân không thể tiếp cận dữ liệu cá nhân của mình, cũng như không được biết dữ liệu được lưu trữ ở đâu, thời điểm và lý do truy cập. Ngược lại, một hệ thống dữ liệu hiện đại cho phép áp dụng bảo mật theo thiết kế. Việc trao đổi dữ liệu được thực hiện một cách có cấu trúc và an toàn, giúp giảm số lượng người tiếp xúc với dữ liệu và nguy cơ rò rỉ. Đồng thời, hệ thống này tạo điều kiện cho người dân được hưởng lợi từ tính minh bạch cao hơn và chủ động quản lý việc đồng ý chia sẻ dữ liệu. Chính phủ có thể công khai thông tin về dữ liệu nào được lưu trữ, ở đâu và cung cấp nhật ký các tương tác kỹ thuật số, cho phép người dùng lựa chọn tham gia hoặc không tham gia vào các trường hợp sử dụng cụ thể. Chẳng hạn, hệ thống theo dõi dữ liệu của Estonia cho phép công dân kiểm tra các truy vấn dữ liệu liên quan đến thông tin cá nhân của họ, bao gồm cả lý do truy cập
6. Giảm gian lận, lãng phí và lạm dụng
Một phần không nhỏ các khoản chi của chính phủ bị thất thoát do lỗi hoặc gian lận, như chuyển tiền sai đối tượng, chuyển số tiền không chính xác hoặc sử dụng sai mục đích các khoản thanh toán. Tại Hoa Kỳ, các cơ quan trên toàn chính phủ ước tính đã thực hiện các khoản thanh toán không đúng quy định trị giá 175 tỷ đô la vào năm 2019. Dữ liệu chính phủ tương tác và kết nối có thể góp phần giảm thiểu rủi ro thất thoát này bằng cách giảm thiểu lỗi do các thao tác thủ công và dữ liệu không nhất quán giữa các hệ thống đăng ký, đồng thời cho phép chính phủ sử dụng các công cụ phân tích để phát hiện gian lận. Estonia tiếp tục là quốc gia tiên phong trong lĩnh vực này, bằng việc kết hợp thông tin từ sổ đăng ký nông nghiệp với hình ảnh vệ tinh để phân tích việc sử dụng đất được hỗ trợ bởi các khoản trợ cấp của chính phủ.
Mặc dù một số quốc gia đã đạt được những tiến bộ nhất định, công tác quản lý dữ liệu chính phủ nhìn chung vẫn đang đối mặt với ba thách thức chính sau:
Phân tán dữ liệu: Để khai thác dữ liệu được lưu trữ trong các hệ thống đăng ký, các cơ quan cần xác định được vị trí dữ liệu. Tuy nhiên, điều này thường rất khó thực hiện. Thực tế cho thấy, các chính phủ thường gặp khó khăn trong việc xác định dữ liệu nào nằm trong hệ thống đăng ký nào, hoặc thậm chí là xác định sự tồn tại của các hệ thống đăng ký. Điều này dẫn đến tình trạng thiếu minh bạch về việc một điểm dữ liệu cụ thể có tồn tại trong hệ thống chính phủ hay không, liệu nó có được lưu trữ ở nhiều hệ thống đăng ký hay không, và dữ liệu cập nhật nhất có thể được tìm thấy ở đâu.
Khả năng truy cập dữ liệu hạn chế: Nhiều hệ thống đăng ký vẫn còn được lưu trữ dưới dạng văn bản trên giấy, gây ra chi phí đáng kể và tạo gánh nặng hành chính, đồng thời khiến việc sử dụng dữ liệu một cách hệ thống trở nên bất khả thi. Ngay cả khi các hệ thống đăng ký được số hóa, khả năng truy cập dữ liệu thường không được chuẩn hóa. Để các cơ quan khác có thể truy cập dữ liệu, cần có thêm các cơ sở hạ tầng hỗ trợ, chẳng hạn như kết nối an toàn hoặc API.
Khả năng tương tác dữ liệu thấp: Có nhiều rào cản cản trở việc kết hợp và xử lý chung dữ liệu được lưu trữ tại các cơ quan khác nhau.
II. Các hành động then chốt để triển khai thành công dữ liệu Chính phủ tương tác và kết nối
Mặc dù còn tồn tại nhiều thách thức, những lợi ích thiết thực từ việc triển khai hệ thống dữ liệu chính phủ tương tác và kết nối là không thể phủ nhận. Để hỗ trợ quá trình chuyển đổi này, các chính phủ có thể xem xét và triển khai năm hành động then chốt, được đúc kết từ kinh nghiệm của các quốc gia tiên phong.
1. Đặt ra tầm nhìn rõ ràng dựa trên các trường hợp sử dụng hữu hình
Tiếp cận triển khai dữ liệu tương tác và kết nối trong Chính phủ theo từng giai đoạn.
Việc thiết kế lại toàn bộ hệ thống dữ liệu của chính phủ là một nhiệm vụ phức tạp và đòi hỏi nguồn lực lớn. Do đó, các chính phủ nên áp dụng phương pháp tiếp cận từng bước, bắt đầu bằng việc xây dựng một tầm nhìn chiến lược tập trung vào các trường hợp sử dụng cụ thể, mang lại kết quả rõ ràng và hữu hình. Đơn cử, Chính phủ Áo đã quyết định vào năm 2000 rằng cuộc điều tra dân số tiếp theo sẽ là lần thực hiện cuối cùng theo phương pháp truyền thống và bắt đầu chuẩn bị cho cuộc điều tra dân số kỹ thuật số đầu tiên vào năm 2011. Tương tự, Đan Mạch đã tập trung vào việc nâng cao chất lượng và khả năng tiếp cận đối với một nhóm nhỏ các "grunddata"—dữ liệu cơ bản—thường được sử dụng liên quan đến con người, tổ chức và địa điểm. Trong bối cảnh này, các trường hợp sử dụng ban đầu cần đại diện cho một tập hợp lớn hơn các ứng dụng liên quan (ví dụ: các dịch vụ chính phủ tương đương) nhằm đảm bảo khả năng chuyển giao trong tương lai và tránh việc phát triển các sáng kiến có phạm vi quá hẹp.
2. Hiểu và điều hướng hệ thống dữ liệu liên quan
Xây dựng bản đồ hệ thống dữ liệu cho các trường hợp sử dụng ưu tiên.
Sau khi xác định rõ tầm nhìn chiến lược, các chính phủ cần thiết lập cơ chế minh bạch về hệ thống dữ liệu liên quan cho các trường hợp sử dụng được ưu tiên. Quá trình này đòi hỏi việc lập bản đồ chi tiết các hệ thống đăng ký liên quan, bao gồm cả các đặc điểm ngữ nghĩa và kỹ thuật. Việc lập bản đồ này cho phép các chính phủ nắm bắt đầy đủ thông tin về dữ liệu hiện có và vị trí lưu trữ, hay nói cách khác là “biết những gì họ biết”. Thông qua đó, chính phủ sẽ xác định được những điểm thiếu hụt dữ liệu quan trọng và những trường hợp dữ liệu được lưu trữ ở nhiều hệ thống đăng ký. Tại Estonia, nhiệm vụ này được thực hiện bởi Cơ quan Hệ thống Thông tin, đơn vị quản lý RIHA—một danh mục các hệ thống thông tin của chính phủ. Danh mục này cung cấp thông tin về hơn 2.600 hệ thống thông tin, bao gồm tổng quan về mục đích, phương thức lưu trữ và quản lý dữ liệu.
3. Cung cấp các thành phần cơ sở hạ tầng liêu quan một cách tập trung
Xây dựng các thành phần tiêu chuẩn cho khả năng chia sẻ dữ liệu trong Chính phủ.
Các chính phủ có thể xây dựng một bộ các thành phần tiêu chuẩn, tạo điều kiện thuận lợi cho việc chia sẻ dữ liệu trong nhiều trường hợp sử dụng khác nhau. Thông qua việc này, dữ liệu chính phủ được lưu trữ phân tán trong các hệ thống riêng biệt có thể được kết nối và tương tác ở quy mô lớn. Một ví dụ điển hình là hệ thống X-Road, được phát triển bởi Chính phủ Estonia vào năm 2001.
Một cơ sở hạ tầng trung tâm cho việc trao đổi dữ liệu an toàn giữa các đơn vị khu vực công và các bên thứ ba thường bao gồm ít nhất năm thành phần cụ thể (Hình 2)
Hình 2 Năm thành phần cụ thể
- Định danh duy nhất. Quản lý danh tính là chìa khóa để tương tác. Các định danh bằng số hoặc chữ và số (ví dụ: cá nhân, công ty hoặc tòa nhà) là cần thiết để kết nối rõ ràng và hiệu quả dữ liệu được lưu trữ trong các nguồn khác nhau với một thực thể duy nhất. Chính phủ Áo đã thiết lập các định danh theo từng lĩnh vực để tăng cường bảo vệ dữ liệu. Ở Pháp, nhóm quản lý dữ liệu của chính phủ đã xây dựng dựa trên cơ sở hạ tầng hiện có và tận dụng số an sinh xã hội làm mã định danh bao quát.
- Tiêu chuẩn kỹ thuật. Trao đổi dữ liệu nhanh chóng và tự động chỉ có thể thực hiện được thông qua các định dạng và tiêu chuẩn dữ liệu được hài hòa. Ở Thụy Sĩ, các cơ sở dữ liệu công lưu trữ thông tin tương tự sử dụng các định dạng dữ liệu nhất quán trên tất cả các kho lưu trữ và có một quy trình được thiết lập để trao đổi dữ liệu thông qua một giao thức chung an toàn (được gọi là sedex hoặc trao đổi dữ liệu an toàn).
- Danh bạ dịch vụ. Để thiết lập trao đổi dữ liệu tự động, cần có một danh bạ chứa các tham số kỹ thuật của mọi nhà cung cấp dữ liệu. Điều này sẽ cung cấp thông tin định tuyến cho người tiêu dùng dữ liệu và ngược lại. Ở Đức, "Danh bạ Dịch vụ Hành chính" đóng vai trò là cơ sở hạ tầng liên ngành và liên hành chính. Nó cung cấp tự động hóa an toàn và đáng tin cậy các dịch vụ và quy trình để liên lạc giữa và với các thực thể công.
- Các trung gian để trao đổi dữ liệu an toàn. Để ngăn chặn việc hợp nhất dữ liệu cá nhân không được phép, việc trao đổi dữ liệu giữa các thực thể chính phủ thường được thiết lập thông qua các bên trung gian kỹ thuật. Các bên trung gian chỉ có thể truy cập siêu dữ liệu của một trao đổi—ai là người gửi, ai là người nhận và lý do trao đổi dữ liệu—nhưng không phải nội dung thực tế của nó, do đó giúp thiết lập các luồng dữ liệu an toàn. Đôi khi, chức năng của các bên trung gian được thực hiện bởi cái gọi là cổng, cung cấp các chức năng bổ sung như dịch giữa các định dạng và tiêu chuẩn dữ liệu khác nhau. Thông qua các cổng an toàn, các sổ đăng ký có thể được các thực thể khu vực công và các bên thứ ba dễ dàng truy cập, cho phép chính phủ trở thành một phần của nền kinh tế API. Ví dụ: cơ sở hạ tầng PEPPOL cho mua sắm điện tử xuyên biên giới do EU khởi xướng sử dụng "Điểm truy cập" an toàn làm trung gian để thiết lập kết nối dữ liệu an toàn.
- Theo dõi dữ liệu và quản lý sự đồng ý. Công dân mong đợi có được sự minh bạch và kiểm soát về cách chính phủ sử dụng dữ liệu của họ. Điều này cân bằng với sự dễ dàng về kỹ thuật ngày càng tăng mà các cơ quan công có thể truy cập thông tin của họ. Estonia cũng là nước tiên phong trong lĩnh vực này. Trình theo dõi dữ liệu của họ cho phép công dân xem xét các truy vấn liên quan đến thông tin cá nhân của họ, bao gồm cả lý do truy cập. Đức đang lên kế hoạch tiến thêm một bước nữa và cho phép công dân không chỉ theo dõi các truy vấn mà còn đưa ra và rút lại sự đồng ý về việc sử dụng cụ thể dữ liệu cá nhân của họ.
4. Triển khai nhanh chóng các trường hợp sử dụng đầu cuối thông qua các nhóm dữ liệu linh hoạt
Mặc dù quá trình hiện đại hóa toàn diện hệ thống dữ liệu là một nhiệm vụ phức tạp và tốn nhiều thời gian, các chính phủ vẫn có thể thiết lập và duy trì sự tập trung vào việc tạo ra các tác động nhanh chóng và hữu hình. Việc không đạt được kết quả ban đầu có thể làm giảm sự ủng hộ từ các bên liên quan. Hơn nữa, việc triển khai sớm các trường hợp sử dụng giúp các chính phủ xác định những khoảng trống trong hệ thống dữ liệu (ví dụ: thiếu thông tin hữu ích trong các hệ thống đăng ký) và các chức năng còn thiếu trong cơ sở hạ tầng trao đổi dữ liệu trung tâm.
Để tạo ra tác động nhanh chóng, các chính phủ có thể triển khai các "nhóm dữ liệu linh hoạt"—các đơn vị triển khai linh hoạt với đội ngũ chuyên gia đa lĩnh vực, tập trung vào các trường hợp sử dụng cụ thể. Các giải pháp được phát triển, thử nghiệm và điều chỉnh nhanh chóng, sau đó được triển khai trên quy mô lớn khi chứng minh được hiệu quả. Chính phủ Đức hiện đang áp dụng phương pháp này trong nỗ lực hiện đại hóa các hệ thống đăng ký chính và tối ưu hóa giá trị khai thác từ dữ liệu.
5. Thành lập cơ quan dữ liệu trung ương
Các tổ chức như cơ quan Hệ thống Thông tin của Estonia hoặc Văn phòng dữ liệu Chính phủ của Singapore đã đóng vai trò then chốt trong quá trình chuyển đổi hệ thống dữ liệu tại quốc gia của họ. Một cơ quan trung ương có thể tập trung nguồn nhân lực chuyên môn về dữ liệu, vốn đang khan hiếm, và triển khai họ vào các dự án trọng điểm. Cơ quan này có thẩm quyền thiết lập các quy định chung về quản trị và quản lý chất lượng dữ liệu, đồng thời quản lý kiến trúc công nghệ thông tin cho cơ sở hạ tầng trao đổi dữ liệu chung. Trong một số trường hợp, cơ quan này có thể trực tiếp phát triển và vận hành các thành phần quan trọng của hệ thống. Cuối cùng, cơ quan này có nhiệm vụ xác định và phổ biến các phương pháp quản lý dữ liệu hiệu quả nhất cho các đơn vị khu vực công, cũng như hỗ trợ quá trình triển khai.
Kết luận
Việc xây dựng một hệ thống dữ liệu chính phủ tương tác và kết nối là một nhiệm vụ phức tạp và đòi hỏi nguồn lực đáng kể, cũng như thời gian triển khai. Tuy nhiên, việc thực hiện nhiệm vụ này sẽ tạo nền tảng vững chắc cho một khu vực công và xã hội số hiệu quả hơn về cơ bản.
Quản lý và khai thác thông tin trong môi trường số đóng vai trò quan trọng trong việc tạo ra cơ hội, tăng cường tính cạnh tranh, nâng cao hiệu suất và hiệu quả làm việc của tổ chức và cá nhân. Nó đòi hỏi các kỹ năng và chiến lược phù hợp đối với tổ chức, điều này có thể bao gồm việc đầu tư vào hạ tầng công nghệ thông tin, đào tạo nhân viên và thiết lập quy trình làm việc hiệu quả. Điều này không còn là thách thức mà là cơ hội để tạo ra giá trị, sự phát triển đối với các tổ chức và cá nhân. Việc hiểu, áp dụng các nguyên tắc và công nghệ quản lý thông tin số sẽ giúp cho con người ngày càng phát triển trong một thế giới số hóa ngày càng tốt đẹp hơn.
Mai Xuân Cường - Phòng Chính sách số
Tài liệu tham khảo
https://www.mckinsey.com/industries/public-sector/our-insights/government-data-management-for-the-digital-age