Giới thiệu
Khi dữ liệu trở thành một trong những tài sản quan trọng nhất để tạo lợi thế cạnh tranh, các tổ chức ngày càng tích hợp nhiều nguồn dữ liệu và công nghệ khác nhau nhằm khai thác tốt hơn (Davenport, 2006). Điều này hình thành nên các hệ sinh thái dữ liệu, nơi các "tác nhân tương tác và hợp tác để tìm kiếm, lưu trữ, công bố, sử dụng hoặc tái sử dụng dữ liệu nhằm thúc đẩy đổi mới, tạo giá trị và hỗ trợ mô hình kinh doanh mới.
Dù vậy, nhiều hệ sinh thái dữ liệu thất bại trong việc mở rộng hoặc duy trì hoạt động theo thời gian. Điều này nhấn mạnh vai trò thiết yếu của quản trị dữ liệu và đặt ra câu hỏi về cách phối hợp liên tổ chức nhằm tối ưu hóa tạo giá trị, đồng thời giảm thiểu rủi ro.
Dựa trên tổng hợp các hướng tiếp cận này, bài viết xác định các khoảng trống nghiên cứu và đề xuất một chương trình nghiên cứu mới nhằm làm rõ vai trò của quản trị dữ liệu trong hợp tác dữ liệu.
1. Quản trị dữ liệu
Quản trị là quá trình phân bổ quyền ra quyết định và thiết lập cơ chế nhằm đạt được mục tiêu trong tổ chức. Nghiên cứu về quản trị dữ liệu có thể chia thành hai dòng chính:
1.1. Dòng nghiên cứu thứ nhất: Quy tắc – vai trò – cơ chế kiểm soát
Trong dòng này, quản trị dữ liệu được hiểu như tập hợp:
- Các giao thức,
- Quy định,
- Vai trò,
- Định nghĩa… nhằm thiết lập hành vi mong muốn của tổ chức.
Theo Khatri & Brown (2010) đề xuất khuôn khổ từ quản trị CNTT sang quản trị dữ liệu, tập trung vào:
- Nguyên tắc dữ liệu,
- Metadata,
- Mô hình truy cập & bảo mật,
- Bảo vệ dữ liệu cá nhân.
Cách tiếp cận này đảm bảo hoạt động dữ liệu gắn với chiến lược doanh nghiệp. Tuy nhiên, nó chủ yếu nghiêng về cấp tổ chức, chưa phản ánh đầy đủ bối cảnh chia sẻ dữ liệu liên tổ chức và tác động xã hội rộng hơn.
Điểm hạn chế lớn là phương pháp tiếp cận trên–xuống (top–down), khó áp dụng trong bối cảnh phi tập trung, nơi không có một cơ quan trung tâm áp đặt quy tắc và đòi hỏi cơ chế phối hợp linh hoạt.
1.2. Dòng nghiên cứu thứ hai: Dữ liệu như hiện vật số (digital artifacts)
Dòng nghiên cứu này xem dữ liệu là một loại "hiện vật số" với các đặc tính độc đáo:
- Có thể sao chép vô hạn,
- Biến đổi linh hoạt,
- Tách rời khỏi ngữ cảnh gốc..
Do đó, quản trị dữ liệu được xem là khác biệt với quản trị CNTT. Theo Parmiggiani & Grisot (2020) nhấn mạnh vai trò của:
- Các quyết định từ dưới lên (bottom–up),
- Các tác nhân trực tiếp thao tác dữ liệu.
Paparova et al. (2023) cho thấy ranh giới vai trò dữ liệu mang tính thẳng đứng vs. ngang, thay đổi tùy mục đích sử dụng và liên kết giữa các tổ chức.
Tuy cung cấp góc nhìn phong phú, dòng nghiên cứu này vẫn chủ yếu tập trung vào thực hành khoa học dữ liệu, ít xem xét toàn bộ phổ hoạt động dữ liệu khác.
2. Chương trình nghiên cứu mới cho quản trị dữ liệu trong hệ sinh thái dữ liệu
Dựa trên tổng quan các dòng nghiên cứu, bài viết đề xuất ba trọng tâm nghiên cứu tương lai:
- Động lực thời gian của phối hợp liên tổ chức,
- Ranh giới linh hoạt của kết quả dữ liệu,
- Các thực hành quản trị dữ liệu mới nổi.
2.1. Động lực thời gian của phối hợp liên tổ chức
Quản trị dữ liệu diễn ra ở cả:
- Cấp tổ chức,
- Cấp liên tổ chức.
Tuy nhiên, hiện còn thiếu hiểu biết về cách các tác nhân trong hệ sinh thái phối hợp, căn chỉnh lợi ích, giảm mâu thuẫn và tối ưu hóa tạo giá trị.
Các thách thức chính:
- Lợi ích khác nhau dẫn đến khó căn chỉnh (Constantinides et al., 2018).
- Ranh giới pháp lý khác nhau giữa các quốc gia.
- Mất cân bằng quyền lực (ví dụ: nền tảng lớn như Amazon, Facebook sở hữu quyền kiểm soát dữ liệu vượt trội).
- Vai trò của tác nhân thay đổi theo thời gian (Aaen et al., 2022).
Do đó, quản trị dữ liệu phải được điều chỉnh liên tục, phản ánh sự thay đổi vai trò, nhu cầu, cấu trúc hệ sinh thái và môi trường pháp lý.
2.2. Ranh giới linh hoạt của kết quả dữ liệu
Dữ liệu có các đặc tính:
- Phi cạnh tranh (non–rivalrous).
- Tái sử dụng vô hạn
- Tạo ra trật tự xã hội (Beynon-Davies, 2016).
Những đặc tính này khiến ranh giới của sản phẩm/dịch vụ dữ liệu trở nên biến động. Ví dụ:
+ Mô hình AI thay đổi giá trị theo cách dùng,
+ Dữ liệu cá nhân bị kết hợp cho mục đích trái ngược với ý định ban đầu (Zuboff, 2015).
Điều này đặt ra yêu cầu quản trị mới nhằm:
- Ngăn rủi ro về quyền riêng tư.
- Kiểm soát tái sử dụng dữ liệu.
- Đảm bảo giá trị chia sẻ công bằng.
Gần đây xuất hiện các mô hình quản trị dữ liệu phi tập trung, trao quyền kiểm soát dữ liệu nhiều hơn cho các tác nhân (Micheli et al., 2020; Möller et al., 2024).
2.3. Các thực hành quản trị dữ liệu mới nổi
Nghiên cứu hiện nay thường tách biệt quản trị dữ liệu khỏi quản trị CNTT, nhưng lại tập trung quá hẹp vào phân tích dữ liệu.
Chuỗi giá trị dữ liệu (Data Value Chain – DVC), bao gồm:
- Tạo lập dữ liệu
- Thu thập.
- Lưu trữ.
- Xử lý.
- Phân tích.
- Phân phối.
- Tác động đến quyết định.
Mỗi mắt xích trong chuỗi này đều ảnh hưởng đến:
- Chất lượng dữ liệu.
- Giá trị được tạo ra.
- Rủi ro và trách nhiệm.
Ngoài ra, quản trị cần đảm bảo:
- Khả năng tương tác dữ liệu (interoperability) giữa các hạ tầng
- Tuân thủ quy định, ví dụ Data Act của EU.
- Tính minh bạch trong thiết kế dịch vụ dữ liệu và hệ thống AI.
3. Chương trình nghiên cứu mới cho quản trị dữ liệu trong hệ sinh thái dữ liệu

Hình 1 – Các tính chất trong hệ sinh thái dữ liệu
1. Động lực thời gian của phối hợp liên tổ chức
- Nhu cầu điều chỉnh liên tục chiến lược quản trị
- Câu hỏi nghiên cứu bao gồm:
- Căng thẳng trong hệ sinh thái dữ liệu xuất hiện như thế nào?
- Những yếu tố nào kích hoạt nhu cầu phối hợp?
- Cơ chế phối hợp ảnh hưởng ra sao đến tăng trưởng bền vững?
- Làm thế nào duy trì chiến lược dữ liệu liên tổ chức theo thời gian?
2. Ranh giới linh hoạt của kết quả dữ liệu
- Nhu cầu xử lý tác động tiêu cực của tính linh hoạt dữ liệu
- Câu hỏi nghiên cứu:
- Kết quả dữ liệu thách thức khuôn khổ quản trị hiện tại ra sao?
- Quản trị cần thích ứng thế nào để giảm rủi ro AI?
- Tác động của quản trị lên khả năng tái sử dụng dữ liệu?
3. Sự nổi lên của các thực hành quản trị dữ liệu mới
- Nhu cầu mở rộng phạm vi thực hành quản trị
- Câu hỏi nghiên cứu:
- Các thực hành trong chuỗi giá trị dữ liệu ảnh hưởng chất lượng ra sao?
- Làm thế nào tối ưu hóa duy tu hạ tầng & dịch vụ dữ liệu để phục vụ xã hội?
- Quyết định về hạ tầng dữ liệu ảnh hưởng thế nào tới giá trị tạo ra?
Bài học kinh nghiệm cho Việt Nam trong xây dựng và quản trị hệ sinh thái dữ liệu
Thứ nhất, cần chuyển từ tư duy quản trị dữ liệu đơn lẻ sang tư duy hệ sinh thái dữ liệu. Thực tiễn tại Việt Nam cho thấy dữ liệu vẫn chủ yếu được quản lý theo từng bộ, ngành, địa phương hoặc tổ chức riêng lẻ, dẫn đến tình trạng “cát cứ dữ liệu”, khó chia sẻ và tái sử dụng. Bài viết nhấn mạnh rằng dữ liệu chỉ thực sự tạo ra giá trị lớn khi được đặt trong một hệ sinh thái, nơi nhiều chủ thể cùng tham gia tạo lập, khai thác và chia sẻ. Vì vậy, Việt Nam cần xây dựng cơ chế phối hợp liên tổ chức rõ ràng, gắn với các nền tảng dữ liệu dùng chung, đặc biệt trong các lĩnh vực then chốt như y tế, giáo dục, giao thông và tài chính công
Thứ hai, quản trị dữ liệu phải mang tính linh hoạt và thích ứng theo thời gian. Bài viết chỉ ra rằng vai trò, lợi ích và quyền lực của các tác nhân trong hệ sinh thái dữ liệu luôn thay đổi, đòi hỏi cơ chế quản trị không thể cứng nhắc hay thuần túy “trên–xuống”. Đây là bài học quan trọng đối với Việt Nam, nơi hệ thống pháp luật và quản lý nhà nước còn nặng tính hành chính. Cần kết hợp hài hòa giữa khung pháp lý thống nhất của Nhà nước với các cơ chế điều chỉnh linh hoạt, thử nghiệm chính sách (sandbox) và phản hồi từ thực tiễn triển khai.
Thứ ba, phải chú trọng quản trị rủi ro phát sinh từ tính linh hoạt và khả năng tái sử dụng của dữ liệu. Dữ liệu, đặc biệt là dữ liệu cá nhân và dữ liệu lớn phục vụ AI, có thể bị sử dụng vượt ngoài mục đích ban đầu, gây rủi ro về quyền riêng tư, đạo đức và niềm tin xã hội. Kinh nghiệm rút ra là Việt Nam cần hoàn thiện khuôn khổ pháp lý về bảo vệ dữ liệu cá nhân, kiểm soát tái sử dụng dữ liệu và đảm bảo phân chia giá trị công bằng giữa Nhà nước, doanh nghiệp và người dân.
Thứ tư, mở rộng phạm vi quản trị dữ liệu trên toàn bộ chuỗi giá trị dữ liệu. Không chỉ tập trung vào phân tích hay khai thác dữ liệu, quản trị cần bao trùm từ khâu tạo lập, thu thập, lưu trữ, xử lý đến việc sử dụng dữ liệu trong ra quyết định công và cung cấp dịch vụ công. Điều này đặc biệt phù hợp với Việt Nam trong quá trình xây dựng Chính phủ số, hướng tới quản trị hiện đại, minh bạch và lấy người dân làm trung tâm.
Tóm lại, bài viết cung cấp những gợi mở quan trọng giúp Việt Nam định hình chiến lược quản trị dữ liệu theo hướng liên thông – linh hoạt – có trách nhiệm, qua đó khai thác hiệu quả dữ liệu như một nguồn lực phát triển bền vững trong kỷ nguyên số
Kết luận
Trong bối cảnh dữ liệu ngày càng trở thành nguồn lực cốt lõi thúc đẩy tăng trưởng và đổi mới, bài viết đã làm rõ rằng việc khai thác hiệu quả dữ liệu không thể chỉ dựa vào năng lực công nghệ hay phân tích đơn lẻ ở từng tổ chức, mà đòi hỏi một cách tiếp cận quản trị dữ liệu mang tính hệ sinh thái. Thông qua tổng quan hai dòng nghiên cứu chính về quản trị dữ liệu – một bên nhấn mạnh các quy tắc, vai trò và cơ chế kiểm soát từ trên xuống, bên kia xem dữ liệu như hiện vật số với các thực hành từ dưới lên – bài viết chỉ ra những hạn chế khi các tiếp cận này được áp dụng riêng rẽ trong bối cảnh chia sẻ và hợp tác dữ liệu liên tổ chức ngày càng phức tạp.
Trên cơ sở đó, bài viết đề xuất một chương trình nghiên cứu mới cho quản trị dữ liệu trong hệ sinh thái dữ liệu, xoay quanh ba trọng tâm then chốt. Thứ nhất là động lực thời gian của phối hợp liên tổ chức, nhấn mạnh rằng vai trò, lợi ích và quyền lực của các tác nhân không cố định mà liên tục thay đổi, buộc các cơ chế quản trị phải linh hoạt và thích ứng. Thứ hai là ranh giới linh hoạt của kết quả dữ liệu, xuất phát từ đặc tính phi cạnh tranh, dễ tái sử dụng và khả năng tạo ra các tác động xã hội ngoài dự kiến của dữ liệu, đặc biệt trong bối cảnh AI và dữ liệu cá nhân. Điều này đặt ra yêu cầu cấp thiết về các cơ chế quản trị nhằm kiểm soát rủi ro, bảo vệ quyền riêng tư và đảm bảo phân chia giá trị công bằng. Thứ ba là sự nổi lên của các thực hành quản trị dữ liệu mới, đòi hỏi mở rộng phạm vi quản trị trên toàn bộ chuỗi giá trị dữ liệu, từ tạo lập, thu thập đến sử dụng dữ liệu trong ra quyết định và cung cấp dịch vụ.
Quan trọng hơn, bài viết không chỉ dừng ở đóng góp lý luận mà còn gợi mở những bài học thực tiễn có ý nghĩa đối với Việt Nam trong quá trình xây dựng Chính phủ số và kinh tế số. Việc chuyển từ tư duy quản lý dữ liệu phân mảnh sang tư duy hệ sinh thái, kết hợp khung pháp lý thống nhất với các cơ chế điều chỉnh linh hoạt và quản trị có trách nhiệm, được xem là điều kiện then chốt để dữ liệu thực sự trở thành động lực phát triển bền vững. Nhìn chung, bài viết kêu gọi một cách tiếp cận quản trị dữ liệu toàn diện hơn, cân bằng giữa đổi mới và trách nhiệm xã hội, nhằm đảm bảo sự thành công lâu dài của các hệ sinh thái dữ liệu trong kỷ nguyên số.
Trần Thanh Hà