Điều này có thể đạt được bằng cách chia sẻ cơ sở hạ tầng khu vực công, chia sẻ thông tin với các cơ quan khác [3]. Sự phát triển của các dịch vụ và công nghệ mới, đặc biệt là trong các lĩnh vực truyền thông di động, Internet kết nối vạn vật và mạng xã hội đã dẫn đến sự xuất hiện của một lượng lớn dữ liệu phi cấu trúc ảnh hưởng đến các hệ thống Chính phủ điện tử. Dữ liệu lớn xuất phát từ các hệ thống này không thể được xử lý và phân tích theo cách truyền thống do tính phức tạp, tính không đồng nhất và kích thước của nó [1]. Các cơ quan chính phủ đã nhận thấy các cơ hội mà các công nghệ dữ liệu lớn mang lại nhưng đang trì hoãn các quyết định triển khai sử dụng dữ liệu lớn vì các cơ quan này không chắc liệu họ có thực sự sẵn sàng triển khai hay không [2].
Bài viết này sẽ giới thiệu một số kinh nghiệm triển khai dữ liệu lớn trong khu vực công và Chính phủ điện tử bao gồm thiết kế cơ sở hạ tầng đám mây cho việc lưu trữ, xử lý dữ liệu lớn trong Chính phủ điện tử và xây dựng khuôn khổ sẵn sàng dữ liệu lớn để giúp các tổ chức khu vực công đánh giá, xác định mức độ sẵn sàng dữ liệu lớn của mình.
Thiết kế cơ sở hạ tầng đám mây cho dữ liệu lớn trong Chính phủ điện tử [1]
Điện toán đám mây là một lĩnh vực của khoa học máy tính, trong đó năng lực công nghệ thông tin có khả năng mở rộng cao được cung cấp dưới dạng các dịch vụ qua Internet cho nhiều người dùng bên ngoài. Đây là một mô hình cho phép truy cập mạng theo yêu cầu tới các tài nguyên tính toán được chia sẻ (máy chủ, thiết bị lưu trữ, ứng dụng...) có thể được cung cấp và phát hành nhanh chóng với nỗ lực quản lý tối thiểu. Việc sử dụng điện toán đám mây có nhiều ưu điểm như: giảm chi phí và sử dụng hiệu quả các nguồn lực có tác động tích cực đến sự phát triển. Đồng thời, điện toán đám mây cho phép tập trung vào việc cung cấp các dịch vụ công nghệ thông tin. Nhược điểm chính của điện toán đám mây liên quan đến vấn đề quyền riêng tư, bảo mật và thiếu quy định pháp lý trong lĩnh vực này. Ngoài ra, một trong những thách thức chính trong môi trường điện toán đám mây là quản lý cơ sở hạ tầng mạng.
Dữ liệu lớn là một trong những xu hướng mới về công nghệ thông tin mà ở khía cạnh kỹ thuật những dữ liệu này có khả năng được sử dụng để phân tích thời gian thực. Các dịch vụ Chính phủ điện tử khác nhau yêu cầu quyền truy cập vào một lượng lớn dữ liệu. Các hệ thống Chính phủ điện tử rất phức tạp và cung cấp nhiều dịch vụ cho người dân và doanh nghiệp. Để cung cấp các dịch vụ và hỗ trợ tốt hơn cho các ứng dụng trong tương lai cho người dùng là người dân và doanh nghiệp, Chính phủ điện tử phải xem xét việc triển khai các công nghệ dữ liệu lớn. Việc triển khai các công nghệ dữ liệu lớn có thể đóng góp vào hiệu quả tổng thể của Chính phủ điện tử như giảm chi phí; tương tác tốt hơn giữa người dân, doanh nghiệp và chính phủ.
Các hệ thống Chính phủ điện tử cần được thiết kế cơ sở hạ tầng mạng để tạo môi trường an toàn và có thể mở rộng làm cơ sở cho các dịch vụ Chính phủ điện tử. Yêu cầu chính mà cơ sở hạ tầng mạng này phải đáp ứng là cấu hình động tài nguyên mạng dựa trên các yêu cầu do người dùng xác định, sẽ thay đổi tùy theo tính chất của dịch vụ hoặc ứng dụng đang sử dụng. Ngoài các dịch vụ mạng cơ bản cho trao đổi, cơ sở hạ tầng mạng này cần phải cung cấp sự tích hợp với các tổ chức bên ngoài và hỗ trợ cho dữ liệu lớn. Cơ sở hạ tầng điện toán đám mây là giải pháp có thể đáp ứng đầy đủ các yêu cầu này.
Hình 1 minh họa mô hình khái niệm của cơ sở hạ tầng dữ liệu lớn. Người dùng là người dân hoặc doanh nghiệp sử dụng dịch vụ qua cổng thông tin chính phủ điện tử. Yêu cầu của người dùng được gửi đến cơ sở hạ tầng dữ liệu lớn để xử lý. Cơ sở hạ tầng dữ liệu lớn có các cơ sở dữ liệu phân tán. Việc tích hợp cơ sở dữ liệu của các bộ, cơ quan chính phủ và chính quyền địa phương khác nhau phải được thực hiện. Sau khi xử lý và phân tích dữ liệu lớn, người dùng nhận được phản hồi đầy đủ và dữ liệu được hiển thị trực quan qua cổng thông tin chính phủ điện tử.
Hình 1. Mô hình khái niệm của cơ sở hạ tầng dữ liệu lớn
Cơ sở hạ tầng dữ liệu lớn trong mô hình này được triển khai dựa trên mô hình điện toán đám mây. Nền tảng Hadoop được sử dụng để lưu trữ và xử lý dữ liệu lớn. Ưu điểm của mô hình này là sử dụng phần mềm nguồn mở vì vậy chi phí triển khai giải pháp được giảm đáng kể. Mô hình này đang được tiếp tục nghiên cứu để cải thiện, khai thác khả năng hỗ trợ dịch vụ di động và triển khai QoS.
Xây dựng khuôn khổ sẵn sàng dữ liệu lớn ở Hà Lan [2]
Để có thể cung cấp một cái nhìn tổng quan về sự sẵn sàng dữ liệu lớn của các tổ chức trong khu vực công và xây dựng một khuôn khổ để đánh giá nó, Hà Lan đã tiến hành một dự án nghiên cứu. Dự án nghiên cứu bao gồm ba bước. Trong bước nghiên cứu đầu tiên, các cuộc phỏng vấn được tổ chức để xác định thực trạng liên quan đến việc sử dụng dữ liệu lớn trong khu vực công. Trong bước thứ hai, những phát hiện từ bước đầu tiên được sử dụng làm điểm khởi đầu cho việc xây dựng khuôn khổ mới. Cuối cùng, trong bước nghiên cứu thứ ba, khuôn khổ mới được sử dụng để thiết lập tổng quan ban đầu của sự sẵn sàng dữ liệu lớn trong khu vực công.
Thông tin thực tế được thu thập từ 11 cán bộ, công chức từ khu vực hành chính công Hà Lan thông qua các cuộc phỏng vấn trong bước nghiên cứu đầu tiên và bảng câu hỏi ở bước thứ ba. Khu vực công Hà Lan được lựa chọn vì đây là một khu vực công rất phát triển và ổn định. Theo điều tra Chính phủ điện tử của Liên Hiệp quốc năm 2014, Hà Lan là một trong những nước dẫn đầu thế giới trong các chỉ số Chính phủ điện tử.
Các điểm khởi đầu cho việc xây dựng khuôn khổ mới được lấy từ kinh nghiệm của khu vực hành chính công Hà Lan. Các cuộc phỏng vấn đã chỉ ra rằng có một số khía cạnh đang tạo ra sự không chắc chắn để bắt đầu sẵn sàng sử dụng dữ liệu lớn. Thứ nhất, không rõ liệu dữ liệu lớn có phù hợp hay áp dụng được trong mọi tổ chức và dữ liệu lớn ở dạng nào có thể được áp dụng tốt nhất trong các tổ chức. Thứ hai, liệu các tổ chức có đủ trưởng thành để tạo ra các thay đổi cần thiết nhằm tận dụng tối đa giá trị tiềm năng của dữ liệu lớn hay không. Cuối cùng, thật khó để xác định liệu các tổ chức khu vực công thực sự có khả năng làm việc thành công với dữ liệu lớn hay không. Khuôn khổ mới được xây dựng từ điểm khởi đầu với ba sự không chắc chắn này, do đó khuôn khổ giải quyết các vấn đề chính đã xảy ra trong thực tế và có thể đóng góp đáng kể vào việc phát triển sử dụng dữ liệu lớn trong khu vực công. Khuôn khổ mới được xây dựng bằng cách sử dụng ba khía cạnh: liên kết tổ chức, sự trưởng thành của tổ chức và năng lực của tổ chức, như được mô tả trong Hình 2.
Hình 2. Khuôn khổ sẵn sàng dữ liệu lớn
Liên kết tổ chức
Hiện không có lý thuyết liên kết dữ liệu lớn nào được xây dựng. Vì vậy, lý thuyết liên kết công nghệ thông tin hiện tại sẽ phải được điều chỉnh theo hướng dữ liệu lớn để có thể sử dụng cho việc đánh giá sự sẵn sàng của dữ liệu lớn. Vì vậy, khuôn khổ được sử dụng làm cơ sở cho việc đánh giá liên kết là mô hình liên kết chiến lược được xây dựng bởi Henderson và Venkatraman [4]. Khái niệm chính được lấy từ mô hình này là chiến lược của tổ chức, chiến lược công nghệ thông tin, cơ sở hạ tầng của tổ chức và cơ sở hạ tầng công nghệ thông tin cần được liên kết với nhau, vì chúng được kết nối với nhau trong tổ chức.
Để làm cho mô hình liên kết chiến lược hướng tới các ứng dụng dữ liệu lớn trong khu vực công, bốn khía cạnh của mô hình gồm chiến lược của tổ chức, cơ sở hạ tầng của tổ chức, chiến lược công nghệ thông tin và cơ sở hạ tầng công nghệ thông tin được điều chỉnh theo các khía cạnh cụ thể để liên quan nhiều hơn đến dữ liệu lớn và khu vực công.
Phần đầu tiên trong việc đánh giá sự sẵn sàng dữ liệu lớn của các tổ chức trong khu vực hành chính công của Hà Lan có thể được thực hiện bằng cách đánh giá liệu nhiệm vụ chính (chiến lược của tổ chức) và các hoạt động dữ liệu chiến lược (cơ sở hạ tầng của tổ chức) có liên kết với loại ứng dụng dữ liệu lớn (chiến lược công nghệ thông tin) và hỗ trợ các đặc tính sử dụng dữ liệu lớn (cơ sở hạ tầng công nghệ thông tin) hay không. Việc đánh giá các khía cạnh tổ chức được thiết lập dựa trên các câu trả lời cho bảng câu hỏi thiết kế cụ thể. Việc đánh giá các khía cạnh công nghệ thông tin được thực hiện bằng cách đặt câu hỏi về các loại ứng dụng dữ liệu lớn trên bốn chiều: quan tâm loại ứng dụng nào, nhu cầu cho các lợi ích cụ thể, khả năng ứng dụng trong tổ chức và tính khả thi hiện tại của nó.
Sự trưởng thành của tổ chức
Sự trưởng thành của các tổ chức công cho thấy các tổ chức này đã phát triển và cung cấp nhiều dịch vụ hướng đến người dân như thế nào. Dữ liệu lớn đóng vai trò quan trọng trong sự phát triển này và ngược lại, sự phát triển này cũng giúp cho việc sử dụng dữ liệu lớn hiệu quả hơn. Với sự hợp tác và chú ý nhiều hơn đến nhu cầu của người dân, nhiều dữ liệu có sẵn cho các ứng dụng dữ liệu lớn để các ứng dụng này có thể được thiết kế phù hợp hơn với nhu cầu của người dân. Vì vậy, sự trưởng thành của tổ chức không chỉ là thành quả của việc triển khai sử dụng dữ liệu lớn mà còn là một chỉ báo về mức độ hiệu quả của một tổ chức. Do đó, sự trưởng thành của tổ chức là một khía cạnh quan trọng của việc đánh giá sự sẵn sàng dữ liệu lớn trong các tổ chức công.
Các khuôn khổ được thiết lập để đánh giá sự trưởng thành của tổ chức khu vực công trên Chính phủ điện tử là các mô hình giai đoạn tăng trưởng của Chính phủ điện tử. Trong các mô hình này, các cải cách của chính phủ thường được mô tả theo một đường tăng trưởng nhất định được biểu diễn trong các giai đoạn tăng trưởng hoặc mô hình trưởng thành với nhiều bước khác nhau.
Năng lực của tổ chức
Các năng lực của tổ chức được coi là quan trọng cho việc sử dụng dữ liệu lớn trong các tổ chức khu vực công. Các năng lực của tổ chức được đánh giá cho việc sử dụng dữ liệu lớn bao gồm:
- Quản trị công nghệ thông tin: Khả năng thiết kế và phát triển chiến lược công nghệ thông tin, ra quyết định và cấu trúc trách nhiệm, hỗ trợ tổ chức. Điều này bao gồm việc tích hợp các hệ thống công nghệ thông tin mới.
- Tài nguyên công nghệ thông tin: Khả năng thiết kế, phát triển và duy trì cơ sở hạ tầng công nghệ thông tin phù hợp và khả năng chuyên môn để tạo thuận lợi cho các hệ thống công nghệ thông tin hiện tại và mới.
- Thái độ nội bộ: Khả năng phát triển cam kết nội bộ và tầm nhìn cho các quy trình và hệ thống mới. Đặc biệt là sự mở đối với việc ra quyết định theo hướng dữ liệu.
- Thái độ bên ngoài: Khả năng phát triển cam kết bên ngoài và hỗ trợ cho các quy trình và hệ thống mới với các bên liên quan quan trọng.
- Tuân thủ pháp luật: Khả năng thiết kế và phát triển một chiến lược tuân thủ bao gồm thiết kế quy trình, theo dõi và thiết kế lại các quy trình. Cụ thể cho việc sử dụng dữ liệu về bảo vệ quyền riêng tư, bảo mật và quyền sở hữu dữ liệu.
- Quản trị dữ liệu: Khả năng thiết kế và phát triển chiến lược dữ liệu bao gồm thu thập, mua lại, kiểm soát chất lượng và quan hệ đối tác dữ liệu.
- Chuyên môn khoa học dữ liệu: Khả năng đóng gói/thu thập, phát triển và duy trì kiến thức khoa học dữ liệu trong tổ chức; đặc biệt là kiến thức cốt lõi về công nghệ thông tin, nghiệp vụ và toán học.
Các năng lực này của tổ chức được đánh giá trên ba chiều: tầm quan trọng cho thành công dữ liệu lớn trong tổ chức, tính khả thi để phát triển năng lực trong tổ chức và sự hiện diện hiện tại của năng lực trong tổ chức.
Kết luận
Các công nghệ dữ liệu lớn cung cấp giá trị tiềm năng đáng kể cho khu vực công và Chính phủ điện tử. Tuy nhiên, việc phát triển và triển khai các công nghệ này thường khó khăn vì các tổ chức khu vực công không chắc liệu mình đã sẵn sàng sử dụng dữ liệu lớn hay chưa [2] hoặc chưa có giải pháp đối với cơ sở hạ tầng mạng để triển khai dữ liệu lớn trong Chính phủ điện tử [1]. Đây có thể cũng là những khó khăn đối với các cơ quan nhà nước Việt Nam khi triển khai dữ liệu lớn. Việc xây dựng khuôn khổ sẵn sàng dữ liệu lớn và thiết kế cơ sở hạ tầng đám mây cho dữ liệu lớn trong Chính phủ điện tử là một trong số những kinh nghiệm triển khai dữ liệu lớn trong khu vực công và Chính phủ điện tử mà các cơ quan nhà nước Việt Nam có thể tham khảo khi có kế hoạch triển khai dữ liệu lớn.
Tài liệu tham khảo
[1] Jelena Suh, Vladimir Vujin, Dusan Barac, Zorica Bogdanovic, Bozidar Radenkovic, “Designing cloud infrastructure for big data in e-government”, pp. A26-A38, Journal of Universal Excellence, 2015.
[2] Bart-Jan Romijn, “Using Big Data in the Public Sector: Uncertainties and Readiness in the Dutch Public Executive Sector ”, 2014.
[3] Morabito, Vincenzo, “Big data and analytics for government innovation” In Big Data and Analytics, pp. 23-45, Springer International Publishing, 2015.
[4] J. C. Henderson, N. Venkatraman, “Strategic alignment: Leveraging information technology for transforming organizations”, pp. 472-484, IBM Systems Journal, 1993.
Phạm Văn Thịnh