Phần 2: Thảo luận về cơ sở dữ liệu trong cơ quan nhà nước
Trong phần trước, ta đã thảo luận về khái niệm cơ bản của cơ sở dữ liệu, phân loại các cơ sở dữ liệu theo các tiêu chí khác nhau gồm: loại dữ liệu (có cấu trúc, phi cấu trúc và nửa cấu trúc); hình thức lưu trữ, tổ chức (cơ sở dữ liệu dạng tệp, cơ sở dữ liệu quan hệ, cơ sở dữ liệu phân cấp); mục đích sử dụng (tập trung, phân tán, tập trung có bản sao)…Các cách phân loại này cũng đã ít nhiều thể hiện được mô hình tổng thể về tổ chức cũng như đặc trưng của nó có thể có. Qua đó, ta có thể thu được một số nhận định sau:
- Cơ sở dữ liệu là tập hợp các dữ liệu được chuyển hóa từ các thông tin trong thế giới thực. Các thông tin này được thu thập, quản lý và phục vụ chia sẻ cho nhiều người dùng.
- Cơ sở dữ liệu khi cần quản lý phải có cấu trúc, các cơ sở dữ liệu không có cấu trúc cần phải chuẩn hóa thành có cấu trúc để duy trì, cập nhật ít nhất là với một mức độ nhất định.
- Thể hiện của cơ sở dữ liệu rất đa dạng trong công nghệ thông tin. Một số cách phân loại thường theo xu hướng đặc điểm dữ liệu, nhưng cũng theo xu hướng thể hiện giải pháp công nghệ; xu hướng tổ chức kiến trúc, quản lý.
- Lựa chọn loại cơ sở dữ liệu cần phụ thuộc vào các cơ sở dữ liệu cụ thể trên thực tế. Tuy nhiên xu hướng hiện tại cơ sở dữ liệu quan hệ đang chiếm phần lớn và thuộc loại cơ sở dữ liệu có cấu trúc.
Từ một số nhận định trên, ta có thể rút ra một vài điểm về các khái niệm cơ sở dữ liệu được đề cập trong các văn bản quy phạm pháp luật trong cơ quan nhà nước:
- Khi nói đến cơ sở dữ liệu trong văn bản quy phạm pháp luật như Cơ sở dữ liệu quốc gia hay cơ sở dữ liệu của các Bộ, ngành, địa phương có nghĩa là nói đến thông tin được thu thập chuyển hóa thành dữ liệu và được lưu trữ, quản lý phục vụ các mục đích quản lý nhà nước. Việc xây dựng cơ sở dữ liệu là thu thập thông tin và xây dựng, chuẩn hóa dữ liệu là yếu tố cơ bản. Triển khai các hệ thống thông tin quản lý cơ sở dữ liệu chỉ là yếu tố phụ.
Thật vậy, Luật Công nghệ thông tin có quy định Cơ sở dữ liệu quốc gia là tập hợp thông tin của một hoặc một số lĩnh vực kinh tế - xã hội được xây dựng, cập nhật và duy trì đáp ứng yêu cầu truy nhập và sử dụng thông tin của các ngành kinh tế và phục vụ lợi ích công cộng. Với khái niệm này cơ sở dữ liệu quốc gia thuần túy về mặt thông tin và chưa mang định hướng giải pháp cũng như phân loại cụ thể.
Vì vậy, với cách hiểu này có sự độc lập tương đối với giải pháp cụ thể khi triển khai và không nên dựa vào một thể hiện cụ thể của giải pháp triển khai để ràng buộc kết quả của cơ sở dữ liệu.
- Thông thường các cơ sở dữ liệu thường được xác định nội dung và phạm vi bằng nghiệp vụ. Tuy nhiên đó là các cơ sở dữ liệu ứng dụng cho mỗi hệ thống thông tin cụ thể. Đối với cơ sở dữ liệu quốc gia và cơ sở dữ liệu của các Bộ, ngành, địa phương là các cơ sở dữ liệu làm nền tảng phát triển chính phủ điện tử thì các cơ sở dữ liệu này phải được xác định theo mức nghiệp vụ tổng thể quản lý nhà nước trong các cơ quan nhà nước với một mức khái quát hóa cao hơn như phục vụ xác định giá trị pháp lý, đơn giản thủ tục hành chính, giảm giấy tờ cho người dân, doanh nghiệp, tăng cường năng lực quản lý nhà nước, xây dựng tài sản thông tin phát triển bền vững… Vì vậy, khi xây dựng đòi hỏi phải có tầm nhìn rộng, bao trùm các lĩnh vực.
- Thiết kế kiến trúc dữ liệu là thiết kế nội dung trong cơ sở dữ liệu bao gồm các phần tử dữ liệu được thu thập và ánh xạ từ các thực thể trong thực tế, mối quan hệ, sự chuẩn hóa và các yếu tố ràng buộc. Cần phân biệt kiến trúc dữ liệu và kiến trúc cơ sở dữ liệu. Về điều này, hiện nay có thể có sự chưa rõ ràng trong quá trình thực hiện khi chỉ tập trung vào vấn đề công nghệ cụ thể mà thiếu quan tâm đến vấn đề tạo dựng tài sản, tài nguyên và việc xác định cấu trúc nội dung thông tin để đến giai đoạn cuối cùng là chưa hợp lý.
- Cơ sở dữ liệu và Hệ thống quản lý cơ sở dữ liệu là hai vấn đề khác nhau. Hệ thống quản lý cơ sở dữ liệu là giải pháp công nghệ thông tin để quản lý vận hành các cơ sở dữ liệu. Thông thường, hệ thống quản lý cơ sở dữ liệu là các hệ thống thông tin cung cấp các dịch vụ nền tảng về truy xuất dữ liệu để phục vụ các thành phần hệ thống/ hệ thống khác sử dụng dữ liệu.
- Khi xem xét triển khai cơ sở dữ liệu trong cơ quan nhà nước, cần xem xét trên nhiều khía cạnh bao gồm cả các loại phân loại và đặc điểm như đã đề cập ở trên để chọn các giải pháp phù hợp. Thông thường, ta sẽ chọn loại cơ sở dữ liệu quan hệ lưu trữ cơ sở dữ liệu có cấu trúc. Tuy nhiên không phải luôn như vậy là hợp lý. Sử dụng cơ sở dữ liệu phân cấp để quản lý dữ liệu về tài khoản người dùng, hệ thống các cơ quan nhà nước cũng là một giải pháp cần xem xét. Hoặc đôi khi có thể kết hợp nhiều loại cơ sở dữ liệu với những thành phần dữ liệu và mục đích khác nhau để hình thành nên cơ sở dữ liệu mang tính logic để tận dụng ưu điểm của từng loại cơ sở dữ liệu.
- Vấn đề cơ sở dữ liệu tập trung, phân tán hay tập trung có bản sao cũng là vấn đề rất được quan tâm hiện nay. Đặc biệt là vấn đề giải pháp triển khai đối với các cơ sở dữ liệu quốc gia, cơ sở dữ liệu chuyên ngành. Thông thường, các cơ sở dữ liệu này có phạm vi toàn quốc và đáp ứng nhu cầu khai thác sử dụng bởi các cơ quan nhà nước trên phạm vi rộng. Chọn giải pháp nào nên cần xem xét một số tính chất sau:
+ Mức độ và vai trò quản lý dữ liệu thực tế của các cơ quan, đơn vị liên quan như thế nào?
+ Phạm vi của cơ sở dữ liệu đến đâu cho phù hợp khi tổ chức xác định các cơ sở dữ liệu?
+ Hệ thống mạng từ trung ương đến địa phương đã đáp ứng được nhu cầu truy xuất, khai thác sử dụng?
+ Nhu cầu chia sẻ dữ liệu, mức độ dùng chung dữ liệu? ví dụ đối với dữ liệu địa phương nào địa phương đó sử dụng mà không có nhu cầu khai thác chéo thì sự phân cấp quản lý theo phân tán cũng đáng xem xét.
+ Tần xuất khai thác đáp ứng nhu cầu cả hiện tại và tương lai?
+ Độ lớn, kích cỡ của dữ liệu: sẽ không thuận tiện và tốn tài nguyên mạng khi dữ liệu lớn được địa phương chuyển lên tập trung tại trung ương rồi mỗi khi sử dụng lại lấy từ cơ sở dữ liệu tập trung này.
+ Trình độ nhân lực quản lý.
+ Khả năng xử lý sự cố và đảm bảo an toàn an ninh thông tin.
+ Cơ cấu kinh phí cho việc đầu tư, vận hành các cơ sở dữ liệu…
Tất cả các yếu tố này cần được xem xét cẩn trọng để có thể phân loại cơ sở dữ liệu, quy hoạch, thiết kế kiến trúc dữ liệu và xác định các giải pháp triển khai.
Cơ sở dữ liệu tập trung thường có ưu điểm: dễ dàng trong quản lý, duy trì đảm bảo sự thống nhất của dữ liệu cao. Khi có sự thay đổi chính sách, chỉ cần chỉnh sửa một đầu mối thống nhất sẽ có tác động lên toàn bộ các hệ thống thông tin khác. Tuy nhiên, đòi hỏi phải có hạ tầng mạng tốt để kết nối từ cơ sở dữ liệu tập trung đến toàn bộ các cơ quan nhà nước có nhu cầu. Ngày nay, trong cơ quan nhà nước, cơ sở hạ tầng mạng không phải là vấn đề quá lớn khi kết nối các cơ quan nhà nước để phục vụ khai thác dữ liệu. Tuy nhiên sự thiếu đồng đều, các vùng sâu, vùng xa thì đây cũng là vấn đề cần quan tâm xem xét.
Cơ sở dữ liệu phân tán thường có ưu điểm để giúp phân tải nhu cầu khai thác trong điều kiện hạ tầng mạng hạn chế hoặc để đảm bảo an toàn dữ liệu. Phân tán cũng cần quan tâm cả yếu tố phân tán về mặt tổ chức quản lý. Trong cơ quan nhà nước, phân tán cơ sở dữ liệu chuyên ngành thường được đặt trong bối cảnh dữ liệu phân tán tại các địa phương. Với giải pháp phân tán đòi hỏi phải có sự chuẩn hóa thống nhất cao về mặt dữ liệu. Các quy chuẩn, tiêu chuẩn cần được quan tâm xây dựng và ban hành sớm để đảm bảo có sự đồng bộ trong quá trình xây dựng và triển khai giữa các thành phần phân tán.
Sự tập trung hay phân tán đối với những cơ sở dữ liệu lớn như Cơ sở dữ liệu quốc gia hay cơ sở dữ liệu chuyên ngành nhiều khi không thể phân biệt rạch ròi. Sự xuất hiện của cơ sở dữ liệu tập trung có bản sao chỉ là một trong những thể hiện điều đó. Trong trường hợp thực tế cho một Cơ sở dữ liệu quốc gia hay chuyên ngành, hoàn toàn có thể triển khai theo hình thức một cơ sở dữ liệu lớn ở trung ương, tiếp đó là các cơ sở dữ liệu thành phần bản sao được phân theo vùng (tập trung theo vùng, ví dụ Bắc, Trung, Nam) để phục vụ khai thác cho vùng đó đồng thời phục vụ mục đích dự phòng đảm bảo an toàn dữ liệu. Tất cả các cơ sở dữ liệu phải có cơ chế đồng bộ thống nhất tránh mâu thuẫn thông tin. Dó cũng là giải pháp cần xem xét khi triển khai trong thực tế.
- Trong cơ quan nhà nước hiện nay, phần lớn các cơ sở dữ liệu mới chỉ xuất hiện dưới dạng cơ sở dữ liệu hoạt động – lưu trữ dữ liệu phục vụ hoạt động của các hệ thống thông tin, phục vụ nghiệp vụ. Các loại cơ sở dữ liệu khác còn chưa được quan tâm lớn. Phát triển các cơ sở dữ liệu phục vụ hỗ trợ ra quyết định, cơ sở dữ liệu tri thức trên cơ sở dữ liệu ngữ nghĩa phục vụ xây dựng chính sách cũng là một định hướng cần quan tâm trong tương lai.
- Cơ sở dữ liệu có tồn tại tách rời hệ thống thông tin không? Có thể nói, cơ sở dữ liệu trong cơ quan nhà nước cần được đề cập trong ngữ cảnh thông tin và quản lý còn Hệ thống thông tin được đề cập trong ngữ cảnh giải pháp công nghệ và ứng dụng công nghệ thông tin. Các khái niệm này đều có mối quan hệ nhưng không sử dụng thay thế. Khi nói trong ngữ cảnh công nghệ và giải pháp, hệ thống thông tin đi liền với hệ quản trị cơ sở dữ liệu và nếu xây dựng một hệ thống thông tin trong ngữ cảnh xây dựng cơ sở dữ liệu thì được hiểu rằng hệ thống thông tin đó có chức năng và vai trò chính là quản lý, vận hành, duy trì, chia sẻ dữ liệu mà không bao gồm các chức năng nghiệp vụ khác.
Theo hiện trạng phát ứng dụng công nghệ thông tin trong cơ quan nhà nước, các hệ thống cũ được triển khai thường có sự gắn liền với các cơ sở dữ liệu phục vụ hệ thống thông tin đó. Đó cũng là điều dễ hiểu do yêu cầu xuất phát từ nghiệp vụ để xây dựng hệ thống thông tin và cơ sở dữ liệu để phục vụ chính nghiệp vụ đó. Tuy nhiên, theo xu hướng phát triển của công nghệ thông tin, cơ sở dữ liệu ngày càng có sự độc lập nhất định với các hệ thống thông tin, cơ sở dữ liệu mang tính tài sản, tài nguyên và có thể khai thác các giá trị chưa xác định trước (ứng dụng datawarehouse, data minning). Sự ra đời điện toán đám mây (cloud computing), kiến trúc hướng dịch vụ (SOA) cũng đã làm cho ranh giới giữa các hệ thống thông tin giờ đây không rõ ràng. Vì thế, xây dựng các cơ sở dữ liệu mang tính nền tảng độc lập nhất định và cung cấp dịch vụ cho các hệ thống thông tin hoạt động là hướng đi phù hợp.
Qua sự nhìn lại tổng thể các khái niệm cơ bản về cơ sở dữ liệu, các khía cạnh về cơ sở dữ liệu trong cơ quan nhà nước, vị trí của các Cơ sở dữ liệu quốc gia, cơ sở dữ liệu của các Bộ, ngành địa phương cần được xác định cho phù hợp. Tập trung phát triển các cơ sở dữ liệu và duy trì cập nhật, ổn định và làm giàu cũng là quá trình xây dựng và phát triển chính phủ điện tử bền vững.
Tham khảo:
https://vi.wikipedia.org/wiki/C%C6%A1_s%E1%BB%9F_d%E1%BB%AF_li%E1%BB%87u
http://www.semagix.com/what-is-semantic-data.htm
https://brightplanet.com/2012/06/structured-vs-unstructured-data/
http://ecomputernotes.com/fundamental/what-is-a-database/type-of-database-system
Nguyễn Trọng Khánh