Hiện nay, trên thế giới đã có nhiều quốc gia cung cấp dữ liệu mở như Brazil, Thụy Điển, Indonesia, Đan Mạch, Canada, Anh, Mỹ... Việc cung cấp dữ liệu mở đã trở thành một tiêu chí đánh giá chính trong bộ chỉ tiêu đánh giá của Liên hiệp quốc và các tổ chức quốc tế về xếp hạng phát triển Chính phủ điện tử. Tại Việt Nam, thuật ngữ “dữ liệu mở” đã được quan tâm. Tuy nhiên, khái niệm, hành lang pháp lý, mô hình, giải pháp quản lý, chính sách thúc đẩy, công nghệ triển khai dữ liệu mở cho đến nay vẫn chưa được nghiên cứu đầy đủ [3].
Bài viết này tìm hiểu về kinh nghiệm cung cấp dữ liệu mở của Đan Mạch và thành phố Rio de Janeiro - Brazil để tham khảo cho việc đề xuất nghiên cứu, xây dựng cơ sở pháp luật, chính sách khuyến khích thúc đẩy triển khai dữ liệu mở tại Việt Nam.
Tập dữ liệu địa chỉ mở của Đan Mạch
Trước năm 1996, dữ liệu địa chỉ được đăng ký và thu thập riêng bởi 270 thành phố của Đan Mạch. Mặc dù, dữ liệu dùng chung luôn sẵn có nhưng trên thực tế dữ liệu khó có khả năng truy cập do các tổ chức muốn truy cập dữ liệu phải tạo ra các truy cập và thỏa thuận về giá riêng với mỗi thành phố. Việc thiếu một tập dữ liệu dùng chung hợp nhất, có thể truy cập được dẫn tới việc phát triển một số cơ sở dữ liệu riêng có chất lượng khác nhau. Hơn nữa, không có sự thống nhất về định nghĩa địa chỉ và cơ quan, tổ chức nào lưu giữ tệp địa chỉ tham chiếu.
Nhận thấy lợi ích của việc có một hệ thống địa chỉ chuẩn với mỗi số liệu địa chỉ gắn với một điểm địa lý duy nhất, các cán bộ ở cơ quan khảo sát và địa chính quốc gia Đan Mạch (nay là cơ quan dữ liệu địa lý Đan Mạch) đã khởi động chương trình thí điểm tổ chức dữ liệu thu thập được vào một nơi duy nhất. Để thực hiện việc này, cơ quan khảo sát và địa chính quốc gia Đan Mạch đã quyết định điều chỉnh việc đăng ký nhà và nơi ở dưới dạng đăng ký địa chỉ chính thức. Các cơ quan địa phương có trách nhiệm, quyền sở hữu dữ liệu sẽ thu thập dữ liệu, cấp phát và đăng ký địa chỉ, tên đường phố. Ở thời điểm này, việc gửi dữ liệu là tự nguyện và các thành phố không bắt buộc phải cung cấp dữ liệu địa chỉ nhưng có một phần kinh phí hỗ trợ các thành phố thực hiện công việc này.
Vào năm 2001, dữ liệu được thu thập duy nhất trong sổ đăng ký bởi chính quyền địa phương. Những người dùng tiềm năng như cảnh sát, dịch vụ khẩn cấp, các cơ quan y tế công cộng, các công ty vận tải công cộng và các cơ quan như Bộ Môi trường và Lương thực Đan Mạch và chính quyền địa phương đã nhận thức và mong muốn sử dụng dữ liệu để cung cấp dịch vụ của mình với một sự hiểu biết chính xác hơn về vị trí của các tòa nhà, doanh nghiệp và các thực thể khác. Tuy nhiên, khó khăn tiếp theo là tìm kiếm một sự đồng thuận về việc truy cập và sử dụng dữ liệu này như thế nào trong khi có gần 300 cơ quan địa phương có thể quyết định mô hình định giá riêng của mình; không thể dự báo một thỏa thuận có thể đạt được về giá cho dữ liệu địa chỉ dẫn đến có rất nhiều dữ liệu tốt nhưng không ai sử dụng.
Cuối cùng, bế tắc này được tháo gỡ bởi sự can thiệp của Bộ trưởng Tài chính. Phân tích của Tổ Công tác Chính phủ điện tử thuộc Bộ Tài chính đã xác định dữ liệu địa chỉ là một trong các tập dữ liệu có tiềm năng sử dụng nhiều nhất, dẫn đến việc Bộ trưởng Tài chính làm trung gian cho một thỏa thuận với các thành phố về truy cập và sử dụng.
Thỏa thuận này gọi một cách chính thức là Truy cập dữ liệu dùng chung tốt hơn nhưng lại được biết rộng rãi hơn với cái tên “thỏa thuận miễn phí”. Thỏa thuận này sẽ tạo ra dữ liệu khả dụng từ việc đăng ký địa chính, đô thị và chỗ ở bao gồm cả dữ liệu địa chỉ và các tọa độ địa lý liên quan của nó. Dữ liệu này được cung cấp miễn phí qua cổng thông tin điện tử của chính phủ, người truy cập chỉ phải trả chi phí nếu phân phối các dữ liệu này.
Thỏa thuận này có hiệu lực từ ngày 01/01/2003 nhưng liên quan đến các vấn đề pháp lý của việc sửa đổi luật quản trị máy chủ dữ liệu dùng chung để xóa bỏ rào cản pháp lý về chi phí việc phân phối dữ liệu địa chỉ cho bên thứ ba nên bị trì hoãn đến năm 2005 mới chính thức có hiệu lực. Các thành phố được bồi thường 1,3 triệu euro do sự thất thu từ việc bán dữ liệu trong ba năm sau khi thỏa thuận đạt được. Việc bồi thường không đền bù hoàn toàn cho các thành phố chi phí thu thập dữ liệu nhưng dữ liệu đã được thu thập thì các thành phố có thể sử dụng riêng. Cơ quan quản lý xây dựng và thương mại Đan Mạch, cơ quan chịu trách nhiệm về tên và địa chỉ đường phố ở Đan Mạch, tính toán rằng các thành phố sẽ tiết kiệm được chi phí do không phải đàm phán các thỏa thuận mua bán dữ liệu, cung cấp dữ liệu hoặc thi hành giấy phép.
Ngoài các cơ quan địa phương là những người sử dụng dữ liệu địa chỉ lớn nhất thì người sử dụng tập dữ liệu được mong đợi chính là khu vực công. Các dịch vụ khẩn cấp, các chương trình phòng chống bệnh tật cộng đồng, các cơ quan môi trường của quốc gia và thành phố, các công ty vận tải công cộng và Bưu điện Đan Mạch đều được kỳ vọng sử dụng tập dữ liệu này. Thông tin đầu vào từ người sử dụng đã được xác định thông qua các hội nghị toàn quốc và các cuộc họp không chính thức giữa cơ quan khảo sát và địa chính Đan Mạch với các nhóm người sử dụng tiềm năng như là cảnh sát.
Tập dữ liệu địa chỉ của Đan Mạch là dữ liệu đầu tiên trong loại này được thu thập và mở miễn phí. Việc mở tập dữ liệu địa chỉ nhận được sự ủng hộ rộng khắp và tập dữ liệu được sử dụng rộng rãi. Theo Cơ quan quản lý xây dựng và thương mại Đan Mạch, trong năm 2009, dữ liệu địa chỉ được cung cấp cho tổng số 1.236 đơn vị công và tư, bao gồm 286 tập địa chỉ toàn quốc đầy đủ. Trong 286 tập địa chỉ toàn quốc được cung cấp có 12 tập cung cấp cho các sản phẩm công nghệ thông tin với hơn 1 triệu người sử dụng.
Theo nghiên cứu năm 2010 của Cơ quan quản lý doanh nghiệp và xây dựng Đan Mạch (DECA), lợi ích tài chính trực tiếp tới xã hội của dữ liệu địa chỉ mở trong giai đoạn 2005 - 2009 lên tới 62 triệu euro chủ yếu qua việc cải thiện năng lực của chính phủ và cung cấp dịch vụ hiệu quả hơn. Lợi ích tiếp theo là sự phổ biến của công nghệ GPS dựa vào tập dữ liệu địa chỉ mở được sử dụng bởi gần một nửa số hộ gia đình ở Đan Mạch. Cơ quan dữ liệu địa lý Đan Mạch đã phỏng vấn các công ty GPS, họ coi dữ liệu địa chỉ của Đan Mạch là tốt nhất ở Châu Âu; nhờ dữ liệu này họ có thể nâng cao độ chính xác hệ thống định vị trên ô tô. Việc mở dữ liệu địa chỉ cũng cải thiện độ chính xác trong việc đáp ứng của các dịch vụ khẩn cấp ở Đan Mạch. Tăng độ chính xác của tập địa chỉ địa lý được mã hóa sẽ tăng cường khả năng tìm đúng địa chỉ của các dịch vụ khẩn cấp.
Dữ liệu mở của thành phố Rio de Janeiro - Brazil
Rio de Janeiro được biết đến với cái tên Rio, là một địa điểm du lịch nổi tiếng thế giới. Trước đây việc quản lý dữ liệu thường không có một cấu trúc nhất định. Việc phân tích và chia sẻ dữ liệu là rất hạn chế. Gần đây, Rio đã thu thập dữ liệu và các dữ liệu mở một cách bài bản, chính xác hơn nhằm mục đích chia sẻ dữ liệu một cách toàn vẹn, chính xác.
Sau trận mưa tháng 4/2010 làm cho hàng nghìn người mất nhà cửa, 72 người chết và đặt thành phố vào trong tình trạng khẩn cấp, thị trưởng thành phố quyết định cần phải chuẩn bị tốt hơn cho các hiện tượng tự nhiên xảy ra trong những chu kỳ ngắn nhưng lại có những rủi ro nghiêm trọng. Sau đó, Trung tâm điều hành Rio de Janeiro (COR) đã được thành lập. Làm việc tại trung tâm này là văn phòng của tất cả các cơ quan chính phủ cùng truy cập tới một vài lớp thông tin tham chiếu địa lý, nhiều thông tin trong số đó có nguồn gốc từ thu thập dữ liệu thời gian thực, bao gồm các thông tin về vị trí của các phương tiện giao thông công cộng, thông tin từ các thiết bị đo mức nước sông và thủy triều cũng như thông tin từ 600 máy quay CCTV trong khắp thành phố.
COR không chỉ thu thập dữ liệu mà còn giúp đưa ra quyết định nhanh chóng. Ví dụ nếu có một tai nạn xảy ra thì nhân viên giao thông, cảnh sát đô thị, bộ phận y tế và hệ thống xe cứu thương “nói chuyện” với nhau và cùng quyết định theo một giao thức đã được thỏa thuận từ trước. Đầu tiên, họ xác định vị trí của tai nạn và mức độ nghiêm trọng của nó. Nếu cần thiết, một đội giải cứu được cử tới để chặn các con đường gần đó và cung cấp thực phẩm cho nạn nhân và người bị thương và sau đó một xe cứu thương có thể được chuyển tới để đưa người bị thương đến bệnh viện gần nhất. Toàn bộ việc này được điều phối bởi một hoặc nhiều màn hình điều khiển trong tổng số 80 màn hình điều khiển bên trong COR.
Trong việc thu thập tất cả dữ liệu này để hỗ trợ cho các hoạt động giải cứu, chặn các đường phố và nhiều dịch vụ khẩn cấp khác nữa, thành phố quyết định rằng tất cả dữ liệu này được dùng chung và bắt đầu một quá trình của dữ liệu mở. Một vài sáng kiến được đưa ra hướng tới mục tiêu này như là việc tạo ra một môi trường cho các nhà báo truy cập đồng thời với sự minh bạch hơn. Các nhà báo được cung cấp một không gian vật lý ở tầng lửng trong COR đối diện với các màn hình điều khiển của các kỹ sư và cán bộ vận hành. Mọi thông tin được phát hành đồng thời tới các nhà báo của các đơn vị phát thanh, truyền hình quốc gia và địa phương. Ngoài ra, cổng thông tin điện tử của COR có thông tin ngay lập tức trên các đường phố chính.
Có thể chia sự xuất hiện dữ liệu mở ở Rio de Janeiro thành ba giai đoạn khác nhau: (1) liên thông; (2) xây dựng các cổng thông tin và dữ liệu, thường được liên kết với hệ thống thông tin địa lý (GIS); (3) các cổng dữ liệu chuyên dụng.
Giai đoạn đầu tập trung vào các lĩnh vực tài chính, kế toán với các chuẩn mở cho trao đổi dữ liệu, bao gồm cả các hệ thống có khả năng tương thích từ những năm 80. Tuy nhiên, mặc dù các tệp dữ liệu tồn tại ở định dạng mở nhưng không được công khai rộng rãi.
Giai đoạn 2 nổi bật với lĩnh vực quy hoạch đô thị. Nhận thức được tầm quan trọng của việc chuẩn hóa và tăng cường sử dụng lại các loại dữ liệu, các kỹ sư và kiến trúc sư sử dụng hệ thống thông tin địa lý để thiết kế và tạo ra dữ liệu về thành phố dựa trên các tiêu chuẩn mở cho dữ liệu tham chiếu địa lý. Rio de Janeiro có một cổng thông tin điện tử trong cơ quan có trách nhiệm thống kê và quy hoạch đô thị. Trên cổng này có hàng nghìn tập dữ liệu liên quan đến đô thị cũng như các lớp, bản đồ, hình khối tham chiếu địa lý luôn có sẵn ở định dạng mở cho doanh nghiệp và người dân có thể sử dụng miễn phí để phát triển hoạt động (thường qua các hiệp hội xã hội), lập kế hoạch chiến lược, phát triển các hoạt động thương mại.
Giai đoạn 3 bắt đầu từ năm 2010, một số cơ quan có cổng thông tin điện tử được xây dựng riêng chỉ để cung cấp dữ liệu mở. Ở Rio de Janeiro, giai đoạn 3 của việc phát triển dữ liệu mở đã có sự liên kết chặt chẽ với ý tưởng trở thành thành phố thông minh. Để thực hiện việc này, có hai hướng cơ bản: đầu tiên là cơ sở hạ tầng truyền thông ở dạng Internet và mạng máy tính trải dài 300 km quanh thành phố và thứ hai là dữ liệu mở như là một phần của lớp nội dung trong thành phố thông minh. Vào tháng 3/2014, cổng thông tin dữ liệu mở của Rio de Janeiro đã hoạt động cùng với nghị định của chính phủ và dữ liệu của Tòa thị chính. Cổng thông tin Data.Rio bắt đầu với hơn 30.000 tệp nằm trong 1.200 tập dữ liệu của 7 cơ quan, đơn vị; được chia sẻ trong 13 loại: Tổng đài 1746, quản trị công, phát triển xã hội, giáo dục, giải trí, thể thao, thuế và phí, môi trường, doanh thu và chi phí, y tế, giao thông và vận tải, du lịch, đô thị (Hình 1).
Hình 1. Cổng thông tin dữ liệu mở trung tâm của Rio de Janeiro
Chính sách dữ liệu mở của Rio de Janeiro có dạng mô hình “Từ trên xuống”. Hiện tại, bộ máy hành chính của thành phố quyết định tập dữ liệu nào sẽ được công khai; mô hình và kiến trúc của cổng thông tin điện tử và những cơ hội nào sẽ có để cho người dân tham gia. Ban đầu, một số vấn đề nhỏ liên quan đến nền kinh tế và xã hội của Rio de Janeiro như du lịch được lựa chọn và sau đó là các dữ liệu liên quan được công bố trên cổng thông tin dữ liệu mở. Từ đây, người dân có yêu cầu sử dụng các tập dữ liệu này để xây dựng ứng dụng. Một số không gian cho sự tham gia của người dân được lên kế hoạch với 3 cách tiếp cận được xem xét:
(1) Cho phép không gian yêu cầu tập dữ liệu mới phù hợp với lợi ích của người dân;
(2) Tạo ra các trang thông tin điện tử và ứng dụng của bên thứ ba sử dụng dữ liệu mở;
(3) Tạo ra một diễn đàn trực tuyến để thảo luận các tập dữ liệu và sự minh bạch của chính sách công.
Thành phố cũng đã trở thành đối tác chiến lược với các doanh nghiệp tư nhân trong việc hợp tác trong nước và quốc tế về cung cấp dữ liệu mở. Thông qua các thỏa thuận này, thành phố cung cấp dữ liệu bản đồ, sự thay đổi các tuyến đường, thông tin điều hành, dữ liệu tai nạn, mức độ giao thông và các thông tin khác. Trên cơ sở các bên cùng có lợi bao gồm cả người dân, tất cả các ứng dụng như Waze, Google Maps, Buus, Easy Taxi, Moovit thu thập dữ liệu qua thỏa thuận hợp tác với thành phố và tất cả các ứng dụng này sẽ cung cấp dịch vụ miễn phí tới người dùng cuối.
Một khía cạnh khác nữa của chính sách dữ liệu mở của Rio de Janeiro là hợp tác thông qua thỏa thuận với các chuyên gia quốc tế ở các trường đại học và viện nghiên cứu trên thế giới.
Kết luận
Việc cung cấp dữ liệu mở sẽ mang lại nhiều lợi ích thiết thực cho người dân, doanh nghiệp, các cơ quan nhà nước và mang lại lợi thế cạnh tranh cho quốc gia. Kinh nghiệm của Đan Mạch và thành phố Rio de Janeiro - Brazil cho thấy sự quyết tâm của các cơ quan có thẩm quyền là yếu tố quan trọng quyết định sự thành công của việc cung cấp dữ liệu mở. Tại Việt Nam, việc cung cấp dữ liệu mở cũng cần phải có sự quan tâm chỉ đạo mạnh mẽ từ Chính phủ tới các Bộ, ngành, địa phương để triển khai thực hiện đưa dữ liệu vào khai thác sử dụng, chia sẻ cho người dân và doanh nghiệp đem lại hiệu quả kinh tế. Bên cạnh đó, từng bước hoàn thiện chủ trương, chính sách, mô hình, giải pháp quản lý để thúc đẩy triển khai dữ liệu mở; trong đó, việc xây dựng chính sách phát triển dữ liệu mở là vấn đề lớn cần có sự tham gia của các bộ, ngành có liên quan.
Tài liệu tham khảo
[1] Ricardo Matheus, Manuella Maia Ribeiro, Case Study: Open Government Data in Rio de Janeiro City, “Exploring the Emerging Impacts of Open Data in Developing Countries” research project, 2014.
[2] Andrew Young and Stefaan Verhulst, The Global Impact of Open Data, O’Reilly Media Inc., 2016.
[3] Viện Công nghiệp phần mềm và nội dung số Việt Nam, Báo cáo tổng quan về dữ liệu mở, 2017.
Phạm Văn Thịnh