Đang xử lý.....

Nghiên cứu của IEEE về Mô hình tin cậy để chia sẻ dữ liệu trong thành phố thông minh dựa trên IoT  

Như chúng ta đã biết, Internet kết nối vạn vật IoT là một trong những xu hướng kỹ thuật cơ bản ảnh hưởng đến sự phát triển của cơ sở hạ tầng thành phố thông minh. Dữ liệu được tạo ra bởi các thiết bị và cơ sở hạ tầng hiện có trong IoT thường được chia sẻ giữa các ứng dụng...
Thứ Hai, 07/10/2019 1269
|

Mở đầu

Như chúng ta đã biết, Internet kết nối vạn vật IoT là một trong những xu hướng kỹ thuật cơ bản ảnh hưởng đến sự phát triển của cơ sở hạ tầng thành phố thông minh. Dữ liệu được tạo ra bởi các thiết bị và cơ sở hạ tầng hiện có trong IoT thường được chia sẻ giữa các ứng dụng. Tuy nhiên, chia sẻ dữ liệu trong IoT chỉ có thể phát huy hết tiềm năng khi có nhiều bên tham gia đóng góp dữ liệu, ví dụ như khi mọi người có thể sử dụng cảm biến điện thoại thông minh của họ cho mục đích chia sẻ. Mỗi bước, từ việc cảm nhận dữ liệu đến quy trình hành động đều yêu cầu cơ chế hỗ trợ tin cậy, như tin cậy về nhận thức dữ liệu, tin cậy về khai thác dữ liệu và các chính sách liên quan khác… đều phục vụ mục đích chia sẻ.

Bài viết này sẽ tập trung vào tính minh bạch và trách nhiệm sử dụng dữ liệu để từ đó đề xuất mô hình tin cậy để chia sẻ dữ liệu trong các thành phố thông minh dựa trên IoT, bao gồm kiến trúc hệ thống chia sẻ dữ liệu tin cậy, mô hình trừu tượng, mô hình ngữ nghĩa và cơ chế tăng cường tính minh bạch và trách nhiệm đối với dữ liệu được sử dụng.

1. Tổng quan

Chia sẻ dữ liệu trong bối cảnh thành phố thông minh sẽ chỉ đạt được tiềm năng đầy đủ nếu dữ liệu có thể được thu thập bởi nhiều nguồn. Một ví dụ là mọi người có thể chia sẻ dữ liệu của họ liên quan đến các sự kiện khác nhau bằng cách tận dụng khả năng cảm biến của điện thoại thông minh của họ. Gần đây, cảm biến đám đông là xu hướng sớm vượt trội so với các phương pháp thu thập dữ liệu truyền thống như sử dụng các cảm biến được cài đặt sẵn. Tuy nhiên, đám đông có thể liên quan đến các vấn đề quyền riêng tư về chủ sở hữu thiết bị. Ví dụ: một số dữ liệu được thu thập bởi điện thoại thông minh có thể chứa thông tin nhạy cảm, chẳng hạn như dữ liệu vị trí của chủ sở hữu. Trong bối cảnh thành phố thông minh, dữ liệu có thể đến từ nhiều nguồn khác nhau như các tác nhân thể chế, nhà sản xuất thiết bị, nhà điều hành mạng, nhà cung cấp cơ sở hạ tầng, nhà cung cấp dịch vụ và người dùng cuối. Những dữ liệu này trải qua một số biến đổi, chẳng hạn như tổng hợp thành phần dữ liệu, trước khi đến đích chia sẻ cuối cùng. Một khía cạnh quan trọng khác là dữ liệu IoT cũng có thể được chia sẻ thông qua các bộ dữ liệu được liên kết như Dữ liệu mở liên kết (Linked Open Data). Do đó, trong một số trường hợp, việc chia sẻ dữ liệu có ý nghĩa ở các thành phố thông minh phụ thuộc vào việc thiết lập mối quan hệ đáng tin cậy giữa các bên tham gia.

Để giải quyết vấn đề tin cậy và kiểm soát này, một mô hình kiểm soát sử dụng dữ liệu đã được đề xuất để nắm bắt sự đa dạng của các nghĩa vụ và ràng buộc mà chủ sở hữu dữ liệu áp dụng đối với việc sử dụng dữ liệu. Tuy nhiên, việc hỗ trợ kiến trúc để cung cấp tính minh bạch và trách nhiệm sử dụng dữ liệu vẫn còn thiếu, vì thế cần phải thúc đẩy phát triển loại hỗ trợ kiến trúc cho các bên liên quan trong bối cảnh nền tảng dùng chung trong thành phố thông minh. Do đó, các bên liên quan có thể tham gia vào chuỗi các bước trong cơ chế giúp tăng cường tính minh bạch và trách nhiệm của việc sử dụng dữ liệu.

Mô hình chia sẻ dữ liệu TDU (Trust-based Data Usage) được đề xuất sử dụng khái niệm ontology tin cậy, đại diện chính thức liên quan đến yêu cầu kiểm soát sử dụng dữ liệu, để chú thích dữ liệu được tạo ra bởi các thiết bị hoặc tài nguyên trong thành phố thông minh. Mô hình này sẽ mô tả mô hình dữ liệu ngữ nghĩa để trình bày số lượng thực thể, trạng thái của các thực thể này để tăng tính linh hoạt về mặt tích hợp, mô hình hóa và xử lý dữ liệu so với mô hình dữ liệu trước đây. Hơn nữa, mô hình cũng cung cấp sự thực thi tin cậy đối với dữ liệu được chia sẻ dựa trên các yêu cầu và chính sách của người dùng.

Mô hình chia sẻ dữ liệu TDU (Trust-based Data Usage) cung cấp:

(i) Một kiến trúc nhiều lớp cho TDU - mô tả một kịch bản sử dụng, bối cảnh và các thực thể chức năng chính của nó. Bao gồm các công nghệ ngữ nghĩa và trừu tượng để tích hợp, mô hình hóa và xử lý dữ liệu;

(ii) Cơ chế tăng cường tính minh bạch và trách nhiệm của việc sử dụng dữ liệu - tất cả các bước cho các bên liên quan được cung cấp;

(iii) Một Ontology TDUO, được tạo ra bằng cách mở rộng một số khái niệm liên quan của mô hình khái niệm sử dụng dữ liệu để xác định các chính sách ủy thác dựa trên các quy tắc khả thi và thực hiện thực thi ủy thác.

(Ontology là một mô hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về các đối tượng trong lĩnh vực đó và mối quan hệ giữa chúng. Ontology cung cấp một bộ từ vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính đó. Ngoài bộ từ vựng, ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử dụng trong một miền có thể được giao tiếp giữa người và các hệ thống ứng dụng phân tán hỗn tạp khác)

Hình 1. Kịch bản tạo động lực

Trong đó: Gateway: Cổng

IoT Shared Platform: Nền tảng chia sẻ IoT

Application: Ứng dụng

Trust Data Usage: Mô hình chia sẻ dữ liệu TDU

Remote Access: Truy cập từ xa

2. Kịch bản tạo động lực

Trong phần này, một kịch bản trường hợp sử dụng (use case) sẽ được mô tả để minh họa sự cần thiết của mô hình chia sẻ dữ liệu TDU. Đầu tiên để hoàn thành đề xuất kịch bản thì cần lưu ý rằng không cần xem xét đến TDU, vì các ứng dụng của người dùng cuối sẽ không hoạt động tốt.

Hình 1 là ví dụ minh họa về sử dụng kịch bản giám sát ô nhiễm không khí trong một thành phố thông minh. Trong hình 1, có nhiều bên liên quan, chẳng hạn như các tác nhân thể chế, nhà sản xuất thiết bị, nhà điều hành mạng, nhà cung cấp cơ sở hạ tầng, nhà cung cấp dịch vụ, người dùng cuối và có sự đa dạng về nghĩa vụ và ràng buộc trong việc kiểm soát việc sử dụng dữ liệu của họ. Các yêu cầu sử dụng dữ liệu được thể hiện ở 4 mức:

(i) Độ chi tiết không gian (Spatio-temporal granularity);

(ii) Tính trừu tượng / che giấu thông tin nhất định; và

(iii) Các điều kiện/mục đích của lớp tác nhân. Các yêu cầu chính được giải thích trong kịch bản use case.

1) Chủ sở hữu dữ liệu (công ty triển khai và sở hữu các cảm biến giám sát ô nhiễm) sẽ có quyền truy cập đầy đủ vào tất cả các chi tiết được tạo bởi tất cả các cảm biến giám sát ô nhiễm riêng lẻ.

2) Đối với chính quyền thành phố, chủ sở hữu dữ liệu sẵn sàng cung cấp chỉ số ô nhiễm không khí trung bình trên mỗi đường phố vào hàng giờ.

3) Chỉ có dữ liệu thống kê sẽ được cung cấp cho các nhà khai thác thương mại, trên một khu vực cụ thể vào hàng tuần.

3. Kiến trúc hệ thống

Phần này trình bày kiến trúc hệ thống được đề xuất, bắt đầu bằng một mô tả về giải pháp hiện tại được sử dụng, sau đó là chi tiết các lớp khác nhau và các thực thể chức năng trong kiến trúc.

Hình 2. Đề xuất kiến trúc TDU

Bối cảnh

Kiến trúc TDU đề xuất được tạo ra trong bước [4], [9] và [10]. Các kiến trúc trong [9] và [10] thu thập dữ liệu đồng thời bởi nhiều ứng dụng và dịch vụ từ các cảm biến, như Mạng cảm biến không dây WSN (Wireless Sensor Network) truyền thống dựa trên ngữ nghĩa. Dữ liệu từ mạng cảm biến này sử dụng Ontology miền cảm biến, chẳng hạn như Mạng cảm biến ngữ nghĩa SSN (Semantic Sensor Network). Tất cả các dữ liệu này được gửi trực tiếp đến người dùng (có thể là ứng dụng nền tảng hoặc người dùng cuối) mà không cần sự cho phép từ chủ sở hữu dữ liệu.

Ví dụ: chia sẻ cùng một dữ liệu giữa nhiều người dùng cuối bằng cách sử dụng các chính sách khác nhau dựa trên vị trí, thời gian hoặc vai trò của người dùng trong gia đình, chính quyền thành phố hoặc cơ quan thực thi pháp luật. Ngoài ra, hai kiến trúc được đề cập ở trên chỉ coi Mạng cảm biến không dây WSN là nguồn dữ liệu, trong khi trong bối cảnh rộng hơn của thành phố thông minh thì WSN ngoài là cảm biến thì WSN còn cung cấp nhiều loại thiết bị, dữ liệu cho người dùng. Bước [4] đã trình bày một cơ chế xử lý dữ liệu từng bước cho chủ sở hữu dữ liệu, người dùng dữ liệu và nền tảng chia sẻ IoT. Đây là những điểm đáng chú ý để đề xuất kiến trúc hệ thống.

Các lớp và các thực thể chức năng

Kiến trúc mô hình chia sẻ dữ liệu tin cậy TDU bao gồm 3 lớp:

1) Lớp cơ sở hạ tầng: Lớp cơ sở hạ tầng nằm ở dưới cùng này chứa nhiều đối tượng IoT được triển khai để gửi dữ liệu được chia sẻ đến các ứng dụng khác nhau. Các đối tượng IoT này thuộc các miền khác nhau, chẳng hạn như cảm biến thông minh từ miền WSN, đèn đường thông minh / cột tín hiệu giao thông từ miền thành phố thông minh hoặc hệ thống báo động gia đình / hệ thống HVAC thông minh từ tòa nhà thông minh. Một số loại cơ chế truy cập / kiểm soát cơ sở hạ tầng được sử dụng độc lập trong số các miền này.

2) Lớp nền tảng: Lớp nền tảng là lớp giữa và nó bao gồm bốn thực thể là:

- Quản lý Ontology OM (Ontology Manager);

- Quản lý chính sách PM (Policy Manager);

- Quản lý dữ liệu DM (Data Manager), và

- Quản lý ứng dụng AM (Application Manager).

Trong đó,

- Quản lý Ontology được sử dụng để làm việc với các miền và các Ontology tin cậy;

- Quản lý chính sách PM được sử dụng để làm việc với các chính sách tin cậy;

- Quản lý dữ liệu DM được sử dụng để làm việc với dữ liệu IoT hoặc tài nguyên từ cơ sở hạ tầng INF, và

- Quản lý dữ liệu DM làm việc với các ứng dụng IoT.

3) Lớp ứng dụng: Là lớp cuối cùng, lớp ứng dụng, chứa các ứng dụng của người dùng cuối APP nhận dữ liệu chia sẻ từ cơ sở hạ tầng thông qua nền tảng. APP sẽ nhận và sử dụng dữ liệu cảm biến (được gửi theo chính sách được đặt trước) nhưng cũng có thể là chủ sở hữu dữ liệu OWN (data’s owner) muốn biết cách sử dụng dữ liệu.

4. Ngữ nghĩa và trừu tượng (Sematic and abstraction)

Phần này trình bày tính chất ngữ nghĩa và trừu tượng để tích hợp, mô hình hóa và xử lý dữ liệu IoT trong kiến trúc TDU được đề xuất.

Tích hợp dữ liệu

Tính chất ngữ nghĩa được sử dụng để cung cấp tính nhất quán của dữ liệu giữa các lược đồ tập dữ liệu không đồng nhất. Phần này sẽ đề xuất Khung mô tả tài nguyên RDF (Resource Description Framework) để mã hóa dữ liệu và tài nguyên IoT. RDF cho phép tích hợp dễ dàng nhiều từ vựng, dữ liệu và tài nguyên IoT được xuất bản dưới dạng Dữ liệu được liên kết.

Mô hình hóa dữ liệu

Phần này sẽ đề xuất ngôn ngữ ngữ nghĩa để mô hình hóa số lượng thực thể và trạng thái của các thực thể đó cho các thiết bị hoặc tài nguyên IoT cho phép tương tác với các thực thể cấp cao hơn. Hiện tại, có rất nhiều nỗ lực cung cấp Ontology cho các lĩnh vực khác nhau. Ví dụ: đối với các cảm biến, một Ontology SSN (SSN ontology) đã được phát triển và đề xuất tại W3C để chuẩn hóa dữ liệu. Các Ontology khác bao gồm Ontology Thiết bị thông minh SAREF (Smart Appliance REFerence) được phát triển bởi tổ chức TNO, bao gồm các cảm biến và thiết bị truyền động phổ biến.

Theo Wikipedia: TNO “Toegepast Natuurwetenschappelijk Onderzoek” (tên Tiếng Anh là: Netherlands Organisation for Applied Scientific Research) là tổ chức nghiên cứu khoa học ứng dụng của Hà Lan, được thành lập vào năm 1932, là một  tổ chức độc lập không thuộc bất kỳ chính phủ nào. TNO tập trung nghiên cứu 9 lĩnh vực là: Cơ sở hạ tầng; Kinh tế và môi trường; An ninh quốc phòng; Năng lượng; Sức khỏe; Công nghiệp; Công nghệ thông tin và Truyền thông; Phân tích chiến lược và chính sách; Giao thông.

Hình 3. Tính minh bạch và trách nhiệm giải trình

Trong đó:

1. Manage ontology: Quản lý ontology

2. Store ontology: Lưu trữ ontology

3. Trust ontology request: Gửi yêu cầu ontology tin cậy

4. Trust ontology file: Tập tin ontology tin cậy

5. Store trust policy: Chính sách lưu trữ tin cậy

6. Sensor/infrastructure data: Dữ liệu cảm biến / dữ liệu cơ sở hạ tầng

7. Domain ontology file: Tập tin ontology miền

8. Store data annotation: Nhật ký lưu trữ dữ liệu

9. Trust policy request: Gửi yêu cầu chính sách tin cậy

10. Trust policy file: Hồ sơ chính sách tin cậy

11. Request trust policy: Yêu cầu chính sách tin cậy

12. Trust proof: Bằng chứng tin cậy

13. Enforcement data: Thực thi dữ liệu

14. Track data usage: Theo dõi việc sử dụng dữ liệu

15. Data response: Đáp ứng / Phản ứng dữ liệu

16. Trust proof, and data response: Bằng chứng tin cậy và phản hồi của dữ liệu

17. Visualiz data usage: Hiển thị việc sử dụng dữ liệu

18. Data usage history: Lịch sử việc sử dụng dữ liệu

19. Data owner delegate: Đại diện của chủ sở hữu dữ liệu

 

5. Tính minh bạch và trách nhiệm giải trình

Phần này sẽ trình bày cơ chế phát triển để tăng cường tính minh bạch, trách nhiệm của việc sử dụng dữ liệu và minh họa các khía cạnh này bằng sơ đồ tuần tự. Sơ đồ này bao gồm Ontology tin cậy, chính sách tin cậy và lý luận với các chính sách liên quan.

Cơ chế

Hình 3 cho thấy sơ đồ tuần tự cơ chế tăng cường tính minh bạch và trách nhiệm của việc sử dụng dữ liệu. Trình tự ở đây được căn chỉnh theo các bước của Hình 2 được hiển thị bằng các số trong mũi tên.

Quản lý Ontology OM được sử dụng để quản lý Ontology tin cậy được đề cập để cung cấp TDU. Các chính sách về Ontology thu được bởi các nền tảng sử dụng một hình thức dựa trên web đơn giản. Ví dụ: chủ sở hữu dữ liệu chỉ định rằng dữ liệu từ cơ sở hạ tầng được chia sẻ với người dùng công nghiệp nhưng không phải với người dùng học thuật. Quá trình này cũng được sử dụng để chỉ định mức độ chi tiết, chẳng hạn như chia sẻ dữ liệu từ vị trí A với người dùng học thuật và chỉ chia sẻ dữ liệu từ vị trí B với người dùng công nghiệp. Sau khi nhận được chính sách sử dụng dữ liệu, Quản lý chính sách PM sẽ tạo và lưu trữ chính sách ủy thác dựa trên các quy tắc cụ thể và Ontology tin cậy. Sau đó, dữ liệu từ INF được gửi đến Quản lý chính sách PM và được chú thích bằng siêu dữ liệu để kiểm soát việc sử dụng và làm cho nó đáng tin cậy hơn. Quản lý chính sách PM trích xuất các quy tắc từ chính sách ủy thác liên quan cho quy trình chú thích ủy thác.

Hình 4. Đề xuất Ontology sử dụng dữ liệu tin cậy

Tiếp theo, ứng dụng APP gửi truy vấn sử dụng dữ liệu tới nền tảng; thực thể AM chịu trách nhiệm xử lý yêu cầu. Đầu tiên, nó kiểm tra bằng chứng tin cậy với PM rằng truy vấn này có thể chứng minh được hay không. Nếu yêu cầu có thể chứng minh được, bộ lọc DM / cung cấp dữ liệu theo các quy tắc được trích xuất từ chính sách đến AM. AM có nhiệm vụ theo dõi lịch sử sử dụng dữ liệu từ APP truy cập nền tảng và gửi cho họ dữ liệu cuối cùng. OWN cũng có thể yêu cầu nền tảng để hình dung lịch sử sử dụng dữ liệu và xử lý ủy quyền chủ sở hữu dữ liệu cho APP.

Ontology tin cậy

Mục này trình bày Ontology tin cậy được sử dụng để xác định chính sách ủy thác được xây dựng trong mục tiếp theo.

Ontology tin cậy được đề xuất được gọi là TDUO cung cấp nhiều khái niệm liên quan đến mô hình khái niệm sử dụng dữ liệu được trình bày trước đó [4]. Chính sách tin cậy được xác định bằng cách sử dụng các phương thức dựa trên trách nhiệm về quyền chia sẻ và nghĩa vụ cấm chia sẻ dựa trên:

(i) Lớp tác nhân,

(ii) Các ràng buộc (không gian, tính tạm thời và trừu tượng) và

(iii) Lớp mục đích. TDUO đề xuất được minh họa trong Hình 4.

1) Các mục dữ liệu: Mục dữ liệu là một phần riêng lẻ của Phần tử thực thể. Phần tử thực thể là một thùng chứa được sử dụng để trao đổi thông tin về một thực thể. Nó chứa các thông tin sau:

(i) Thực thể ID bao gồm tên và loại,

(ii) Một danh sách các thuộc tính thực thể,

(iii) (tùy chọn) tên của một miền thuộc tính kết hợp với một tập hợp các thuộc tính thực thể và

(iv) (tùy chọn) một danh sách siêu dữ liệu áp dụng cho tất cả các giá trị thuộc tính của miền đã cho.

2. Điều kiện: Danh sách điều kiện (tùy chọn) chứa các biểu thức sau:

(i) Các ràng buộc tạm thời cho độ chi tiết tạm thời,

(ii) Các ràng buộc không gian cho độ chi tiết không gian,

(iii) Các ràng buộc trừu tượng cho việc che giấu thông tin nhất định,

(iv) Điều kiện của tác nhân, và

(v) Điều kiện theo mục đích.

3. Các nhà khai thác: Đây là một tập hợp các mô hình toán tử

(i) Nghĩa vụ

(ii) Cấm, và

(iii) Cho phép.

4. Cách sử dụng: Một tập hợp các quy tắc được tạo ra bằng cách xác định các toán tử trên điều kiện riêng.

6. Chính sách tin cậy

Chính sách tin cậy được các bên liên quan sử dụng để xác định tính đa dạng của nghĩa vụ và các ràng buộc mà họ muốn áp đặt đối với việc sử dụng dữ liệu trong bối cảnh chia sẻ của một số chủ thể thành phố thông minh. Có nhiều chính sách có thể có của các bên liên quan tùy thuộc vào kịch bản, quy mô của thành phố và cơ sở hạ tầng. Vì có rất nhiều bên liên quan cung cấp chính sách tin cậy, điều này có thể dẫn đến các chính sách sẽ mâu thuẫn với nhau. Để giải quyết các xung đột sẽ phát sinh giữa các quy tắc và ngoại lệ, Logic khả thi DL (Defeasible Logic) [16] được áp dụng để mô hình hóa chính sách [4]:

Chủ sở hữu dữ liệu - Data owners (DO): có quyền truy cập đầy đủ vào tất cả các chi tiết. Chính sách này được thể hiện với việc sử dụng các quy tắc khả thi, như sau:

Chính quyền thành phố - Municipal authorities (MA): có quyền truy cập vào chỉ số ô nhiễm không khí trung bình có sẵn, ví dụ: chỉ số ô nhiễm của mỗi con đường vào hàng giờ. Chính sách này được thể hiện với việc sử dụng các quy tắc khả thi, như sau:

Nhà khai thác thương mại - Commercial operators (C O): chỉ dữ liệu thống kê sẽ được cung cấp, trên một khu vực và trên cơ sở hàng tuần.

7. Kết luận

Trong cuộc Cách mạng công nghiệp 4.0, Internet kết nối vạn vật IoT là một trong các ứng dụng công nghệ mới ảnh hưởng đến sự phát triển của thành phố thông minh; và là ứng dụng thực tế để xây dựng mô hình chia sẻ dữ liệu. Các ứng dụng, cảm biến của IoT có thể thu thập dữ liệu về đồng hồ nước thông minh để báo cáo chất lượng nước và việc sử dụng nước, cảnh báo rò rỉ hoặc ô nhiễm nguồn nước. IoT tạo ra các bộ dữ liệu khổng lồ được phân tích, xử lý và chia sẻ trong thành phố thông minh…

Bài viết này đã đề xuất một phương pháp sử dụng Mô hình dữ liệu tin cậy TDU để chia sẻ dữ liệu trong thành phố thông minh dựa trên IoT, mô hình này không chỉ tập trung vào các khía cạnh bảo mật, kiểm soát truy cập hoặc quyền riêng tư mà còn tập trung nghiên cứu một kiến trúc đảm bảo tính minh bạch và trách nhiệm sử dụng dữ liệu. Sự tin cậy là chìa khóa để chia sẻ dữ liệu IoT giữa các bên liên quan khác nhau, qua bài viết này, tác giả hy vọng sẽ là tài liệu để các cơ quan nhà nước, tổ chức, doanh nghiệp… xây dựng mô hình chia sẻ dữ liệu trong thành phố thông minh.

Lê Thị Thùy Trang

Tài liệu tham khảo

[1] A Trust Model for Data Sharing in Smart Cities - IEEE  https://arxiv.org/ftp/arxiv/papers/1603/1603.07524.pdf

[2] https://mobility.here.com/smart-city-technologies-role-and-applications-big-data-and-iot