Đang xử lý.....

Dữ liệu lớn: Tìm hiểu hướng dẫn của Chính phủ Úc về thông tin cá nhân trong việc lưu giữ, chia sẻ trong các hệ thống thông tin (phần 2)  

Trong phần một chúng ta đã tìm hiểu hướng dẫn của Chính phủ Úc về khái quát về các nội dung thông tin được gọi là thông tin cá nhân, thế nào thì được coi là thông tin nhạy cảm và khi nào thì thông tin về một cá nhân được xác định hay một cá nhân được xác định hợp lý, ngoài ra còn tìm hiểu các loại hình thông tin cá nhân...
Thứ Ba, 20/11/2018 622
|

Trong phần hai này sẽ tiếp tục tìm hiểu hướng dẫn của Chính phủ Úc khi nào thông tin xác định hoặc xác định hợp lý của một cá nhân trong từng hoàn cảnh cụ thế, ngoài ra còn tìm hiểu về bản chất và số lượng của thông tin; Ai sẽ nắm giữ và có quyền truy cập vào thông tin; Các thông tin khác có sẵn (hoặc đã biết) đối với người nhận và khả năng sử dụng thông tin đó để xác định một cá nhân nào đó.

Khi nào thông tin sẽ là về một cá nhân “được xác định”?

Một cá nhân được 'xác định' khi trong một nhóm người, họ được 'phân biệt' với tất cả các thành viên khác trong nhóm. Vì mục đích của Đạo luật bảo mật, điều này sẽ được xác định thông qua việc thiết lập một liên kết giữa thông tin và một người cụ thể.

Điều này có thể không nhất thiết liên quan đến việc xác định cá nhân theo tên. Ngay cả khi tên không kèm thông tin khác, chẳng hạn như một bức ảnh hoặc một mô tả chi tiết, cũng có thể xác định được một cá nhân. Yếu tố quan trọng cần xem xét là liệu thông tin có thể được liên kết trở lại với người cụ thể mà nó liên quan đến hay không.

Ví dụ 1: Chính bản thân thông tin cho phép liên lạc được với Nina - chẳng hạn như số điện thoại hoặc địa chỉ đường phố - có thể không phải là về cá nhân 'có thể xác định'. Tuy nhiên, Nina có thể được xác định khi thông tin này có thể được sử dụng để tìm kiếm cơ sở dữ liệu khách hàng của một doanh nghiệp,
tìm một mục về Nina.

Ví dụ 2: Thông tin được đưa vào hồ sơ y tế của Michael về người cha ruột của anh, Mario. Do đó, thông tin về hồ sơ y tế của Michael cũng có thể là thông tin cá nhân của Mario - ngay cả khi tên của Mario không được nêu trong đó (vì trong hồ sơ chỉ đề cập đến một cá nhân là cha đẻ của Michael).

Khi nào một cá nhân ‘có thể xác định hợp lý’?

Câu trả lời cho câu hỏi này sẽ phụ thuộc vào bối cảnh có liên quan mà thông tin đang được xử lý. Một số thông tin có thể là duy nhất cho một cá nhân cụ thể và vì vậy có thể (trong và của chính thông tin đó) liên kết tới người cụ thể đó. Tuy nhiên, đối với một cá nhân là 'có thể xác định được', không nhất thiết cần phải được xác định từ thông tin cụ thể đang được xử lý. Một cá nhân có thể "xác định được", khi thông tin có thể được liên kết với các thông tin khác, mà cuối cùng có thể xác định được cá nhân đó.

Việc đưa cụm từ 'hợp lý' vào định nghĩa thông tin cá nhân có nghĩa là khi có thể xác định một cá nhân nào đó từ thông tin có sẵn, thì vấn đề cần xem xét tiếp theo là liệu quá trình xác định có hợp lý để xác định được hay không. Điều này được quyết định bằng cách hỏi xem, nói một cách khách quan, liệu việc hy vọng rằng đối tượng của thông tin có thể được xác định có hợp lý hay không. Mặc dù về mặt kỹ thuật có thể xác định một cá nhân từ thông tin, nếu việc làm như vậy không thực tế đến mức hầu như không có khả năng xảy ra, thì thông tin này thường không được coi là "thông tin cá nhân".

Việc quyết định xem một người có thể được xác định một cách hợp lý hay không sẽ cần phải xem xét bối cảnh của từng trường hợp cụ thể, bao gồm:

  1. Bản chất và số lượng thông tin
  2. Ai sẽ giữ và có quyền truy cập thông tin và
  3. Các thông tin khác có sẵn và khả năng sử dụng thông tin đó để xác định một cá nhân nào đó.

a) Bản chất và số lượng của thông tin

Một thực thể nắm giữ hoặc có quyền truy cập vào càng nhiều thông tin về một cá nhân nào đó thì càng có nhiều khả năng cá nhân đó sẽ được nhận dạng hợp lý từ thông tin đó. Tương tự như vậy, một số thông tin cụ thể cho một cá nhân sẽ dễ dàng xác định cá nhân đó hơn các loại thông tin khác mang tính chất tổng quát hơn.

Ví dụ 1: Nếu một thực thể chỉ nắm giữ một mục thông tin về Sylvia, chẳng hạn như tên của cô ấy, thì khả năng là không thể xác định được cô ấy chỉ từ thông tin đó. Tuy nhiên, nếu thực thể đó nắm giữ những thông tin bổ sung về Sylvia, chẳng hạn như tuổi tác, giới tính, mã bưu điện và nghề nghiệp của cô ấy thì càng có nhiều khả năng thực thể đó sẽ xác định được cô ấy.

Ví dụ 2:   Esther có một hình xăm độc đáo. Một mô tả về hình xăm của Esther có thể dễ dàng xác định được cô hơn là một mô tả về một hình xăm rất phổ biến.

b) Ai sẽ nắm giữ và có quyền truy cập vào thông tin

Liệu một cá nhân nào đó có thể được nhận dạng hợp lý từ thông tin hay không cũng sẽ bị ảnh hưởng bởi những người nắm giữ và có quyền truy cập thông tin. Thông tin mà cho phép một cá nhân nào đó được xác định trong một ngữ cảnh nào đó có thể không xác định được cá nhân đó trong một ngữ cảnh khác. Đặc biệt, khả năng xác định thường sẽ cao hơn khi đối tượng là người mà người có quyền truy cập vào thông tin biết.

Nói chung, khi thông tin được công bố công khai, các thực thể cần lưu ý rằng mọi người trên thế giới đều có thể truy cập vào thông tin đó. Điều này có thể gây khó khăn cho việc dự đoán ai có thể truy cập thông tin, các loại thông tin khác nào mà họ có thể truy cập để tham khảo và những động lực nào họ có thể phải xác định một cá nhân nào đó. Đây là lý do tại sao vấn đề quan trọng chính là thông tin mà có thể là thông tin cá nhân cần phải được xử lý cẩn thận và an toàn.

Ví dụ 1: Một cơ quan thực thi pháp luật có quyền truy cập vào cơ sở dữ liệu đăng ký xe hơi có thể sử dụng số biển số xe để xác định rằng Mark là chủ sở hữu đã đăng ký của một chiếc xe cụ thể. Tuy nhiên, một công dân bình thường sẽ ít có khả năng có thể sử dụng thông tin này để xác định Mark là chủ sở hữu đã đăng ký. Theo đó, số biển số xe của Mark có thể là 'thông tin cá nhân' khi được nắm giữ bởi hoặc tiết lộ cho nhân viên của cơ quan thực thi pháp luật, nhưng có thể không phải là thông tin cá nhân trong tay của một công dân bình thường.

Ví dụ 2: John Smith, một học sinh trường tư, có tên và họ rất phổ biến. Tên và /hoặc họ của anh ta có thể xác định anh ta trong lớp học và có thể ở trường anh ta. Tuy nhiên, ít khả năng tên của John có thể cho phép xác định được anh ta trong số toàn bộ học sinh trường tư ở Úc.

          c) Các thông tin khác có sẵn (hoặc đã biết) đối với người nhận và khả năng sử dụng thông tin đó để xác định một cá nhân nào đó

Một số thông tin là duy nhất đối với một người cụ thể, và có thể trong thông tin đó và chính bản thân thông tin đó xác định người đó. Tuy nhiên, để một người được xác định một cách hợp lý thì không nhất thiết có thể được xác định hợp lý chỉ từ thông tin được đề cập. Cho dù việc một người 'có thể xác định được hợp lý' thì cũng sẽ bị ảnh hưởng bởi việc liệu thực thể nắm giữ thông tin có thể xác định cá nhân đó bằng cách tham chiếu thông tin đó với thông tin có sẵn khác hay không (và trong một số trường hợp, liệu thực thể/ người nắm giữ thông tin đã biết một số thông tin nhất định về người đó). Điều này bao gồm việc sử dụng các thông tin khác được nắm giữ bởi (hoặc có sẵn đối với) thực thể đó và mọi thông tin có sẵn công khai.

Trong trường hợp có thể xác định một cá nhân nào đó về mặt kỹ thuật bằng cách tham chiếu nó với các thông tin có sẵn khác, các thực thể cũng nên xem xét khả năng xảy ra điều này. Thời gian (và trong một số trường hợp, chi phí) cũng có thể cần đến để xác định người đó, và các nguồn lực và năng lực hoạt động của thực thể nắm giữ thông tin, tất cả đều góp phần vào khả năng nhận diện đó sẽ xảy ra. Ví dụ: một cá nhân có nhiều khả năng được nhận dạng hợp lý hơn từ thông tin được nắm giữ bởi một thực thể khi nhân viên của tổ chức đó có quyền truy cập hoặc có thể dễ dàng có được thông tin khác về cá nhân đó. Ngược lại, khi quá trình xác định cá nhân đó phi thực tế đến mức hầu như không có khả năng xảy ra, thì thông tin sẵn có thường không được coi là 'hợp lý' khi xác định cá nhân này.

Là một phần của việc đánh giá khả năng nhận dạng, các thực thể cũng nên xem xét liệu một thực thể (hoặc một người cụ thể nào đó) có thể có động lực đặc biệt để cố gắng xác định một người nào đó hay không. Ví dụ, có thể có những cá nhân có động lực cao để xác định những người đang cư trú tại một nơi trú ẩn bạo lực gia đình nào đó.

Tính khả thi của một phương pháp cụ thể xác định một cá nhân nào đó có thể thay đổi với những phát triển mới về công nghệ và bảo mật, hoặc thay đổi khả năng công khai của một số hồ sơ nhất định. Nếu một thực thể đã quyết định rằng thông tin mà tổ chức đó nắm giữ không cho phép nhận dạng mọi cá nhân thì quyết định đó phải được xem xét thường xuyên khi có bất kỳ sự phát triển nào như vậy.

Ví dụ 1: Ava, Betty, Charles, Dino và Edward là năm vận động viên hàng đầu trong một cuộc chạy đua vui vẻ. Danh sách các lần chạy của tất cả những người tham gia trong hoạt động vui vẻ, sẽ không nhất thiết tiết lộ danh tính của họ. Tuy nhiên, nếu các lần chạy này có thể được kết hợp chéo với các thông tin khác (chẳng hạn như danh sách tên năm vận động viên chạy nhanh nhất) thì trong những trường hợp này, danh sách các lần chạy này có thể là thông tin cá nhân về năm người này.

Ví dụ 2: Là một phần của chương trình khách hàng thân thiết, một công ty nắm giữ thông tin nhận dạng về từng thành viên của mình cũng như các thông tin khác (ví dụ: về các giao dịch của từng thành viên). Công ty muốn tiến hành phân tích dữ liệu về thông tin này, do đó, công ty này đã xóa một số chi tiết nhận dạng (ví dụ: tên, địa chỉ, ngày sinh, số liên lạc) và thay vào đó đặt cho mỗi hồ sơ khách hàng một mã nhận dạng khách hàng duy nhất. Các hồ sơ khách hàng này sau đó được cung cấp cho bên thứ ba là một công ty phân tích dữ liệu nhằm mục đích nghiên cứu. Khi nằm trong tay của bên thứ ba là công ty phân tích dữ liệu thì thông tin này có thể không phải là thông tin cá nhân. Tuy nhiên, nếu nhân viên trong công ty này có thể ghép mã nhận dạng khách hàng duy nhất với hồ sơ khách hàng ban đầu để xác định người đó thì thông tin này sẽ là thông tin cá nhân khi được công ty xử lý.

Nghiên cứu tình huống 1: Vào năm 2000, một sinh viên đại học đã sử dụng thông tin bảo hiểm y tế được công khai của các công nhân làm việc ở tiểu bang Massachusetts. Thông tin đó có tên, địa chỉ, số an sinh xã hội và một số thông tin 'xác định' khác của người lao động bị xóa. Các nhà nghiên cứu đã nhận được danh sách cử tri của thủ đô Cambridge. Danh sách này cung cấp tên, mã bưu điện, địa chỉ, giới tính và ngày sinh của từng người đăng ký. Dữ liệu bảo hiểm cho thấy có sáu người ở thành phố Cambridge sinh ra cùng ngày với Thống đốc bang. Một nửa trong số đó là đàn ông. Dữ liệu cử tri cho phép các nhà nghiên cứu xác định Thống đốc là người duy nhất trong số những người sống trong khu vực có mã bưu điện cụ thể ở Cambridge. Dữ liệu bảo hiểm y tế tương ứng tiết lộ thông tin sức khỏe của Thống đốc, bao gồm cả chẩn đoán và toa thuốc.

Nghiên cứu tình huống 2: Vào năm 2006, AOL, một nhà cung cấp công cụ tìm kiếm, đã phát hành các bản ghi tìm kiếm trên web ẩn danh cho 658.000 người dùng. Tuy nhiên, một số nhà báo làm việc cho tờ New York Times có thể liên kết các cụm từ tìm kiếm để xác định người dùng và liên hệ với họ. Ví dụ: 'Người đăng ký 4417749' có thể xác định được là người phụ nữ 62 tuổi, thông qua các tìm kiếm các đại lý bất động sản và người làm vườn địa phương, việc sử dụng trang web hẹn hò, truy vấn sức khỏe của bà ấy mà bà ấy đã nhập thông tin về các ngón tay bị tê của mình và những câu hỏi về hành vi của con vật nuôi của bà.

Kết luận

Việc quyết định xem thông tin cá nhân của một người có thể được xác định một cách hợp lý hay không sẽ cần phải xem xét bối cảnh của từng trường hợp cụ thể: Bản chất và số lượng của thông tin; Ai sẽ nắm giữ và có quyền truy cập vào thông tin; Các thông tin khác có sẵn (hoặc đã biết) đối với người nhận và khả năng sử dụng thông tin đó để xác định một cá nhân nào đó. Từ đó cho thấy việc lưu giữ chia sẻ thông tin cá nhân là vấn đề rất nhạy cảm, cần có người hiểu rõ về thông tin cá nhân để đưa ra các quyết định đối với thông tin được chia sẻ. Trong phần tiếp theo cũng là phần cuối của loạt bài tìm hiểu hướng dẫn của Chính phủ Úc về thông tin cá nhân trong việc lưu giữ, chia sẻ trong các hệ thống thông tin . Chúng ta sẽ tiếp tục tìm hiểu hướng dẫn của Chính phủ Úc về các nội dung: Thông tin có thể có nhiều vấn đề không; Thông tin cá nhân có thể về nhiều người; Thông tin cá nhân có cần phải có định dạng cụ thể không; Thông tin nào không phải là thông tin cá nhân, từ đó để có cái nhìn tổng quan về dữ liệu thông tin cá nhân.

Bùi Hồng Hiếu

Tài liệu tham khảo

[1] Tài liệu hướng dẫn về của Chính phủ Úc về thông tin cá nhân trong việc lưu giữ, chia sẻ trong các hệ thống thông tin tại địa chỉ http://oaic.gov.au, truy cập ngày 28/8/2018

[2] Đạo luật bảo mật 1988 của Úc tại địa chỉ  https://www.legislation.gov.au, truy cập ngày 28/8/2018

[3] Tìm hiểu thông tin tại địa chỉ https://en.wikipedia.org, truy cập ngày 4/9/2018.