Hay nguyên bản tiếng anh chưa dịch theo tiêu đề siêu gà của hắn là Data Ethics. Vô tình đọc được từ một khoá trên Linkedin về dữ liệu mà hắn đang học chơi chơi, nhưng thấy mục này của bài giảng hay quá là hay nên lại lắm lời đạo lý một bài về cái vấn nạn đạo đức dữ liệu này cái. Đặc biệt là trong tình hình ở Việt Nam, nơi dữ liệu người dùng là một cái gì đó siêu rẻ, bị xâm phạm thường xuyên và luôn trong tình trạng bị “cưỡng bức với hãm hiếp” một cách vô cùng tồi tệ.
Sự cho phép
Đây là yếu tố đầu tiên và cũng quan trọng bậc nhất của đạo đức dữ liệu. Bạn không có quyền sử dụng bất cứ dữ liệu nào mà không được sự cho phép của chủ sở hữu. Câu chuyện một anh sửa điện thoại, cứ vui tính vừa sửa vừa ngó vô kho ảnh của cô khách hàng xinh xắn, rồi lại vui tay cho lên nhóm riêng bình loạn cùng bạn bè thân hữu. Câu chuyện một anh kỹ thuật viên máy tính, người ta tới nhờ sửa nguồn lại táy máy vào dữ liệu trong ổ cứng, rồi lại tiện chuột kéo ra máy tính của mình. Hay câu chuyện một anh khác lắp camera, chắc là quên 🤔 lại cứ lưu lại IP, lẫn mật khẩu để lâu lâu vào giải trí với các cảnh 18++ của chủ nhà. Có lẽ những mẩu chuyện kể trên không lạ, không mới thậm chí cũng chẳng phải chủ đề gì hót để bàn tới nhất là ở ta hiện nay. Nhưng nó vi phạm nghiêm trọng nguyên tắc đầu tiên của đạo đức dữ liệu đó là sự cho phép của người chủ dữ liệu đó. Không một cô gái nào cho phép một anh thợ điện thoại vào kho ảnh xem cho vui, cũng chả một khách hàng nào muốn những dữ liệu trong máy tính cá nhân lẫn tổ chức được copy sang máy khác mà không được sự cho phép và tất nhiên cũng chả chủ nhà nào điên tới mức các cảnh 18++ của vợ chồng được livestream trực tiếp trên máy các ông thợ lắp camera. Thế nên người làm bất cứ việc gì liên quan tới dữ liệu thuộc mọi ngành nghề cho dù có giỏi có tài tới đâu thì cũng cần tuân theo những nguyên tắc về đạo đức dữ liệu và cụ thể ở đây là nguyên tắc đầu tiên này – CHO PHÉP nếu không mọi hành động sau đó đều là vô nghĩa lẫn vô đạo đức hết.
Tuyên ngôn được đặt ra ở nguyên tắc này là:
Người ta cần đưa bạn quyền để sử dụng dữ liệu của họ
Luôn thông báo
Trước khi, trong khi và sau khi bạn được cho phép đi vào cái nguồn dữ liệu cá nhân kể trên thì giờ là lúc trách nhiệm của nguyên tắc thứ hai phải được tuân thủ. Bạn định làm gì với dữ liệu này phải thông báo trước cho người sở hữu. Trong quá trình xử lý, thao tác cũng phải liên tục cập nhật thông tin về dữ liệu, được cắt ra, được lọc, được tổng hợp hay được abcxyz. Và sau khi dùng sau, dữ liệu đó sẽ được lưu trữ lâu dài tại server (ở đâu, host nào, ổ đĩa nào…), hay chuyển qua bộ phận khác, hay tiêu huỷ thì đều phải có thông tin đến các bên liên quan và đặc biệt là người sở hữu dữ liệu đó. Chuyện một người đồng ý cung cấp thông tin cho một công ty X để ký hợp đồng hay để sử dụng dịch vụ của X, rồi không hiểu vì một lý do nào đó cái dữ liệu đó lại được bán rất ngang nhiên trên các diễn đàn có lẽ chẳng phải là sự kiện gì quá lạ lẫm ở ta. Chuyện rất nhiều công ty lúc đầu thì hứa voi hứa vượn về bảo vệ thông tin người dùng, rồi bẵng đi một thời gian thông tin ấy bay qua tới hai ba bên là chuyện hàng ngày, chẳng một dòng thông báo, chẳng một tin nhắn nhắc nhở và tất nhiên cũng đừng mong X ở trên xin lỗi hay đền bù về cái sự lộ, sự lọt hay sự vô tình bán lấy xiền ấy. Có lẽ cái sự thông báo đến người chủ sở hữu về tình trạng hiện tại của dữ liệu là một sự xa xỉ và tốn tài nguyên không cần quan tâm của cơ số tổ chức ngày nay. Thế nên ông bán cứ bán, ông mua cứ mua còn người dùng có thông tin bị lộ bị mổ xẻ bị trao đổi thì tự chịu, ai bảo mi ngu mi giao dữ liệu cho ta.
Tuyên ngôn được đặt ra ở nguyên tắc này là:
Người ta cần biết mọi thứ về dữ liệu họ đã đồng ý cho bạn sử dụng
Tính tự nguyện
Yếu tố này của vấn đề đạo đức dữ liệu cho phép người dùng được tự do định đoạn dữ liệu cá nhân bất cứ mọi lúc, mọi nơi. Họ cung cấp cho bạn email, số điện thoại, địa chỉ để sử dụng trong tình huống A để nghiên cứu, để phân tích hoặc để thực hiện một hoạt động nào đó. Nhưng người chủ sở hữu có quyền rút lại thông tin này bất cứ khi nào họ muốn mà không gặp bất cứ khó dễ nào. Thậm chí ngoài chuyện rút ra, họ còn được cung cấp quyền để xoá những dữ liệu đó khỏi kho thông tin trong phút mốt à không giây mốt mới đúng. Có lẽ câu chuyện người dùng phải “nhờ” các anh bảo hiểm, các chị bất động sản, các đại ca cho vay xoá hộ thông tin trong kho telesales đi là ví dụ điển hình cho sự bất ổn và tiêu cực khi không tuân theo nguyên tắc này. Nhiều người tức điên lên và chửi đồng, nhiều người phải nhờ các mối quan hệ xa gần và nhiều người khác phải chọn giải pháp “xã hội” lên tận công ty nào đó chỉ để “nhờ” xoá hộ cái thông tin trong danh sách bị gọi. Và tất nhiên các công ty kể trên chà đạp thẳng, à không phải gọi là ị 💩 thẳng vào mặt nguyên tắc này với việc coi sự tình nguyện của chủ sở hữu là cái thứ rẻ rách không đáng quan tâm, khi mà mày đề nghị thì cứ đề nghị còn tao có đồng ý và chấp nhận hay không thì hên xui hoặc do cấp dưới sơ sót chưa kịp xoá.
Tuyên ngôn được đặt ra ở nguyên tắc này là:
Sự cho phép của người ta cần dựa trên tự do, không áp lực và có thể rút mọi lúc.
Ẩn danh
Nguyên tắc tiếp theo của đạo đức dữ liệu là tính ẩn danh của người sở hữu. Có nghĩa là người đang thao tác, chỉnh sửa trực tiếp chỉ có thể biết dữ liệu ấy đến từ các ID vô hồn, và không có sự liên kết nào tới người sở hữu. Chỉ những người có quyền quản trị cao nhất mới có khả năng đọc được hết dữ liệu về người dùng và có quyền liên kết các dữ liệu ấy với nhau còn không chỉ có ID với ID và các thông tin liên quan chứ đừng mong kiểu biết từ A tới Z của một ông nào đó. Và người sở hữu được quyền bảo mật cái sự riêng tư ấy không chỉ ngay khi họ cung cấp mà cả sau này, thậm chí họ đã quên đã từng cho, từng gật đầu, từng nhấn OK cho một đơn vị nào đó được sử dụng. Ví dụ bạn có thể đọc được trong báo cáo cuối cùng ID0010345 có độ dài 🍌 trong khảo sát là cả gang hoặc một đốt thì bạn không được phép và không có quyền tìm ra hoặc lộ ra cái ID0010345 của ai, gắn với ai và ở đâu, tương tự với các dữ liệu khác dù nó có nhạy cảm hay không. Lại lái sang chuyện ở ta, chỉ cần biết một số điện thoại, một email thì không biết bằng một phép thuật thần bí nào đó các đơn vị biết được chuyện người đó sắp đẻ, thậm chí đang tìm thuốc đau xương khớp với yếu sinh lý để mà gọi chào hàng thế mới hay chứ. Rõ ràng vấn đề ẩn danh người dùng đang là một mắt xích quá yếu và thiếu trong các khâu xử lý dữ liệu hiện nay, nếu không muốn nói thẳng là cố tình thiếu chuyên nghiệp để lợi dụng. Chả thế mà mới có chuyện bóc phốt, chuyện gọi điện riêng, chuyện hai bên tự bàn, chuyện can thiệp thô bạo vào thông tin người dùng cả ở những tổ chức mà cái tên đã phải thể hiện tính bảo mật.
Tuyên ngôn được đặt ra ở nguyên tắc này là:
Người ta không thể bị định danh bởi dữ liệu đã đồng ý cung cấp và dữ liệu ấy cũng không được liên kết trực tiếp tới họ.
Tin cẩn
Nói tới đây, hắn dừng lại đôi ba phút để ngẫm nghĩ để nhớ lại có đơn vị nào ở ta xứng đáng ngồi ở cái cấp độ này của đạo đức dữ liệu chưa? Thì hắn bỗng buồn, bỗng chạnh lòng vì sự hiểu biết hạn hẹp, ngu dốt của bản thân, chả có một cái tên nào trong đầu hiện ra cả. Nếu bạn biết một nơi nào như thế, thông não giúp hắn với nhé. Chứ hắn nghĩ nam nghĩ bắc nghĩ trên nghĩ dưới, nghĩ đến đâu là thấy chữ lộ, chữ gọi điện khủng bố, chữ qua tay, chữ buôn, chữ xẻ thịt dữ liệu người dùng thậm chí tệ hơn còn là hành động bóc phốc từ các đơn vị dịch vụ một cách rất thản nhiên và thoải mái, dù chuyện còn đang trong tranh chấp nhưng cứ phải đưa hết cả tên họ, địa chỉ, số điện thoại, vợ con người ta (từng là khách hàng) lên hết đã còn đúng sai để sau, cùng lắm là lỗi thằng đánh máy chứ công ty chúng tôi không có ý vậy. Nên cái yếu tố cuối cùng này khó lắm thay, có nơi nào đáng để người dùng tin tưởng về sự an toàn cho dữ liệu cá nhân, đáng để trao thân gửi phận thông tin riêng đây.
Tuyên ngôn được đặt ra ở nguyên tắc này là:
Dữ liệu của người ta sẽ được bảo mật, không chia sẻ với bất cứ ai mà không có sự chấp thuận của người chủ chia sẻ dữ liệu đó.
Có lẽ nhiều bạn đọc xong bài viết này sẽ cảm thấy nó mơ mộng, hão huyền và quá lý tưởng hoá về việc sử dụng dữ liệu khi mà ngay cả ở phương tây những nguyên tắc này cũng không được tuân thủ 100% tất cả mọi nơi. Đúng là vậy thế nên nó mới là chuyện đạo đức, chuyện mục tiêu để hướng tới. Chả thế mà Facebook liên tục bị gọi lên để điều trần, chả thế mà Zoom thời kỳ đầu từng phải xin lỗi và hứa này hứa kia. Còn ở ta thì có lẽ câu chuyện về đạo đức dữ liệu sẽ còn xa còn dài hơn nữa, khi mà mỗi ngày các phần mềm trên điện thoại phải tự động chặn cơ số người gọi mời này mời kia với đủ thông tin từ A đến Z của khổ chủ.