Khuôn mặt người dùng thành món hàng trên Internet
Dữ liệu khuôn mặt được bán “rẻ như bèo” trên Internet và có thể sử dụng để theo dõi ngược lại người dùng khiến giới công nghệ bất an.
Tháng 10/2019, giáo sư Guo Bing của Đại học Khoa học Công nghệ Chiết Giang (Trung Quốc) đã khởi kiện công viên Safari Hàng Châu vì vi phạm thỏa thuận sử dụng, sau khi họ thay thế hệ thống kiểm soát vào cổng dựa trên dấu vân tay bằng nhận dạng khuôn mặt.
Vụ kiện đầu tiên liên quan đến nhận diện khuôn mặt khiến giáo sư Fu Hualing của Đại học Hong Kong đặt ra nghi vấn: “Tại sao một vườn thú thu thập dữ liệu khuôn mặt? Bởi vì dữ liệu có giá trị thương mại”.
Dữ liệu khuôn mặt giá “rẻ như bèo”
“Bạn chỉ cần gửi hình ảnh mình cần, vài giây sau bạn sẽ có tất cả thông tin về người đó. Bạn sẽ có quyền truy cập vào toàn bộ hệ thống dữ liệu khuôn mặt của chúng tôi. Bạn cũng có thể lập danh sách theo dõi riêng. Giá cả phải chăng hơn bạn nghĩ…” – đó là những dòng giới thiệu về công cụ nhận diện khuôn mặt trên một website của Anh. Khách hàng mục tiêu của trang web này là các cửa hàng thời trang, nhà bán lẻ, nhà hàng, khách sạn…
Hình ảnh chứa 2.000 danh tính có trong cơ sở dữ liệu MS Celeb của Microsoft.
Nếu muốn tìm dữ liệu khuôn mặt miễn phí, bạn có thể dùng PimEyes, một ứng dụng của Mỹ. Bạn tải lên công cụ này ảnh của một người bất kỳ. Hệ thống sẽ trả về ảnh khuôn mặt của người đó trên các website phổ biến, như Tumblr, YouTube, WordPress, các trang tin tức…
Để tạo ra doanh thu, PimEyes cung cấp gói trả phí, cho người dùng biết được kết quả trên được lưu trên website nào, gửi thông báo nếu hình mới của người đó được tải lên. Nhà phát triển cũng cho phép lập trình viên tìm kiếm hình ảnh trên cơ sở dữ liệu của họ. Nói cách khác, PimEyes đang công khai bán dữ liệu người dùng họ thu thập được cho khách hàng cá nhân.
PimEyes hoạt động tương tự Clearview AI – ứng dụng nhận diện khuôn mặt của kỹ sư gốc Việt từng gây tranh cãi ở Thung lũng Silicon. Khác biệt là Clearview AI chỉ cung cấp cho cơ quan chức năng để truy dấu tội phạm, còn PimEyes được bán công khai cho bất kỳ ai có nhu cầu theo dõi người nào họ muốn.
Trong khi phương Tây đang loay hoay nên nhìn nhận công nghệ này theo hướng nào, thì ở Trung Quốc, dữ liệu khuôn mặt đã trở thành một phần thiết yếu trong cuộc sống. Việc các gói dữ liệu khuôn mặt bị rò rỉ và rao bán rẻ mạt trên các trang thương mại điện tử không còn là tin chấn động.
Cuối 2019, 5.000 khuôn mặt biểu cảm khác nhau được rao bán công khai trên trang thương mại điện tử Zhuanzhuan với giá 10 nhân dân tệ (hơn 32 nghìn đồng). Giá trung bình cho mỗi bức hình chỉ khoảng 0,5 nhân dân tệ (1.600 đồng). Tuy nhiên, nếu người bán cung cấp thêm số chứng minh nhân dân, thông tin tài khoản ngân hàng và số điện thoại di động của người trong hình, giá sẽ tăng lên 4 nhân dân tệ (13.000 đồng). Phần lớn dữ liệu này được thu thập qua mạng xã hội Weibo hoặc công cụ tìm kiếm hình ảnh Baidu.
Đến đầu tháng 4/2020, Economic View phát hiện ảnh của hơn 20.000 người đeo khẩu trang được rao bán công khai. Giá mỗi bức là 0,05 nhân dân tệ. Điều đáng nói là gói dữ liệu này được rao bán ngay sau khi Trung Quốc thay đổi công nghệ nhận diện khuôn mặt do tác động của Covid-19. Điều này cho thấy dữ liệu khuôn mặt đang là món hàng được săn đón và “sản xuất” không khó.
Người dùng đang tự bán rẻ mình
Ban đầu, dữ liệu người dùng được thu thập công khai bởi các công ty lớn, phục vụ mục đích nghiên cứu. Về sau, với sự phát triển của công nghệ, việc thu thập dữ liệu trở lên dễ dàng hơn. Phân nửa dữ liệu khuôn mặt bị rao bán rẻ mạt được thu thập từ Weibo, Facebook, Instagram… Tất cả đều miễn phí. Đó là một trong những lý do khiến các gói dữ liệu này rẻ như vậy.
Tiếp đến, dữ liệu khuôn mặt cũng được thu thập bởi những phần mềm, ứng dụng miễn phí, như phần mềm chỉnh sửa ảnh, đoán tuổi, bạn giống ngôi sao điện ảnh nào… Ví dụ, trong ứng dụng “Xếp hạng sắc đẹp” ở Trung Quốc, nhà phát triển đã thêm vào điều khoản: “Nhà phát triển có quyền sử dụng bất kỳ nội dung nào được người dùng đăng tải (bao gồm ảnh tự chụp) miễn phí, lâu dài và không bị thu hồi trên phạm vi toàn thế giới”.
Người dùng rất ít đọc những điều khoản này và nếu kiên nhẫn ngồi dò hàng dài các điều khoản, cuối cùng họ vẫn chấp nhận đánh đổi chút quyền riêng tư để được dùng miễn phí.
Sức mạnh của công nghệ nhận diện là không thể chối bỏ nhưng nó cũng khiến người dùng phải lo sợ khi bị lạm dụng.
Apple Daily dẫn lời Phương Bảo Kiều, Hội trưởng danh dự của Hội Khoa học kỹ thuật Thương mại Thông tin Hong Kong: “Trên mạng có rất nhiều loại ứng dụng theo dõi lộ trình, ngoại hình hoặc dấu vân tay. Từ đó, các đặc điểm sinh học cá nhân có thể bị đánh cắp. Vì vậy, người dùng cố gắng tránh tải các ứng dụng như vậy”.
Nhưng không phải lúc nào người dùng cũng được quyền chủ động về việc cung cấp dữ liệu khuôn mặt. Một số hệ thống chấm công, máy quay an ninh tại các công ty, nhà hàng, trung tâm thương mại… cũng âm thầm lưu trữ dữ liệu của khách và sử dụng vào những mục đích riêng.
Ngay cả những công ty lớn, như Facebook, Google, Amazon, IBM, Microsoft…, cũng đều phát triển kho dữ liệu khuôn mặt. Điều này có nghĩa là người dùng càng tải lên nhiều hình ảnh cá nhân, kho dữ liệu của nền tảng này càng lớn. Hệ thống AI sẽ càng có nhiều hình ảnh để học và cải thiện độ chính xác. Khi kho dữ liệu đủ lớn và cho kết quả tin cậy, các công ty công nghệ bắt đầu đem bán chúng cho các cơ quan chính phủ. Ban đầu, công nghệ tỏ ra hữu dụng khi chúng được dùng để tìm kiếm tội phạm, nhưng mọi thứ đang đi quá giới hạn khi công nghệ nhận diện khuôn mặt được dùng nhiều hơn vào việc kiểm soát công dân.
Nhiều nơi đã cấm công nghệ nhận diện khuôn mặt
“Không giống các thông tin sinh học khác như dấu vân tay hay DNA, dữ liệu khuôn mặt có thể bị thu thập mà người dùng không biết hoặc không chấp thuận”, SCMP dẫn lời giáo sư Lao Donyan của Đại học Thanh Hoa rằng, thông tin nhận dạng khuôn mặt có thể được bán cho các công ty quảng cáo. Nếu dữ liệu đó bị rò rỉ, thiệt hại thông thể khắc phục. Điều này đặc biệt nguy hiểm nếu các thông tin cá nhân lọt vào tay tội phạm công nghệ cao.
Bất chấp những lo ngại của người dân, Trung Quốc vẫn tiếp tục khuyến khích phát triển công nghệ nhận diện khuôn mặt với tham vọng dẫn đầu thế giới. Trong khi đó, ở Mỹ, các công ty công nghệ có cái nhìn nghiêm túc hơn về công nghệ này. IBM, Amazon và Microsoft đều tuyên bố ngừng bán công nghệ nhận diện khuôn mặt cho cảnh sát.
Lý do họ đưa ra là chính phủ liên bang chưa có luật lệ nào điều chỉnh việc sử dụng công nghệ này. IBM thậm chí tuyên bố rút khỏi thị trường nhận diện khuôn mặt do lo ngại sự thiếu kiểm soát. Ngay sau đó Amazon cũng đưa ra thông báo dừng cấp phép sử dụng cho cảnh sát Mỹ. Tuy nhiên, họ vẫn cho phép các tổ chức như Trung tâm tìm kiếm về trẻ mất tích và lạm dụng sử dụng bản thương mại. Tập đoàn Microsoft cũng yêu cầu chính phủ Mỹ ban hành luật quốc gia liên quan tới công nghệ nhận diện khuôn mặt.
Một số thành phố ở Mỹ như San Francisco, Somerville, thậm chí cấm cảnh sát sử dụng công nghệ nhận diện khuôn mặt. Liên minh Châu Âu đang cân nhắc ban hành lệnh cấm tạm thời trong vòng 5 năm đối với việc sử dụng công nghệ nhận diện khuôn mặt ở nơi công cộng.
Trong khi công nghệ nhận diện đang trở thành vấn đề gây lo ngại và hệ thống pháp luật chưa kịp hoàn thiện để kiểm soát nó khỏi bị lạm dụng, cách duy nhất để người dùng tự bảo vệ mình là hạn chế sử dụng những ứng dụng yêu cầu thu thập dữ liệu hình ảnh và không đăng quá nhiều ảnh đời tư lên các nền tảng công cộng. Trong trường hợp bắt buộc phải đưa hình ảnh lên Internet, người dùng nên chỉnh sửa hình ảnh. Chúng sẽ thay đổi một số điểm ảnh trên khuôn mặt đảm bảo mắt thường khó phát hiện ra khác biệt. Nhưng những thay đổi nhỏ này lại khiến máy móc không nhận diện chính xác được khuôn mặt, vì dù sao chúng cũng hoạt động theo các thuật toán được lập trình sẵn và có thể bị đánh lừa bằng một thuật toán khác.
AI 'hô biến' ảnh chân dung mờ đến mức không thể thấy rõ được mặt thành ảnh sắc nét gấp 64 lần
Nhờ ứng dụng trí tuệ nhân tạo, hệ thống có thể biến ảnh chân khuôn mặt có mật độ điểm ảnh 16 x 16 pixel thành ảnh 1.024 x 1.024 pixel chỉ trong vài giây, tức bổ sung hơn một triệu điểm ảnh.
Theo Newsweek, một nhóm các nhà nghiên cứu của Đại học Duke (North Carolina, Mỹ) đã phát triển một thuật toán AI có tên gọi là PULSE, vốn có thể biến những tấm ảnh có độ phân giải cực thấp, thậm chí mờ đến mức không thể nhận rõ được khuôn mặt, thành những bức chân dung rõ nét, chân thực hơn bao giờ hết.
Nhóm nghiên cứu cho biết, thuật toán xử lý ảnh PULSE không được phát triển để nhằm xác định danh tính người trong ảnh, hay làm rõ nét khuôn mặt từ các bức ảnh có độ phân giải thấp của camera an ninh. Thay vào đó, nó có khả năng tạo ra những khuôn mặt mới không tồn tại ngoài đời thực, nhưng trông cực kỳ giống thật.
Cụ thể, dựa trên bức ảnh gốc được nhập vào hệ thống, trí tuệ nhân tạo AI sau đó sẽ phân tích và 'tưởng tượng" một loạt các đường nét, chi tiết trên khuôn mặt như nốt ruồi, nếp nhăn, độ uốn của râu tóc...vốn không có trong bức ảnh ban đầu, sau đó tạo ra một loạt hình ảnh khuôn mặt có độ phân giải cao chỉ trong vài giây. Từ những hình ảnh này, hệ thống sẽ tiếp tục lựa chọn ra hình ảnh giống với ảnh gốc nhất có thể, kể cả khi thu nhỏ (downscale) về cùng một kích thước / độ phân giải.
Cơ chế hoạt động của thuật toán Pulse: Tạo ra một loạt hình ảnh khuôn mặt có độ phân giải cao chỉ trong vài giây, sau đó lựa chọn ra hình ảnh giống với ảnh gốc nhất có thể
Để thực hiện điều này, nhóm nghiên cứu đã sử dụng một công cụ trong học máy gọi là Mạng đối nghịch sáng tạo (GAN), bao gồm 2 mạng cùng được 'đào tạo' trên một tập dữ liệu ảnh.
Mạng thứ nhất sẽ đảm nhiệm vai trò 'sáng tạo', tự động ra các khuôn mặt bằng AI sao cho các chi tiết trên mặt trông tự nhiên và thật nhất có thể. Trong khi đó, mạng thứ hai có nhiệm vụ 'giám sát', nhằm xác định những bức ảnh được tạo ra bởi mạng thứ nhất đã đủ tính chân thực hay chưa.
Ảnh chân dung gốc của các nhà nghiên cứu (hàng 1) và ảnh sau khi đã được xử lý làm mờ (hàng 2). Từ một hình ảnh mờ nhạt và có độ phân giải thấp, PULSE có thể tạo ra các bức chân dung gần giống như thật, nhưng sắc nét hơn nhiều so với các phương pháp trước đây.
Theo nhóm nghiên cứu, việc sử dụng song song cả 2 mạng sẽ giúp mạng thứ nhất có thêm 'kinh nghiệm' trong việc tạo ra các bức ảnh chân dung xóa nhòa ranh giới thực ảo, tới mức mạng thứ hai cũng không thể phân biệt được. Nhờ đó, PULSE có thể tạo ra hình ảnh trông như thật từ bức ảnh đầu vào chất lượng kém mà các phương pháp xử lý ảnh khác không thể làm được.
Được biết, thuật toán Pulse của nhóm có khả năng xử lý và nâng cấp độ phân giải hình ảnh lên tới 64 lần so với ảnh gốc. Hệ thống có thể biến ảnh chân khuôn mặt có mật độ điểm ảnh 16 x 16 pixel thành ảnh 1.024 x 1.024 pixel chỉ trong vài giây, tức bổ sung hơn một triệu điểm ảnh.
Theo nhóm nghiên cứu, thuật toán PULSE sẽ không chỉ giới hạn trong việc làm rõ nét ảnh chân dung. Thay vào đó, nó có thể để ứng dụng trong các lĩnh vực từ kính hiển vi trong y học đến hình ảnh vệ tinh trong lĩnh vực thiên văn, tạo ra những bức ảnh sắc nét và chân thực nhất có thể. Dự kiến, nhóm nghiên cứu của đại học Duke sẽ giới thiệu PULSE tại Hội thảo CVPR 2020 dự kiến kéo dài tới ngày 19/6 tới đây.
Đứt cáp liên tục, Việt Nam vẫn tăng 5 bậc trên BXH thế giới về tốc độ mạng Việt Nam vừa tăng 5 bậc trên bảng xếp hạng thống kê toàn thế giới về tốc độ mạng Internet băng thông rộng. Theo báo cáo mới nhất từ Ookla, một công ty phát triển Speedtest đo tốc độ Internet, Việt Nam vừa tăng 5 bậc trên bảng xếp hạng thống kê toàn thế giới về tốc độ mạng băng thông rộng. Mặc...