Facebook bị lật tẩy dự án phân loại bài viết bằng con người

Tạ Lê Trúc Quỳnh04:33 07/05/2019

Chương trình phân loại bài viết bằng sức người của Facebook chưa từng được công bố rõ ràng. Điều đó gây lo ngại mạng xã hội lớn nhất thế giới đang xâm phạm quyền riêng tư của người dùng.

Trong năm qua, một nhóm khoảng 260 nhân viên hợp đồng tại Hyderabad, Ấn Độ đã “cày xới” hàng triệu ảnh, cập nhật trạng thái và nội dung khác được đăng trên Facebook từ năm 2014. Công việc của họ là phân loại các bài viết theo 5 câu hỏi hay 5 “chiều”, như cách mà Facebook gọi.

Theo Reuters, 5 câu hỏi này bao gồm: Cái gì thể hiện trong bài viết (bản thân, tòa nhà, công trình, thức ăn, thú vật, người lớn, thiếu niên, tự nhiên); Bài đăng nhân dịp gì (nơi chốn/hoạt động hàng ngày, sự kiện tiêu cực/tích cực quan trọng trong đời); Có yếu tố thái quá không (suy nghĩ, ý kiến, cảm giác); Vì sao tác giả đăng bài này (lên kế hoạch, cập nhật cuộc sống của người khác cho mọi người, giải trí, truyền cảm hứng, chia sẻ thứ gì đó về tôn giáo); Bối cảnh của bài viết (nhà, công ty, trường học, sự kiện thể thao , ngoài trời, giao thông).

Mục đích là tìm hiểu các loại nội dung người dùng đăng lên Facebook thay đổi ra sao, giúp họ phát triển tính năng mới nhằm tăng lượng sử dụng và doanh thu quảng cáo. Chi tiết về dự án được một số nhân viên giấu tên của Wipro cung cấp. Facebook sau đó xác nhận nhiều chi tiết còn Wipro từ chối bình luận.

Quan chức Facebook cho biết công việc tại Wipro chỉ là 1 trong khoảng 200 dự án dán nhãn họ đang triển khai với hàng ngàn nhân viên trên toàn cầu. Nhiều dự án nhằm “đào tạo” phần mềm có tác dụng xác định những gì xuất hiện trên bảng tin của người dùng và sử dụng cho trí tuệ nhân tạo. Những nỗ lực dán nhãn này chưa từng được đưa tin.

Theo các chuyên gia luật mà Reuters tham vấn, chương trình dán nhãn của Facebook có thể làm dấy lên các vấn đề về quyền riêng tư mới đối với công ty. Mạng xã hội đang bị điều tra khắp thế giới vì một loạt hành vi lạm dụng quyền riêng tư, bao gồm cả việc chia sẻ dữ liệu người dùng với đối tác kinh doanh.

Nhân viên của Wipro nói họ nhìn vào cuộc sống của người khác khi xem bức ảnh du lịch hay bài viết tưởng nhớ người đã khuất. Facebook thừa nhận một số bài viết, bao gồm các ảnh chụp màn hình và bình luận, có thể chứa tên người dùng. Công ty mới đây giới thiệu hệ thống kiểm tra nhằm đảm bảo quy định về quyền riêng tư được tuân thủ.

Video đang HOT

Luật bảo vệ dữ liệu chung (GDPR) của EU có những quy định nghiêm ngặt về phương thức thu thập và dùng dữ liệu cá nhân của doanh nghiệp, trong nhiều trường hợp yêu cầu phải có sự cho phép cụ thể. Theo ông John Kennedy tại hãng luật Wiggin & Dana, nếu mục đích là xem xét bài viết để cải thiện dịch vụ, nó phải được công bố rõ ràng. Thuê đối tác bên ngoài cũng cần phải được chấp thuận.

Không rõ cơ quan quản lý EU nhìn nhận sự việc này thế nào và người dùng có xem hành vi của Facebook là có vấn đề hay không. Thượng nghị sỹ Mark Warner của Đảng Dân chủ tuyên bố các nền tảng lớn đang tăng cường “lấy dữ liệu nhiều hơn từ người dùng cho mục đích sử dụng rộng hơn và sâu hơn mà không có bất kỳ bồi thường xứng đáng nào cho họ”. Ông đang dự thảo quy định yêu cầu Facebook “tiết lộ giá trị của dữ liệu người dùng và thông báo cho người dùng biết chính xác dữ liệu của họ đang bị kiếm tiền như thế nào”.

Chi tiết dự án

Dán nhãn nội dung bằng con người, hay còn gọi là “diễn giải dữ liệu”, là ngành công nghiệp tăng trưởng khi nhiều công ty tìm cách khai thác dữ liệu để đào tạo AI và các mục đích khác. Google hay Amazon đều có các dự án tương tự.

Facebook khởi động dự án Wipro tháng 4/2018. Doanh nghiệp Ấn Độ nhận hợp đồng 4 triệu USD và lập nhóm 260 người. Năm ngoái, công việc bao gồm phân tích các bài viết từ 5 năm trước đó (2014). Sau khi hoàn thành, nhóm cắt giảm 30 người vào tháng 12 và chuyển sang dán nhãn các bài viết từ tháng trước. Công việc dự kiến kéo dài ít nhất đến năm 2019. Nhân viên không được biết về mục đích hay kết quả dự án. Từ vị trí của mình, nhân viên cho biết ảnh tự sướng ngày một phổ biến.

Các bài viết là tập hợp ngẫu nhiên cập nhật trạng thái, liên kết được chia sẻ, bài viết sự kiện, Stories, video , ảnh, bao gồm cả ảnh chụp màn hình các đoạn chat trên các ứng dụng nhắn tin khác của Facebook mà người dùng đăng lên. Chúng đến từ Facebook, Instagram , viết bằng tiếng Anh, Hindi và Ả-rập. Mỗi bài viết được cấp cho 2 người để kiểm tra tính chính xác và người thứ 3 nếu họ bất đồng quan điểm. Nhân viên nói họ trung bình xem 700 bài mỗi ngày.

Tại một dự án dán nhãn khác của Facebook, một nhân viên nói rằng anh và ít nhất 500 đồng nghiệp phải tìm kiếm các chủ đề nhạy cảm hay từ ngữ tục tĩu trong video Facebook. Mục đích là đà tạo công cụ tự động giúp nhà quảng cáo tránh được việc tài trợ những video người lớn, chính trị.

Người dùng Facebook không được lựa chọn thoát khỏi việc dữ liệu của mình bị phân loại. Tại Wipro, bài viết được kiểm tra không chỉ là bài viết công khai mà còn có cả bài viết được chia sẻ với một nhóm giới hạn. Theo Karen Courington, Giám đốc hoạt động hỗ trợ sản phẩm Facebook, nó giúp đảm bảo phản ánh toàn diện các hoạt động trên Facebook và Instagram.

Tuy nhiên, Reuters chỉ ra chính sách dữ liệu của Facebook không đề cập đến phân tích thủ công một cách rõ ràng.

Theo Reuters

Nghị sĩ Mỹ trình dự luật cấm mạng xã hội 'lừa' người dùng

Hai thượng nghị sĩ Mỹ vừa giới thiệu dự luật cấm các công ty mạng xã hội như Facebook và Twitter sử dụng thủ thuật 'đánh lừa' người dùng cung cấp dữ liệu cá nhân.

Hai thượng nghị sĩ Mỹ muốn có luật chấm dứt tình trạng mạng xã hội dùng thủ thuật lừa người dùng cung cấp thông tin cá nhân

Theo dự luật của hai thượng nghị sĩ Mark Warner và Deb Fischer, các nền tảng trực tuyến bao gồm mạng xã hội với trên 100 triệu người dùng/tháng sẽ bị cấm thiết kế những trò chơi gây nghiện hoặc nội dung nhắm đến trẻ em dưới 13 tuổi, theo Reuters.

Dự luật này được đưa ra là nhằm chống lại tình trạng các công ty công nghệ dùng thủ thuật "dark pattern" (tạm dịch là Thiết kế đen), tức sử dụng thiết kế giao diện bắt mắt lợi dụng sự ảnh hưởng và niềm tin nhằm lừa người dùng để lấy thông tin cá nhân hoặc thuyết phục họ thực hiện một việc nào đó.

"Những thủ thuật dark pattern lừa người dùng đến nhấp chọn nút OK, dẫn đến tự động chuyển hết thông tin liên lạc, tin nhắn, lịch sử tìm kiếm, hình ảnh hoặc thậm chí địa điểm", thượng nghị sĩ Fischer cho biết.

Động thái này diễn ra sau khi Facebook hồi năm 2018 bị phanh phui việc dính líu đến vụ bê bối bán thông tin mà không thông báo và nhận được sự đồng ý của người dùng. Bên cạnh đó, thời gian gần đây chính phủ các nước trên thế giới đang tăng cường biện pháp quản lý nhằm ngăn chặn thông tin độc hại và giả mạo trên mạng xã hội.

Thượng nghị sĩ Mark Warner (trái) và Deb Fischer - Ảnh: Reuters

Theo kết quả khảo sát của hãng Maru/Matchbox công bố ngày 9.4, khoảng 52% người dân Mỹ và 48% người dân Canada cho biết họ tìm hiểu những gì đang diễn ra trên thế giới thông qua mạng xã hội như Facebook, Instagram và Twitter. Tuy nhiên, tỷ lệ tin tưởng thông tin trên mạng xã hội sụt giảm, 43% ở Mỹ và 32% ở Canada.

Trong khi đó, hơn 80% người dân ở Canada và Mỹ cho hay giờ đây họ tin tưởng vào truyền thông chính thống bao gồm báo chí, truyền hình và đài phát thanh.

Đa số người tham gia khảo sát cho biết thông tin về chính trị trên mạng xã hội đa phần là sai lệch hoặc giả mạo. Dù vậy, phân nửa người tham gia khảo sát tự tin họ có thể dễ dàng phát hiện tin nào là giả hoặc thật. Cuộc khảo sát được tiến hành với 1.516 người ở Canada và 1.523 người dân Mỹ.

Theo thanh niên

Nhận định của 7 chuyên gia Mỹ về rủi ro an ninh trên thiết bị Huawei Chuyên trang công nghệ The Verge đã tập hợp ý kiến khác nhau của 7 chuyên gia uy tín tại Mỹ để làm rõ những nghi ngờ về khả năng bảo mật trên thiết bị viễn thông của Huawei. Ảnh minh họa: The Verge. Trong bối cảnh lo ngại về rủi ro bảo mật trên thiết bị Huawei leo thang, các nhà lập...

Bạn thấy bài viết này có hữu ích không?

Có

Không

Tin liên quan

Xem thêm Share

Xem nhiều

Vợ sinh con 1 tháng, bắt quả tang chồng quạt cho tiểu tam ngủ ngoài đường: Trước đây cũng suýt là... tiểu tam00:18

Đám tang diễn viên Ngọc Trinh: NS Công Ninh khóc nghẹn, Quách Ngọc Tuyên ngồi thất thần, Nam Thư cùng dàn sao đến viếng00:38

Từ ánh mắt rưng rưng, móng tay màu nguyên bản đến giọng ca tràn đầy cảm xúc: Lý do vì sao Mỹ Tâm vẫn là "họa mi" rực rỡ nhất Vpop01:12

'Gió ngang khoảng trời xanh' tập 12: Mỹ Anh sốc vì con trai bị chơi xấu03:12

Nữ ca sĩ được diễn từ Đại lễ A50 đến A80: Đắt show bậc nhất thế hệ, cát-xê gây choáng làm CEO từ 20 tuổi03:16

Ca sĩ từng bị chê "nhạc tầm thường" nay có ca khúc gây sốt Đại lễ 2/9, tỏa sáng ở sự kiện cấp quốc gia03:13

Tiến sĩ Đoàn Hương: 'Status của Trấn Thành lạc điệu, nguy hiểm'16:59

Cardi B trắng án, 'đốp chát' căng với phóng viên ngay sau khi kết thúc phiên tòa03:36

Căn bệnh khiến Ngọc Trinh qua đời ngày càng nguy hiểm, người trẻ càng dễ mắc?02:42

Gia đình Ngọc Trinh để bảng cấm Youtuber làm 3 điều, mẹ ruột từng khuyên qua Mỹ02:42

Bí mật chưa từng kể của chiến sĩ gây ám ảnh nhất phim 'Mưa đỏ'02:03

Tiêu điểm

Tin đang nóng

Tin mới nhất

Khám phá không gian tại Bảo tàng Vũ trụ Việt Nam

10:26:31 06/09/2025

Đây là nơi lý tưởng để khơi dậy niềm đam mê khám phá cho thế hệ trẻ, nhất là khi Việt Nam đang đẩy mạnh phát triển lĩnh vực không gian.

OpenAI tự sản xuất chip

10:18:37 06/09/2025

Các nguồn tin cho rằng OpenAI thiết kế chip AI tùy chỉnh này với sự hợp tác của nhà sản xuất bán dẫn Broadcom tập đoàn vừa thông báo có một khách hàng mới, với đơn đặt hàng lên tới 10 tỷ USD.

Cảnh báo về những ứng dụng VPN Android chứa lỗ hổng bảo mật

09:31:19 05/09/2025

Đặc biệt, một số ứng dụng trong danh sách còn bị phát hiện có liên hệ với nhiều nhóm tin tặc nổi tiếng, điều này làm dấy lên lo ngại về khả năng thu thập dữ liệu người dùng.

Sider AI: Làm việc nhanh gấp 10 lần chỉ với một công cụ

09:26:52 05/09/2025

Sider AI là một trợ lý trí tuệ nhân tạo đa năng tích hợp ngay trên trình duyệt web, giúp người dùng thực hiện nhiều tác vụ nhanh chóng.

Mô hình AI có thể mở ra triển vọng mới trong việc chăm sóc mắt

08:38:19 05/09/2025

Trong các thử nghiệm mù đôi và mù đơn đối với 668 bệnh nhân có nguy cơ cao tại Trung Quốc, 16 bác sỹ chuyên khoa mắt đã được sắp xếp ngẫu nhiên sử dụng EyeFM hoặc phương pháp chẩn đoán thông thường đối với bệnh võng mạc.

Google Maps trên Android sắp có thể chỉ đường không cần mở ứng dụng

12:44:17 04/09/2025

Theo PhoneArena, một trong những tính năng được người dùng Android mong chờ nhất cuối cùng bắt đầu xuất hiện, đó là khả năng xem chỉ đường Google Maps ngay trên màn hình khóa và thanh trạng thái.

Thấy gì từ cuộc 'đột kích' của Nhà Trắng vào ngành chip?

11:54:48 04/09/2025

Chính phủ Mỹ trở thành cổ đông lớn nhất của Intel nhưng nỗ lực vực dậy một công ty đang thua lỗ có thể là cuộc đột kích thất bại vào ngành chip.

Haidilao thu về hơn 1.100 tỷ đồng tại Việt Nam, hiệu suất mỗi cửa hàng đạt gần 70 tỷ trong 6 tháng

10:27:35 03/09/2025

Trên toàn cầu, Super Hi International đang vận hành 126 nhà hàng tính đến hết quý II/2025, cho thấy quy mô tại thị trường Việt Nam chiếm một tỷ trọng đáng kể trong mạng lưới quốc tế của tập đoàn.

Top 5 robot hút bụi đáng mua năm 2025 giúp tiết kiệm thời gian vệ sinh nhà

10:00:18 03/09/2025

Với sự phát triển của công nghệ, các mẫu robot hút bụi ngày nay không chỉ có khả năng hút bụi mà còn tích hợp nhiều tính năng thông minh như lau nhà, tránh vật cản bằng AI, tự động đổ rác và giặt giẻ lau.

Công nghệ tạo ra cuộc 'cách mạng xanh' trong ngành thời trang

09:18:31 03/09/2025

Một yếu tố quan trọng khác là công nghệ chuỗi khối (blockchain) trong minh bạch hóa nguồn gốc sản phẩm. Người tiêu dùng ngày nay không chỉ quan tâm đến mẫu mã mà còn chú ý đến tính bền vững và đạo đức trong sản xuất.

Năm ngành nghề sẽ bị AI hoàn toàn 'chiếm lĩnh' vào năm 2026

09:17:10 03/09/2025

AI không còn là một khái niệm tương lai nữa; nó đã và đang thay đổi cách con người sống và làm việc! Một số tổ chức uy tín dự đoán AI có thể thay thế 300 triệu việc làm trong vài năm tới và 5 ngành sẽ bị AI hoàn toàn chiếm lĩnh vào năm ...

Google phát đi cảnh báo tới 2,5 tỷ người dùng Gmail kèm khuyến cáo khẩn

09:12:40 03/09/2025

Bạn cũng nên tận dụng thời gian này để cập nhật tất cả các câu hỏi bảo mật và thông tin khôi phục tài khoản như email và số điện thoại, để đảm bảo có cách chính xác để khôi phục tài khoản khi cần thiết.