Instagram dùng AI để chọn nội dung đề xuất
Instagram lần đầu tiết lộ cách họ sử dụng công nghệ AI để chọn những nội dung đề xuất trên tab Khám phá ( Explore Tab).
Ivan Mevedev, kỹ thuật viên của Instagram, cho biết nội dung được người dùng tải lên mỗi ngày rất đa dạng, nên việc đề xuất những nội dung thú vị cho người dùng không hề dễ dàng. Do đó, Instagram đã xây dựng hệ thống học máy, tập trung vào những tài khoản có thể khiến người dùng quan tâm.
Nhờ thuật toán học máy, nội dung trên Explore Tab của Instagram trở nên hấp dẫn hơn.
Để xác định tài khoản nào đang thu hút người dùng, đội ngũ kỹ thuật viên đã sử dụng một phương pháp học máy phổ biến là “nhúng từ” (word embedding). Qua đó, hệ thống AI sẽ phân tích tần số xuất hiện và mối quan hệ giữa các từ lặp lại trong bài đăng. Ví dụ, hệ thống sẽ lưu ý từ “lửa” (fire) hay xuất hiện trong cụm “ xe cứu hỏa” (fire-truck) và “chuông báo cháy” (fire-alarm). Instagram cũng ứng dụng quy trình tương tự để xác định mức độ liên quan giữa hai tài khoản với nhau.
Công đoạn tiếp theo là lựa chọn nội dung đề xuất. Hệ thống bắt đầu bằng việc tham khảo “tài khoản hạt giống” – những tài khoản đã được người dùng thích hoặc chia sẻ bài đăng trong quá khứ. Sau đó, AI sẽ chọn ra 500 nội dung ngẫu nhiên của tài khoản tương tự “tài khoản hạt giống”. Các nội dung này được sàng lọc để loại bỏ tin nhắn rác (spam), thông tin sai lệch và vi phạm chính sách. Cuối cùng, 25 bài đăng được hệ thống dự đoán có nhiều khả năng được người dùng tương tác nhất sẽ được cập nhật lên Explore Tab.
Dù không bị chỉ trích nhiều như tính năng gợi ý video của YouTube, hệ thống đề xuất nội dung của Instagram vẫn bị cho là chứa các thông tin mang tính thù ghét và sai lệch. Theo Verge, quy trình trên của Instagram vẫn chưa thực sự minh bạch vì mạng xã hội này không nói rõ các tiêu chuẩn phân loại tin nhắn rác, thông tin sai sự thật, hoặc tần suất sử dụng hệ thống AI…
Theo vnexpress
Chính nhà phát triển thuật toán của YouTube cho rằng các nội dung đề xuất của nền tảng này là độc hại
Để giữ chân bạn càng lâu càng tốt trong YouTube, thuật toán đề xuất của nền tảng này thậm chí còn đưa ra cả các nội dung độc hại.
Video đang HOT
Từ chỗ một trang web để lưu trữ và xem video trực tuyến, YouTube đã trở thành một nền tảng rộng lớn, độc nhất vô nhỉ và gần như không có đối thủ nào có thể so sánh được. Một trong các bí quyết làm nên thành công của họ chính là những thuật toán đề xuất video phù hợp với sở thích người xem.
Tuy nhiên, theo lời của một trong những nhà phát triển làm nên thuật toán này, bản chất của thuật toán này không thực sự tuyệt vời như vậy. Nó đang trở thành nguồn gốc cho một loạt vấn đề về quản lý nội dung trên nền tảng này, đặc biệt khi kéo theo việc ra đời những đoạn video phản cảm hoặc phát tán và lan truyền tin giả.
Các đề xuất của YouTube là sự lãng phí thời gian
Các đề xuất của YouTube hiện ra trong danh sách "Up Next" ở phía bên phải màn hình và chúng sẽ được tự động chơi khi chúng ta bật tính năng xem tự động. Mọi người thường cho rằng các đề xuất này sẽ phù hợp với những gì người dùng muốn để họ có thể xem nhiều hơn và ở lại lâu hơn trên nền tảng này.
Tuy nhiên, theo Guillaume Chaslot, nhà phát triển từng làm việc với Google về thuật toán đề xuất của YouTube, điều này không hoàn toàn đúng như vậy. Anh cho rằng, động lực nằm sâu bên trong thuật toán này không thực sự vì những gì người xem muốn.
" Việc YouTube sử dụng AI để đề xuất video cho bạn không phải điều gì quá kinh khủng, bởi vì nếu AI được tinh chỉnh tốt, nó có thể giúp bạn có được những gì bạn muốn. Điều này sẽ thật tuyệt vời. Nhưng vấn đề là AI không được xây dựng để giúp bạn có được những gì bạn muốn - nó được xây dựng để làm bạn nghiện YouTube. Các đề xuất được thiết kế để lãng phí thời gian của bạn."
Nhà phát triển Guillaume Chaslot.
Theo lời giải thích của Chaslot, thước đo cho sự thành công của thuật toán là thời gian xem. Điều này có thể thật tuyệt diệu cho một công ty đang cố gắng bán quảng cáo, nhưng không thực sự phản ánh điều người dùng cần - và nó đã sinh ra một hiệu ứng phụ.
Trong bài phát biểu của mình tại Hội nghị DisinfoLab Conference vào tháng trước, Chaslot nhấn mạnh rằng, các nội dung gây chia rẽ và nhạy cảm thường được đề xuất rộng rãi - những chủ đề liên quan đến thuyết âm mưu, tin giả, ... vì chúng mang lại nhiều tương tác. Về cơ bản, chúng là các nội dung cận biên, nghĩa là vẫn nằm trong giới hạn cho phép của YouTube, nhưng ranh giới của chúng với các nội dung bị cấm lại rất mong manh.
Cho dù Google không đồng tình với tuyên bố của Chaslot, thì vào năm ngoái, chính Mark Zuckerberg cũng thừa nhận rằng, những loại nội dung cận biên này sẽ có nhiều tương tác hơn. Trong khi đó, đại diện của YouTube cho biết, nghiên cứu của công ty cho thấy, người dùng thực sự tương tác nhiều hơn với các nội dung chất lượng. Tuy nhiên, dựa trên kinh nghiệm của mình, Chaslot tin tưởng hơn vào Zuckerberg trong trường hợp này.
" Chúng tôi nhận ra rằng các đề xuất của YouTube độc hại và nó đi ngược lại cuộc thảo luận công dân." Chaslot cho biết. " Hiện nay việc tạo ra các nội dung cận biên này được khuyến khích vì chúng có rất nhiều tương tác, nhưng không bị cấm".
Những đề xuất độc hại
Về cơ bản, bạn càng làm ra các nội dung kỳ quặc hơn, mọi người càng muốn xem nó nhiều hơn, và nó sẽ tiếp tục được thuật toán đề xuất nhiều hơn - kết quả là mang lại doanh thu lớn hơn cho nhà sáng tạo và cho cả YouTube nữa.
Cấu trúc cơ bản trong thuật toán đề xuất của YouTube trước đây được tinh chỉnh cho các loại nội dung cốt lõi của nó - như video về mèo, trò chơi điện tử và âm nhạc. Nhưng khi YouTube dần trở thành trung tâm cung cấp thông tin và tiêu thị tin tức của người dùng, Chaslot lo ngại rằng các đề xuất sẽ đưa mọi người đến các thông tin cực đoan - cho dù họ muốn hay không - chỉ bởi vì mối quan tâm của YouTube là giữ chân bạn ở lại càng lâu càng tốt.
Khi báo cáo của Mueller được phát hành, mô tả chi tiết về việc liệu có sự thông đồng nào giữa Nga và cuộc bầu cử của tổng thống Donald Trump hay không, Chaslot nhận thấy rằng đề xuất từ hầu hết các kênh là một đoạn video của trang tin RT - một cơ quan truyền thông được nhà nước Nha hậu thuẫn.
Điều trớ trêu là nếu Chaslot đúng, thuật toán của YouTube đang khuếch đại một video của Nga để giải thích cho việc liệu Nga có liên quan đến chiến dịch đó hay không. Thậm chí ngay cả khi các đoạn video liên quan đến Mueller có lượt đề xuất cao hơn, đoạn video của RT vẫn trở nên nổi bật dù có ít view hơn.
Giải pháp cho bạn là gì?
Đối với Chaslot, các đề xuất từ thuật toán YouTube đã bị hỏng. Vì vậy, để mọi người thấy tác động của nó, anh tạo nên công cụ AlgoTransparency sau khi rời Google.
Về cơ bản, công cụ này sẽ tìm ra những video nào đang được hầu hết các kênh chia sẻ để cho bạn một cái nhìn tổng thể mà bạn không thể có khi sử dụng các đề xuất cá nhân. Điều này cũng có nghĩa nó sẽ cho bạn cái nhìn tổng thể hơn về các đề xuất trên YouTube.
Thuật toán của AlgoTransparency.
Google tất nhiên không đồng tình với phương pháp của AlgoTransparency và nói rằng nó không phản ánh đúng cách làm việc của thuật toán đề xuất trên YouTube - vốn dựa vào các khảo sát, lượt like, dislike và share.
Giải pháp của Chaslot không phải cách duy nhất để bạn có cái nhìn rõ ràng về những khác biệt trong thuật toán đề xuất của YouTube.
" Giải pháp tốt nhất trong ngắn hạn chỉ đơn giản là xóa chức năng đề xuất đi. Tôi thực sự không nghĩ nó hữu ích với tất cả người dùng." Chaslot giải thích. " Nếu YouTube muốn duy trì các đề xuất, họ có thể gắn một danh sách rút gọn qua email - nơi mọi người được đảm bảo không có gì điên rồ diễn ra ở đó - hoặc chỉ làm chúng gắn với các kênh mà bạn đã subcribe."
Theo GenK
Facebook sắp cập nhật tính năng mới tương tự Close Friends trên Instagram Facebook hiện đang phát triển một tính năng mới cho ứng dụng Messenger, giúp người dùng có thể chia sẻ nội dung đăng tải với một nhóm bạn bè nhất định, có tên là Favorites (tạm dịch: ưa thích). Được biết, tính năng mới này được phát hiện đầu tiên bởi nhà nghiên cứu ứng dụng nổi tiếng Jane Manchun Wong và sau...