Instagram dùng AI để chọn nội dung đề xuất

Tạ Lê Trúc Quỳnh07:53 29/11/2019

Instagram lần đầu tiết lộ cách họ sử dụng công nghệ AI để chọn những nội dung đề xuất trên tab Khám phá (Explore Tab).

Ivan Mevedev, kỹ thuật viên của Instagram, cho biết nội dung được người dùng tải lên mỗi ngày rất đa dạng, nên việc đề xuất những nội dung thú vị cho người dùng không hề dễ dàng. Do đó, Instagram đã xây dựng hệ thống học máy, tập trung vào những tài khoản có thể khiến người dùng quan tâm.

Nhờ thuật toán học máy, nội dung trên Explore Tab của Instagram trở nên hấp dẫn hơn.

Để xác định tài khoản nào đang thu hút người dùng, đội ngũ kỹ thuật viên đã sử dụng một phương pháp học máy phổ biến là “nhúng từ” (word embedding). Qua đó, hệ thống AI sẽ phân tích tần số xuất hiện và mối quan hệ giữa các từ lặp lại trong bài đăng. Ví dụ, hệ thống sẽ lưu ý từ “lửa” (fire) hay xuất hiện trong cụm “ xe cứu hỏa” (fire-truck) và “chuông báo cháy” (fire-alarm). Instagram cũng ứng dụng quy trình tương tự để xác định mức độ liên quan giữa hai tài khoản với nhau.

Công đoạn tiếp theo là lựa chọn nội dung đề xuất. Hệ thống bắt đầu bằng việc tham khảo “tài khoản hạt giống” – những tài khoản đã được người dùng thích hoặc chia sẻ bài đăng trong quá khứ. Sau đó, AI sẽ chọn ra 500 nội dung ngẫu nhiên của tài khoản tương tự “tài khoản hạt giống”. Các nội dung này được sàng lọc để loại bỏ tin nhắn rác (spam), thông tin sai lệch và vi phạm chính sách. Cuối cùng, 25 bài đăng được hệ thống dự đoán có nhiều khả năng được người dùng tương tác nhất sẽ được cập nhật lên Explore Tab.

Dù không bị chỉ trích nhiều như tính năng gợi ý video của YouTube, hệ thống đề xuất nội dung của Instagram vẫn bị cho là chứa các thông tin mang tính thù ghét và sai lệch. Theo Verge, quy trình trên của Instagram vẫn chưa thực sự minh bạch vì mạng xã hội này không nói rõ các tiêu chuẩn phân loại tin nhắn rác, thông tin sai sự thật, hoặc tần suất sử dụng hệ thống AI…

Theo vnexpress

Chính nhà phát triển thuật toán của YouTube cho rằng các nội dung đề xuất của nền tảng này là độc hại

Để giữ chân bạn càng lâu càng tốt trong YouTube, thuật toán đề xuất của nền tảng này thậm chí còn đưa ra cả các nội dung độc hại.

Video đang HOT

Từ chỗ một trang web để lưu trữ và xem video trực tuyến, YouTube đã trở thành một nền tảng rộng lớn, độc nhất vô nhỉ và gần như không có đối thủ nào có thể so sánh được. Một trong các bí quyết làm nên thành công của họ chính là những thuật toán đề xuất video phù hợp với sở thích người xem.

Tuy nhiên, theo lời của một trong những nhà phát triển làm nên thuật toán này, bản chất của thuật toán này không thực sự tuyệt vời như vậy. Nó đang trở thành nguồn gốc cho một loạt vấn đề về quản lý nội dung trên nền tảng này, đặc biệt khi kéo theo việc ra đời những đoạn video phản cảm hoặc phát tán và lan truyền tin giả.

Các đề xuất của YouTube là sự lãng phí thời gian

Các đề xuất của YouTube hiện ra trong danh sách "Up Next" ở phía bên phải màn hình và chúng sẽ được tự động chơi khi chúng ta bật tính năng xem tự động. Mọi người thường cho rằng các đề xuất này sẽ phù hợp với những gì người dùng muốn để họ có thể xem nhiều hơn và ở lại lâu hơn trên nền tảng này.

Tuy nhiên, theo Guillaume Chaslot, nhà phát triển từng làm việc với Google về thuật toán đề xuất của YouTube, điều này không hoàn toàn đúng như vậy. Anh cho rằng, động lực nằm sâu bên trong thuật toán này không thực sự vì những gì người xem muốn.

" Việc YouTube sử dụng AI để đề xuất video cho bạn không phải điều gì quá kinh khủng, bởi vì nếu AI được tinh chỉnh tốt, nó có thể giúp bạn có được những gì bạn muốn. Điều này sẽ thật tuyệt vời. Nhưng vấn đề là AI không được xây dựng để giúp bạn có được những gì bạn muốn - nó được xây dựng để làm bạn nghiện YouTube. Các đề xuất được thiết kế để lãng phí thời gian của bạn."

Nhà phát triển Guillaume Chaslot.

Theo lời giải thích của Chaslot, thước đo cho sự thành công của thuật toán là thời gian xem. Điều này có thể thật tuyệt diệu cho một công ty đang cố gắng bán quảng cáo, nhưng không thực sự phản ánh điều người dùng cần - và nó đã sinh ra một hiệu ứng phụ.

Trong bài phát biểu của mình tại Hội nghị DisinfoLab Conference vào tháng trước, Chaslot nhấn mạnh rằng, các nội dung gây chia rẽ và nhạy cảm thường được đề xuất rộng rãi - những chủ đề liên quan đến thuyết âm mưu, tin giả, ... vì chúng mang lại nhiều tương tác. Về cơ bản, chúng là các nội dung cận biên, nghĩa là vẫn nằm trong giới hạn cho phép của YouTube, nhưng ranh giới của chúng với các nội dung bị cấm lại rất mong manh.

Cho dù Google không đồng tình với tuyên bố của Chaslot, thì vào năm ngoái, chính Mark Zuckerberg cũng thừa nhận rằng, những loại nội dung cận biên này sẽ có nhiều tương tác hơn. Trong khi đó, đại diện của YouTube cho biết, nghiên cứu của công ty cho thấy, người dùng thực sự tương tác nhiều hơn với các nội dung chất lượng. Tuy nhiên, dựa trên kinh nghiệm của mình, Chaslot tin tưởng hơn vào Zuckerberg trong trường hợp này.

" Chúng tôi nhận ra rằng các đề xuất của YouTube độc hại và nó đi ngược lại cuộc thảo luận công dân." Chaslot cho biết. " Hiện nay việc tạo ra các nội dung cận biên này được khuyến khích vì chúng có rất nhiều tương tác, nhưng không bị cấm".

Những đề xuất độc hại

Về cơ bản, bạn càng làm ra các nội dung kỳ quặc hơn, mọi người càng muốn xem nó nhiều hơn, và nó sẽ tiếp tục được thuật toán đề xuất nhiều hơn - kết quả là mang lại doanh thu lớn hơn cho nhà sáng tạo và cho cả YouTube nữa.

Cấu trúc cơ bản trong thuật toán đề xuất của YouTube trước đây được tinh chỉnh cho các loại nội dung cốt lõi của nó - như video về mèo, trò chơi điện tử và âm nhạc. Nhưng khi YouTube dần trở thành trung tâm cung cấp thông tin và tiêu thị tin tức của người dùng, Chaslot lo ngại rằng các đề xuất sẽ đưa mọi người đến các thông tin cực đoan - cho dù họ muốn hay không - chỉ bởi vì mối quan tâm của YouTube là giữ chân bạn ở lại càng lâu càng tốt.

Khi báo cáo của Mueller được phát hành, mô tả chi tiết về việc liệu có sự thông đồng nào giữa Nga và cuộc bầu cử của tổng thống Donald Trump hay không, Chaslot nhận thấy rằng đề xuất từ hầu hết các kênh là một đoạn video của trang tin RT - một cơ quan truyền thông được nhà nước Nha hậu thuẫn.

Điều trớ trêu là nếu Chaslot đúng, thuật toán của YouTube đang khuếch đại một video của Nga để giải thích cho việc liệu Nga có liên quan đến chiến dịch đó hay không. Thậm chí ngay cả khi các đoạn video liên quan đến Mueller có lượt đề xuất cao hơn, đoạn video của RT vẫn trở nên nổi bật dù có ít view hơn.

Giải pháp cho bạn là gì?

Đối với Chaslot, các đề xuất từ thuật toán YouTube đã bị hỏng. Vì vậy, để mọi người thấy tác động của nó, anh tạo nên công cụ AlgoTransparency sau khi rời Google.

Về cơ bản, công cụ này sẽ tìm ra những video nào đang được hầu hết các kênh chia sẻ để cho bạn một cái nhìn tổng thể mà bạn không thể có khi sử dụng các đề xuất cá nhân. Điều này cũng có nghĩa nó sẽ cho bạn cái nhìn tổng thể hơn về các đề xuất trên YouTube.

Thuật toán của AlgoTransparency.

Google tất nhiên không đồng tình với phương pháp của AlgoTransparency và nói rằng nó không phản ánh đúng cách làm việc của thuật toán đề xuất trên YouTube - vốn dựa vào các khảo sát, lượt like, dislike và share.

Giải pháp của Chaslot không phải cách duy nhất để bạn có cái nhìn rõ ràng về những khác biệt trong thuật toán đề xuất của YouTube.

" Giải pháp tốt nhất trong ngắn hạn chỉ đơn giản là xóa chức năng đề xuất đi. Tôi thực sự không nghĩ nó hữu ích với tất cả người dùng." Chaslot giải thích. " Nếu YouTube muốn duy trì các đề xuất, họ có thể gắn một danh sách rút gọn qua email - nơi mọi người được đảm bảo không có gì điên rồ diễn ra ở đó - hoặc chỉ làm chúng gắn với các kênh mà bạn đã subcribe."

Theo GenK

Facebook sắp cập nhật tính năng mới tương tự Close Friends trên Instagram Facebook hiện đang phát triển một tính năng mới cho ứng dụng Messenger, giúp người dùng có thể chia sẻ nội dung đăng tải với một nhóm bạn bè nhất định, có tên là Favorites (tạm dịch: ưa thích). Được biết, tính năng mới này được phát hiện đầu tiên bởi nhà nghiên cứu ứng dụng nổi tiếng Jane Manchun Wong và sau...

Bạn thấy bài viết này có hữu ích không?

Có;

Không

Tin liên quan

Chủ đề: instagram thuật toán kỹ thuật viên đề xuất nội dung đề xuất explore tab tab khám phá ivan mevedev

Xem thêm Share

Xem nhiều

Hòa Minzy trả lời về con số 8 tỷ đồng làm MV Bắc Bling, cát-xê của Xuân Hinh gây xôn xao04:19

Vụ lộ hình ảnh thi hài nghệ sĩ Quý Bình: Nữ nghệ sĩ Việt lên tiếng xin lỗi01:32

Nghẹn ngào khoảnh khắc mẹ diễn viên Quý Bình bật khóc trong giây phút cuối cùng bên con trai00:30

Đoạn clip của Quý Bình và Vũ Linh gây đau xót nhất lúc này01:32

Trấn Thành rơi vòng vàng và đồng hồ tại Mỹ: "Tôi sợ xanh mặt, cả mớ đó tiền không!"02:09

Cảnh tượng gây bức xúc tại lễ viếng cố nghệ sĩ Quý Bình00:19

Đám tang diễn viên Quý Bình: Ốc Thanh Vân - Thanh Trúc và các nghệ sĩ Việt đau buồn đến viếng00:30

Lễ tang nghệ sĩ Quý Bình: Xót xa cảnh mẹ nam diễn viên buồn bã, cúi chào từng khách đến viếng00:15

Sự cố chấn động điền kinh: VĐV bị đối thủ vụt gậy vào đầu, nghi vỡ hộp sọ02:05

Hãy ngừng so sánh Hoà Minzy và Hoàng Thùy Linh, khi nỗ lực đưa bản sắc dân tộc vào âm nhạc đều đi đúng hướng04:19

Vụ clip người mặc đồ giống "vua cà phê" Đặng Lê Nguyên Vũ đánh nhau: Trung Nguyên lên tiếng00:17

Tin đang nóng

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024

Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022

Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022

Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022

Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022

Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022

Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022

Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022

Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022

Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022

Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn