Lý do cho thuật toán gây nghiện của TikTok
Các thuật toán nhóm người dùng và nhóm video trong TikTok đã giúp họ lôi cuốn hàng trăm triệu người dùng trên toàn cầu.
Ứng dụng TikTok đang chịu sức ép ngày càng lớn khi thời hạn cuối cùng cho việc bán mình tại Mỹ đang ngày càng đến gần. Trong khi đó, họ cũng chịu sức ép từ phía Trung Quốc khi nước này thông qua sắc lệnh hạn chế xuất khẩu các sản phẩm trí tuệ nhân tạo, một lĩnh vực có liên quan đến các thuật toán bên trong ứng dụng này.
Trong khi đang tìm cách đàm phán với chính phủ Mỹ để tìm ra một giải pháp khả dĩ hơn, các giám đốc TikTok đã thực hiện một bước đi táo bạo nhằm loại bỏ những lo ngại về mối liên hệ giữa công ty họ và chính phủ Trung Quốc: tiết lộ về thuật toán “ma thuật” của mình – thứ lôi cuốn hàng trăm triệu người dùng trên thế giới tập trung vào ứng dụng video đình đám của mình.
Ban lãnh đạo TikTok cho biết, việc tiết lộ chi tiết về thuật toán và cách xử lý dữ liệu của họ nhằm đập tan các tin đồn cũng như câu chuyện hoang đường về công ty của mình:
“ Chúng tôi là công ty mới 2 năm tuổi đang hoạt động với kỳ vọng của một công ty 10 năm tuổi.” Michael Beckerman, phó chủ tịch TikTok về quan hệ công chúng tại Mỹ cho biết. “ Chúng tôi không có cơ hội lớn lên trong thời đại hoàng kim của internet, khi các công ty công nghệ không thể làm gì sai. Chúng tôi lớn lên trong thời đại đụng độ về công nghệ, khi luôn có nhiều hoài nghi về các nền tảng, cách họ kiểm duyệt nội dung và cách thuật toán của họ hoạt động.”
Ban lãnh đạo TikTok còn cho phép các phóng viên tham gia một chuyến tham quan ảo vào “Trung tâm Minh bạch” tại Los Angeles. Trung tâm này có những khu vực để trình diễn demo cách thuật toán của TikTok và cách công ty xử lý dữ liệu như thế nào.
Thuật toán của TikTok hoạt động như thế nào?
Video đang HOT
Theo công ty, thuật toán của TikTok sử dụng máy học để xác định xem nội dung nào sẽ có nhiều khả năng tương tác được với một người dùng nào đó và hiển thị nhiều hơn loại nội dung đó cho họ, bằng cách tìm kiếm thêm các đoạn video tương tự như vậy cũng như những người dùng với sở thích tương tự nhau.
Khi người dùng mở TikTok lần đầu tiên, họ sẽ được hiển thị 8 video phổ biến, đặc trưng cho các xu hướng âm nhạc, chủ đề khác nhau. Sau đó, thuật toán này sẽ tiếp tục hiển thị cho người dùng mới 8 video khác dựa trên những video người dùng đã tương tác và những gì người dùng đã làm.
Thuật toán này xác định các video tương tự như vậy dựa trên thông tin của nó, bao gồm các chi tiết như caption, các hashtag hay âm thanh của nó. Các khuyến nghị video cũng dựa trên thiết bị liên quan đến tài khoản người dùng và thiết lập của tài khoản, bao gồm các dữ liệu như tùy chọn ngôn ngữ, thiết lập quốc gia và loại thiết bị.
Khi TikTok thu thập đủ dữ liệu về người dùng, ứng dụng sẽ lập bản đồ các sở thích của người dùng trong mối liên quan đến những người dùng tương tự và nhóm họ thành các “cụm”. Đồng thời, ứng dụng cũng nhóm các video thành các cụm dựa trên các chủ đề tương tự, như “bóng rổ” hay “thỏ”.
Sử dụng máy học, thuật toán sẽ hiển thị các video tới cho người dùng dựa trên mức độ gần gũi của họ so với các nhóm người dùng khác và nội dung mà họ thích.
TikTok làm vậy để tránh người dùng trở nên chán chường vì phải xem liên tục nhiều video với cùng một bản nhạc hoặc từ cùng một nhà sáng tạo.
TikTok thừa nhận rằng, thuật toán của họ cuốn hút sở thích của người dùng đến mức nó có thể tạo ra “bong bóng lọc”, củng cố sở thích hiện có của người dùng hơn là cho họ thấy các nội dung đa dạng hơn, mở rộng tầm nhìn hoặc cung cấp cho họ quan điểm đối lập – điều này có thể củng cố các thuyết âm mưu hay thông tin giả. Vì vậy, công ty cho biết, họ đang nghiên cứu để tìm cách phá vớ chúng khi cần thiết.
Đối với dữ liệu người dùng
Công ty cho biết, họ đang cố gắng phân loại và ngăn chặn các sự cố trên nền tảng của mình trước khi chúng xảy ra. Để làm được điều đó, họ nghiên cứu và phát hiện các mô hình vấn đề trước khi chúng lan rộng.
Giám đốc bảo mật của TikTok, Roland Cloutier cho biết, họ đang có kế hoạch thuê khoảng hơn 100 chuyên gia về dữ liệu, bảo mật và quyền riêng tư vào cuối năm nay tại Mỹ.
Ông cũng cho biết, công ty sẽ xây dựng một trung tâm giám sát, ứng phó và điều tra tại Washington để chủ động phát hiện và ứng phó với các sự cố nghiêm trọng theo thời gian thực.
Thuật toán 'ma thuật' của TikTok có thể bị cấm xuất khẩu ngoài Trung Quốc
Bất kỳ công ty nào mua TikTok cũng có thể gặp khó trong việc mô phỏng thuật toán gợi ý của ứng dụng video ngắn này.
ByteDance, công ty mẹ TikTok , đang đàm phán với một số người mua tiềm năng để bán TikTok tại Mỹ sau khi Tổng thống Trump dọa cấm ứng dụng. Thương vụ có thể trị giá 30 tỷ USD với Microsoft. Oracle bày tỏ sự quan tâm. Tuy nhiên, các cuộc thảo luận bị chậm lại do lệnh cấm xuất khẩu mới của Trung Quốc, trong đó có thuật toán. Do đó, rất có thể người mua Mỹ cuối cùng chỉ mua được TikTok mà không có thuật toán gợi ý video, thứ làm nên sự phổ biến cho ứng dụng.
Bondy Valdovinos Kaye, một nhà nghiên cứu tại Đại học công nghệ Queensland, nhận định TikTok không còn là TikTok nếu thiếu thuật toán.
Tại Mỹ, TikTok có khoảng 100 triệu người dùng. Về cơ bản, nó không khác mấy YouTube : mọi người tải video bản thân đang làm mọi thứ, từ tham gia thử thách tới nhảy múa, diễn hài. Thứ khác biệt chính là trang "For You" (Dành cho bạn), hiển thị hàng loạt video gây nghiện. Nhân viên TikTok gọi thuật toán gợi ý video này là "chiếc vương miện" của ByteDance.
Valdovinos Kaye từng ghé thăm văn phòng ByteDance Bắc Kinh năm 2019. Theo chuyên gia, thuật toán được hợp tác phát triển giữa phòng thí nghiệm AI của ByteDance và Đại học Peking. Đó chính là thứ "nước sốt" bí mật kiểm soát mọi phần mềm ByteDance. Ban đầu, nó được phát triển dành cho Toutiao, ứng dụng tổng hợp tin tức của ByteDance nhưng hiện tại, nó có mặt trong mọi ứng dụng của công ty, trong đó có Douyin, phiên bản tiếng Trung của TikTok.
Sabba Keynejad, nhà sáng lập ứng dụng biên tập video Veed, phải thừa nhận chưa chứng kiến một ai đạt trình độ bậc thầy về thuật toán gợi ý như vậy. Chắc chắn, ByteDance đã phải tuyển dụng số lượng lớn kỹ sư để phát triển thuật toán. Valdovinos Kaye kể rằng đã đứng trước một văn phòng đầy ắp lập trình viên khi đến thăm quan ByteDance Bắc Kinh.
Theo Keynejad, thuật toán không phải thứ vận hành mọi thứ nhưng là một "cơn bão hoàn hảo". Sản phẩm của ByteDance xuất hiện đúng thời điểm, đáp ứng người dùng trẻ tuổi bằng thuật toán gợi ý tuyệt vời. Đây cũng là điều mà Eugene Wei, cựu Giám đốc sản phẩm tại Flipboard, Amazon đồng tình. Trước đó, Wei đã đào sâu vào tính ma thuật của thuật toán TikTok trong một bài blog. Theo ông, TikTok sở hữu các bộ lọc video và công cụ biên tập dễ sử dụng, kết hợp với thuật toán đưa video lên trước mắt mọi người một cách nhanh chóng. Ông cho rằng nhiều người nghĩ thuật toán là một thứ "phép thuật" song những ai từng phát triển công cụ gợi ý bằng máy học (machine learning) sẽ biết các kỹ thuật ByteDance dùng chỉ là loại tiêu chuẩn.
Nikita Aggarwal đến từ Viện Internet Oxford nhận xét thuật toán học được nhiều từ lượng dữ liệu khổng lồ mà TikTok thu hút được. Theo bà, TikTok thu thập được nhiều dữ liệu người dùng hơn các ứng dụng khác nên có thể lập hồ sơ người dùng tốt hơn và từ đó gợi ý được video họ có xu hướng thích xem hơn. Bà cũng đồng ý thiết kế của ứng dụng và trải nghiệm xem video toàn màn hình góp phần nâng cao sự phổ biến của TikTok.
"Mỗi cái bấm chuột đều tiết lộ sở thích của người dùng, đến mức độ nào đó sẽ mang đến cho TikTok nhiều thông tin hữu ích hơn về thị hiếu của một người. Hiểu được điều đó sẽ khiến ứng dụng trở nên lớn mạnh hơn", bà nói.
Bên cạnh đó, ứng dụng cũng đánh giá mối quan tâm của người dùng theo quy mô không thể tưởng tượng nổi so với các nền tảng khác, chẳng hạn YouTube. Định dạng video TikTok - không video nào dài quá 1 phút - đồng nghĩa với việc người dùng sẽ xem qua chúng với tốc độ nhanh hơn nhiều YouTube, nơi video có độ dài trung bình hơn 12 phút.
Theo Eugene Wei, YouTube khó làm như vậy vì về cơ bản họ không có ứng dụng bày nhiều video ngẫu nhiên ra trước mắt người dùng. Thông thường, mọi người tự lựa chọn thứ họ xem trên YouTube. Ngược lại, trang For You trên TikTok phục vụ người dùng hàng trăm video mỗi giờ, tức là ứng dụng đôi khi sẽ đưa ra một video mà người dùng không thích xem mà không ảnh hưởng quá lớn. Dữ liệu thực tế ấy được dùng để "nuôi" thuật toán máy học của TikTok, biến nó trở nên quyền lực hơn do với bộ dữ liệu đào tạo có sẵn mà các dịch vụ khác đang dùng.
Ngay cả khi chỉ là thuật toán tương đối thông thường, TikTok lại được bồi dưỡng từ gần 600 triệu người dùng hàng tháng trên toàn cầu, đặt ra câu hỏi hóc búa nếu thuật toán không được chuyển nhượng trong vụ mua bán. Wei nhận định người mua vẫn có thể mô phỏng phần lớn ma thuật của thuật toán nếu TikTok cung cấp cho họ tất cả dữ liệu người dùng, dữ liệu video song họ phải sẵn sàng hỗ trợ toàn bộ quá trình. Một thách thức cho họ là làm thế nào để kết nối giá trị của hệ thống thuật toán hay thuật toán với dữ liệu mà nó được đào tạo. Nếu TikTok bán cho Microsoft , Microsoft giả định sẽ được hưởng lợi từ dữ liệu này. Song, vẫn có những hiểu biết ẩn sâu (insight) mà ByteDance thu được từ người dùng, đây chính là thứ di sản đáng giá mà Trung Quốc rõ ràng đã nhận ra khi áp đặt hạn chế xuất khẩu.
Công thức bí mật của TikTok Trí tuệ nhân tạo và kho dữ liệu khổng lồ giúp thuật toán TikTok gợi ý nội dung hiệu quả, từ đó giữ người dùng ở lại lâu hơn trên nền tảng. Khi ByteDance mua lại Musical.ly và sáp nhập chương trình hát karaoke này vào TikTok năm 2018, nó đơn giản chỉ là một ứng dụng video ngắn giữa hàng nghìn ứng...