Thuật toán ‘ma thuật’ của TikTok có thể bị cấm xuất khẩu ngoài Trung Quốc
Bất kỳ công ty nào mua TikTok cũng có thể gặp khó trong việc mô phỏng thuật toán gợi ý của ứng dụng video ngắn này.
ByteDance, công ty mẹ TikTok , đang đàm phán với một số người mua tiềm năng để bán TikTok tại Mỹ sau khi Tổng thống Trump dọa cấm ứng dụng. Thương vụ có thể trị giá 30 tỷ USD với Microsoft. Oracle bày tỏ sự quan tâm. Tuy nhiên, các cuộc thảo luận bị chậm lại do lệnh cấm xuất khẩu mới của Trung Quốc, trong đó có thuật toán. Do đó, rất có thể người mua Mỹ cuối cùng chỉ mua được TikTok mà không có thuật toán gợi ý video, thứ làm nên sự phổ biến cho ứng dụng.
Bondy Valdovinos Kaye, một nhà nghiên cứu tại Đại học công nghệ Queensland, nhận định TikTok không còn là TikTok nếu thiếu thuật toán.
Tại Mỹ, TikTok có khoảng 100 triệu người dùng. Về cơ bản, nó không khác mấy YouTube : mọi người tải video bản thân đang làm mọi thứ, từ tham gia thử thách tới nhảy múa, diễn hài. Thứ khác biệt chính là trang “For You” (Dành cho bạn), hiển thị hàng loạt video gây nghiện. Nhân viên TikTok gọi thuật toán gợi ý video này là “chiếc vương miện” của ByteDance.
Valdovinos Kaye từng ghé thăm văn phòng ByteDance Bắc Kinh năm 2019. Theo chuyên gia, thuật toán được hợp tác phát triển giữa phòng thí nghiệm AI của ByteDance và Đại học Peking. Đó chính là thứ “nước sốt” bí mật kiểm soát mọi phần mềm ByteDance. Ban đầu, nó được phát triển dành cho Toutiao, ứng dụng tổng hợp tin tức của ByteDance nhưng hiện tại, nó có mặt trong mọi ứng dụng của công ty, trong đó có Douyin, phiên bản tiếng Trung của TikTok.
Sabba Keynejad, nhà sáng lập ứng dụng biên tập video Veed, phải thừa nhận chưa chứng kiến một ai đạt trình độ bậc thầy về thuật toán gợi ý như vậy. Chắc chắn, ByteDance đã phải tuyển dụng số lượng lớn kỹ sư để phát triển thuật toán. Valdovinos Kaye kể rằng đã đứng trước một văn phòng đầy ắp lập trình viên khi đến thăm quan ByteDance Bắc Kinh.
Theo Keynejad, thuật toán không phải thứ vận hành mọi thứ nhưng là một “cơn bão hoàn hảo”. Sản phẩm của ByteDance xuất hiện đúng thời điểm, đáp ứng người dùng trẻ tuổi bằng thuật toán gợi ý tuyệt vời. Đây cũng là điều mà Eugene Wei, cựu Giám đốc sản phẩm tại Flipboard, Amazon đồng tình. Trước đó, Wei đã đào sâu vào tính ma thuật của thuật toán TikTok trong một bài blog. Theo ông, TikTok sở hữu các bộ lọc video và công cụ biên tập dễ sử dụng, kết hợp với thuật toán đưa video lên trước mắt mọi người một cách nhanh chóng. Ông cho rằng nhiều người nghĩ thuật toán là một thứ “phép thuật” song những ai từng phát triển công cụ gợi ý bằng máy học (machine learning) sẽ biết các kỹ thuật ByteDance dùng chỉ là loại tiêu chuẩn.
Video đang HOT
Nikita Aggarwal đến từ Viện Internet Oxford nhận xét thuật toán học được nhiều từ lượng dữ liệu khổng lồ mà TikTok thu hút được. Theo bà, TikTok thu thập được nhiều dữ liệu người dùng hơn các ứng dụng khác nên có thể lập hồ sơ người dùng tốt hơn và từ đó gợi ý được video họ có xu hướng thích xem hơn. Bà cũng đồng ý thiết kế của ứng dụng và trải nghiệm xem video toàn màn hình góp phần nâng cao sự phổ biến của TikTok.
“Mỗi cái bấm chuột đều tiết lộ sở thích của người dùng, đến mức độ nào đó sẽ mang đến cho TikTok nhiều thông tin hữu ích hơn về thị hiếu của một người. Hiểu được điều đó sẽ khiến ứng dụng trở nên lớn mạnh hơn”, bà nói.
Bên cạnh đó, ứng dụng cũng đánh giá mối quan tâm của người dùng theo quy mô không thể tưởng tượng nổi so với các nền tảng khác, chẳng hạn YouTube. Định dạng video TikTok – không video nào dài quá 1 phút – đồng nghĩa với việc người dùng sẽ xem qua chúng với tốc độ nhanh hơn nhiều YouTube, nơi video có độ dài trung bình hơn 12 phút.
Theo Eugene Wei, YouTube khó làm như vậy vì về cơ bản họ không có ứng dụng bày nhiều video ngẫu nhiên ra trước mắt người dùng. Thông thường, mọi người tự lựa chọn thứ họ xem trên YouTube. Ngược lại, trang For You trên TikTok phục vụ người dùng hàng trăm video mỗi giờ, tức là ứng dụng đôi khi sẽ đưa ra một video mà người dùng không thích xem mà không ảnh hưởng quá lớn. Dữ liệu thực tế ấy được dùng để “nuôi” thuật toán máy học của TikTok, biến nó trở nên quyền lực hơn do với bộ dữ liệu đào tạo có sẵn mà các dịch vụ khác đang dùng.
Ngay cả khi chỉ là thuật toán tương đối thông thường, TikTok lại được bồi dưỡng từ gần 600 triệu người dùng hàng tháng trên toàn cầu, đặt ra câu hỏi hóc búa nếu thuật toán không được chuyển nhượng trong vụ mua bán. Wei nhận định người mua vẫn có thể mô phỏng phần lớn ma thuật của thuật toán nếu TikTok cung cấp cho họ tất cả dữ liệu người dùng, dữ liệu video song họ phải sẵn sàng hỗ trợ toàn bộ quá trình. Một thách thức cho họ là làm thế nào để kết nối giá trị của hệ thống thuật toán hay thuật toán với dữ liệu mà nó được đào tạo. Nếu TikTok bán cho Microsoft , Microsoft giả định sẽ được hưởng lợi từ dữ liệu này. Song, vẫn có những hiểu biết ẩn sâu (insight) mà ByteDance thu được từ người dùng, đây chính là thứ di sản đáng giá mà Trung Quốc rõ ràng đã nhận ra khi áp đặt hạn chế xuất khẩu.
Công thức bí mật của TikTok
Trí tuệ nhân tạo và kho dữ liệu khổng lồ giúp thuật toán TikTok gợi ý nội dung hiệu quả, từ đó giữ người dùng ở lại lâu hơn trên nền tảng.
Khi ByteDance mua lại Musical.ly và sáp nhập chương trình hát karaoke này vào TikTok năm 2018, nó đơn giản chỉ là một ứng dụng video ngắn giữa hàng nghìn ứng dụng dành cho giới trẻ.
Tuy nhiên, sau hai năm, TikTok nằm trong số những ứng dụng được tải về nhiều nhất thế giới. Nó phổ biến đến mức trở thành đích ngắm mới trong cuộc chiến công nghệ giữa Mỹ và Trung Quốc - vốn trước đó chỉ tập trung vào chip và 5G.
TikTok đang trong quá trình đàm phán với các công ty Mỹ. Ảnh: Reuters.
Theo SCMP, việc thâu tóm Musical.ly đưa ByteDace đặt chân tới thị trường Mỹ. Còn nguyên nhân đầu tiên thúc đẩy sự bùng nổ của TikTok nằm ở thuật toán For You với khả năng hiển thị nội dung cá nhân hóa thông minh dựa trên AI.
Thuật toán TikTok hoạt động cụ thể thế nào vẫn còn là điều bí ẩn. Tuy nhiên, hồi tháng 6, TikTok tiết lộ công cụ gợi ý nội dung của họ được phát triển dựa trên ba yếu tố: sự tương tác của người dùng trên ứng dụng (như họ like một đoạn phim hay theo dõi một tài khoản nào đó), các yếu tố trong video mà người dùng xem (như âm thanh, hashtag) và bối cảnh liên quan tới người dùng (như họ có xu hướng chọn ngôn ngữ gì, ở nước nào, loại thiết bị đang sử dụng).
"Trên những ứng dụng khác, nhiều người có thể xem một số video nổi bật giống nhau, nhưng dữ liệu do For You đề xuất với mỗi người là duy nhất và phù hợp với riêng cá nhân đó", TikTok giải thích trên blog.
Nhờ cơ chế hiển thị video cá nhân hóa, người dùng TikTok trên thiết bị Android dành tới hơn 68 tỷ giờ cho nền tảng này năm 2019, gấp ba lần so với một năm trước đó, theo thống kê của hãng nghiên cứu thị trường App Annie. Nó cũng thu hút gần 90 triệu người dùng hàng tháng tại Mỹ tính đến tháng 6, tăng gần tám lần so với tháng 1/2018, theo số liệu nêu trong đơn kiện chính phủ Mỹ của TikTok.
Giới phân tích nhận định, thuật toán của TikTok về cơ bản cũng tương tự thuật toán được tìm thấy trên các ứng dụng của nhiều công ty công nghệ khác. Giáo sư Wong Kam-fai, chuyên gia tại Hiệp hội AI Trung Quốc, cho hay sự khác biệt trong giải pháp của mỗi công ty nằm ở engine trí tuệ nhân tạo. Tuy nhiên, AI của TikTok có thể ưu việt, nhưng không thực sự "độc nhất vô nhị".
Phó giáo sư Julian McAuley tại Đại học San Diego, cũng cho biết, hệ thống đề xuất nội dung đã xuất hiện từ gần hai thập kỷ qua trên các trang thương mại điện tử như Amazon, hay công nghệ gợi ý phim tiếp theo có mặt trên Netflix từ cách đây cả chục năm.
Do đó, bí kíp thứ hai làm nên thành công của TikTok chính là thông tin cá nhân về người dùng.
"Thuật toán sẽ chẳng là gì nếu không có dữ liệu", Jim DuBois, cựu Giám đốc thông tin của Microsoft, nhận định.
"Công nghệ vận hành hiệu quả khi thuật toán và dữ liệu người dùng đều ổn. Một phần lý do các ứng dụng của ByteDance có lợi thế cạnh tranh so với đối thủ nằm ở dữ liệu người dùng của họ", Hao Peiqiang, blogger về phần mềm, chia sẻ quan điểm.
"Các quy định về quyền riêng tư ở Trung Quốc quá lỏng lẻo và nhận thức về bảo vệ sự riêng tư cũng tương đối thấp", Hao nói, ngầm nhắc tới "mỏ vàng" về dữ liệu cá nhân mà ByteDance đã thu thập thông qua ứng dụng. TikTok nhiều lần khẳng định họ lưu trữ dữ liệu về người dùng Mỹ trên các máy chủ đặt bên ngoài Trung Quốc và không cung cấp cho chính quyền Bắc Kinh.
Với lý do lo ngại về dữ liệu cá nhân và an ninh quốc gia, Mỹ ra lệnh cấm TikTok hoạt động tại nước này, trừ khi được một công ty Mỹ mua lại. Hàng loạt tên tuổi lớn đã bày tỏ mối quan tâm tới thương vụ như Microsoft, Twitter, Walmart...
Tuy nhiên, theo chính sách kiểm soát xuất khẩu mới của Trung Quốc, các công nghệ liên quan đến "đề xuất nội dung cá nhân hóa dựa trên phân tích dữ liệu" và "giao diện tương tác trí tuệ nhân tạo" phải được chính phủ Trung Quốc thông qua trước khi thực hiện giao dịch trao đổi, mua bán. Do đó, ByteDance có thể phải bán TikTok mà không kèm thuật toán cho Mỹ.
Giới chuyên gia nhận định, thuật toán đề xuất nội dung và AI engine là thứ giúp TikTok giữ chân người dùng, tạo nên sự tăng trưởng đột phá. Nếu TikTok được bán mà không kèm thuật toán, nó có thể không còn hấp dẫn nữa và các công ty Mỹ sẽ không dám mạo hiểm mua lại.
Bên cạnh đó, trong kỷ nguyên smartphone, công nghệ gợi ý nội dung cũng bị chỉ trích vì tạo ra "bong bóng lọc thông tin", tức người dùng gần như chỉ tiếp cận các nội dung dựa trên thói quen cũ, khiến góc nhìn về thế giới của họ có thể bị ảnh hưởng.
TikTok tuân thủ quy định xuất khẩu mới của Trung Quốc ByteDance, công ty mẹ của TikTok, cho biết sẽ tuân thủ quy định hạn chế xuất khẩu mới của Trung Quốc. Ngày 28/8, Trung Quốc cập nhật danh sách công nghệ bị hạn chế xuất khẩu, bao gồm một số lĩnh vực từ nhận diện giọng nói đến thiết kế chip. Danh sách chưa được cập nhật từ năm 2008. Những công ty...