Kết quả đáng sợ thu được khi AI tạo ra những khuôn mặt ảo theo điệu nhạc
Đây chắc chắn không phải là ứng dụng tuyệt vời nhất của các mạng thần kinh, các thuật toán machine learning, và trí tuệ nhân tạo!
Trong số tất cả các nghiên cứu thực tế về mạng thần kinh, machine learning, và trí tuệ nhân tạo đang được tiến hành, có rất nhiều thử nghiệm…xàm xí mà kết quả nằm ở lằn ranh mong manh giữa thú vị và đáng sợ.
Xử lý hình ảnh tự động thời gian qua đã nổi lên như một công cụ tuyệt vời của các mạng thần kinh nhân tạo, một phần nhờ hàng thập kỷ chia sẻ ảnh chụp và ảnh selfie của mọi người lên internet. Kết quả là chúng ta có một kho ảnh chụp khuôn mặt khổng lồ để “thu hoạch” và sử dụng và việc huấn luyện AI làm mọi thứ, từ việc giả lập quá trình lão hóa người dùng trên các ứng dụng di động, đến tạo ra những bộ sưu tập ảnh khuôn mặt siêu thực của những người thậm chí còn chẳng hề tồn tại.
Ngành công nghiệp ảnh stock sẽ không bao giờ như trước nữa, nhưng anh chàng Mario Klingermann tự hỏi điều gì sẽ xảy ra nếu yêu cầu những mạng thần kinh nhân tạo kia tạo ra những ảnh chụp khuôn mặt ảo đồng bộ với điệu nhạc – và như bạn thấy trong video dưới đây, chúng ta có một vài khuôn mặt thực sự ấn tượng khi tiếng nhạc đập bùm bùm!
StyleGAN2 – tạo khuôn mặt đồng bộ theo điệu nhạc
Klingermann đã sử dụng mạng nghịch đảo phát sinh StyleGAN2, vốn được tạo ra bởi Nvidia và sau đó tung ra dưới hình thức mã nguồn mở hơn 1 năm trước. Anh này không hề tự mình thực hiện quá trình huấn luyện hình ảnh tùy biến, mà thay vào đó là tinh chỉnh GAN để nó biến chuyển các kết quả tạo ra dựa trên phổ âm thanh của một tập tin âm thanh đưa vào – trong trường hợp này là bài hát Triggernometry của Kraftamt.
Một vài người theo dõi Twitter của Klingermann đã nói rằng anh nên cho đoạn video do GAN tạo ra chạy chậm lại một chút để thấy được những thứ kinh dị ẩn trong đó. Các bạn có thể xem các hình ảnh bên dưới sẽ thấy sự kinh dị của nó ngay. Chú ý là bạn không nên kéo xuống xem tiếp nếu có tiền sử tim mạch hoặc đang xem bài viết này vào lúc nửa đêm nhé!
* Cảnh báo lần cuối đấy nhé!
Tấn Minh
Chrome sử dụng thuật toán học máy để mô tả hình ảnh cho người khiếm thị
Google vừa ứng dụng học máy (machine learning) tạo công cụ mô tả hình ảnh bằng giọng nói trên Chrome nhằm hỗ trợ người khiếm thị.
TalkBack là trợ năng hữu ích trên Android, giúp người khiếm thị điều hướng trang web trên Chrome bằng cách đọc to thành tiếng tên các mục được chọn và khởi động. Tuy nhiên, tính năng này lại bị bị giới hạn vì không thể mô tả được hình ảnh.
Google đã phát triển một tính năng mới trên Chrome, sử dụng thuật toán học máy để nhận dạng hình ảnh, đoán nội dung và tự động diễn đạt thành văn bản. Sau đó hệ thống sẽ đọc to lên giúp người khiếm thị có thể điều khiển và sử dụng thiết bị dễ dàng hơn. Theo Phone Arena, tính năng này được thử nghiệm khá chính xác. Ví dụ, Chrome mô tả hình dưới đây là một món thức ăn nhanh.
Tuy nhiên, vì được phát triển trên nền tảng trí tuệ nhân tạo nên công cụ này có thể sẽ xảy ra lỗi. Nhà phát triển Dominic Mazzoni của nhóm Chrome Accessibility cho biết họ sẽ luôn bổ sung những cụm từ "dường như" hoặc "có thể" để phục vụ người dùng không quá tin tưởng vào mô tả. Vì tính năng này được phát triển bằng thuật toán học máy nên sẽ có sai sót, cho thông tin không chính xác hoặc không thể diễn đạt được một số ảnh.
Dù vậy công cụ này vẫn cho thấy sự hữu ích với hàng triệu bức ảnh từ các nguồn độc lập, như blog và phương tiện truyền thông xã hội. Thật thú vị khi thấy công nghệ học máy giúp mọi người tiếp cận với Internet dễ dàng hơn.
Theo techsignin
Tại sao AI lại là vũ khí hiệu quả hàng đầu trong cuộc chiến chống COVID-19? Virus Corona chủng mới (COVID-19) là một trong những dịch bệnh có mức độ lây nhiễm cao nhất từng xuất hiện trên hành tinh xanh của chúng ta trong nhiều thập kỷ qua. Chỉ trong hơn 3 tháng kể từ khi được phát hiện ở Trung Quốc, COVID-19 đã lây lan sang hơn 90 quốc gia, làm lây nhiễm hơn 185.000 người, và...