AI nghe giọng nói đoán đúng khuôn mặt người
Một trí tuệ nhân tạo mới được phát triển bởi các nhà nghiên cứu tại MIT đã đạt được một thành quả đáng nể: bằng cách phân tích chỉ một đoạn âm thanh ngắn của giọng nói con người, nó có thể tái tạo lại hình dạng khuôn mặt của họ trong đời thực.
Kết quả của AI này vẫn chưa hoàn hảo, nhưng cũng khá tốt – một ví dụ đáng chú ý và có phần… rùng rợn cho thấy một con AI tinh vi có thể thực hiện những suy luận đáng kinh ngạc như thế nào chỉ từ những mẩu nhỏ dữ liệu.
Trong một bài viết được công bố tuần trước, nhóm nghiên cứu đã miêu tả cách thức họ sử dụng để huấn luyện một mạng lưới nghịch cảnh (GAN) phân tích các đoạn ghi âm ngắn và ghép chúng với các đặc tính sinh trắc học tương ứng của người nói. Kết quả họ thu được có độ chính xác khá cao.
Đó là nói theo ngôn ngữ của các nhà nghiên cứu. Trên thực tế, thuật toán Speech2Face dường như có một sở thích kỳ quặc: nó “vẽ” ra những bức chân dung thô của con người mà chỉ cần dựa vào một loại dữ liệu duy nhất là giọng nói của họ.
Video đang HOT
Các nhà nghiên cứu MIT bày tỏ sự thận trọng trên trang GitHub của dự án. Theo họ, công nghệ này có thể gây ra những quan ngại xoay quanh vấn đề quyền riêng tư và phân biệt đối xử.
“ Dù đây là một cuộc điều tra học thuật thuần túy, chúng tôi cảm thấy phải thảo luận rõ ràng liên quan những cân nhắc về đạo đức, bởi tính nhạy cảm tiềm tàng của thông tin khuôn mặt” – họ viết, nói thêm rằng “ bất kỳ cuộc điều tra nào sau này, hoặc hoạt động sử dụng công nghệ này, sẽ phải được kiểm tra cẩn thận để đảm bảo dữ liệu huấn luyện đại diện chính xác cho những nhóm người mà nó được sử dụng“.
Theo VN Review
Microsoft tạo AI có giọng nói giống người đến 99,84%
Sử dụng một phần nguyên lý hoạt động của não người, Microsoft đã tạo ra trí thông minh nhân tạo AI có thể nói ngôn ngữ nhanh và chính xác hơn.
Microsoft đã tạo ra trí thông minh nhân tạo AI có thể nói ngôn ngữ nhanh và chính xác hơn
Các AI Text-to-speech đang ngày càng thông minh hơn, có khả năng nói tiếng người giống hơn từ một văn bản có sẵn. Tuy nhiên có một vấn đề là các AI này cần rất nhiều thời gian đào tạo, data dữ liệu lớn để có thể tạo ra một giọng nói dễ nghe.
Chính vì thế các nhà khoa học của Microsoft và Trung Quốc đã đưa ra một thuật toán mới, nhằm giúp xây dựng các AI nói trong tương lai hiệu quả hơn.
Nhóm nghiên cứu đã tạo ra một text-to-speech AI có thể nói mà chỉ cần 200 mẫu giọng nói (khoảng 20 phút thu âm) và phiên âm phù hợp.
AI mới này dựa một phần vào nguyên lý hoạt động gọi là Transformers, hay mạng lưới thần kinh sâu mô phỏng các tế bào thần kinh trong não người. Transformers "nặng" các thông tin đầu vào và đầu ra một cách nhanh chóng như liên kết khớp thần kinh, giúp họ xử lý chuỗi thậm chí kéo dài rất hiệu quả - nói, một câu phức tạp. Kết hợp Transformers với một thành phần mã hóa loại bỏ nhiễu và AI có thể làm được rất nhiều với tương đối ít data lưu trữ.
AI được hình thành có giọng nói không phải hoàn hảo lắm, với một âm thanh "hơi" robot, nhưng độ chính xác và dễ hiểu của chúng rất cao tới 99,84%.
Quan trọng là hệ thống này giúp chuyển văn bản thành giọng nói một cách nhanh chóng và đơn giản hơn. Các nhà lập trình không phải bỏ nhiều công sức để tạo ra tiếng nói ảo, giúp các công ty nhỏ, thậm chí là người nghiệp dư có thể tạo ra hệ thống giọng nói riêng.
Theo Một Thế Giới
Cisco cung cấp mã nguồn mở nền tảng trí tuệ nhân tạo MindMeld Cisco đã quyết định cung cấp nguồn mở cho các nhà phát triển để họ có thể tự do tùy biến nền tảng trí tuệ nhân tạo (AI) về hội thoại MindMeld theo giấy phép Apache 2.0. Cisco hy vọng phát triển cộng đồng các nhà phát triển về công nghệ hội thoại trên nền tảng của hãng Theo TechCrunch, MindMeld là công...











Tin đang nóng
Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

Thêm nhiều bang của Mỹ cấm TikTok

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

Xiaomi sa thải hàng nghìn nhân sự

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023
Có thể bạn quan tâm

Xét xử lưu động vụ 'thổi' đất đấu giá 30 tỷ đồng/m2 ở Hà Nội
Pháp luật
00:32:07 22/02/2025
Tai nạn hy hữu, người đàn ông tử vong do lốp ô tô văng trúng
Tin nổi bật
00:25:59 22/02/2025
Georgia từng được đề nghị trở thành "mặt trận thứ 2" chống Nga
Thế giới
00:19:40 22/02/2025
Sáp thơm gây ô nhiễm không khí ngang với động cơ ô tô
Lạ vui
00:13:14 22/02/2025
Hơn 20 năm qua, vợ biết tôi không yêu nhưng vẫn không chấp nhận ly hôn
Góc tâm tình
00:10:12 22/02/2025
HLV Mai Đức Chung trở lại ĐT nữ Việt Nam ở tuổi 75, đứng số 1 thế giới
Sao thể thao
23:58:31 21/02/2025
Với 10 năm nội trợ, xin khẳng định: 5 mẹo này sẽ giúp bạn tiết kiệm cả sức lẫn tiền
Netizen
23:57:01 21/02/2025
6 thói xấu khiến ngôi nhà giống "bãi rác", giàu đến mấy cũng vẫn có cảm giác "rẻ tiền"
Sáng tạo
23:54:57 21/02/2025
Phim của Song Hye Kyo bùng nổ MXH Việt, gây tranh cãi gay gắt vẫn càn quét phòng vé
Hậu trường phim
23:38:49 21/02/2025
Phim Trung Quốc nhồi nhét cảnh quấy rối phụ nữ, bị chỉ trích khắp MXH: Nữ chính 6 lần gặp biến thái gây phẫn nộ
Phim châu á
23:34:06 21/02/2025