Bàn phím Google Keyboard hiểu giọng nói của bạn tốt hơn nhờ trí tuệ nhân tạo
Theo Android Authority, nhờ ứng dụng AI ( trí tuệ nhân tạo), Google đã cải tiến mạnh mẽ tính năng nhận dạng giọng nói và trích xuất ra văn bản cho bàn phím Gboard, qua đó mang lại trải nghiệm tốt hơn cho người dùng.
Như Google đề cập trong bài đăng trên blog, họ cải thiện bàn phím thông qua quá trình học sâu, giúp giảm bớt thời gian chuyển giọng nói thành văn bản. Kết quả họ đạt được là một bộ nhận dạng giọng nói không cần kết nối internet để hoạt động mà tích hợp thẳng vào Gboard trên thiết bị và có dung lượng khá nhẹ (80 MB).
Thậm chí, trình nhận dạng giọng nói mới xuất ra từng ký tự thay vì từng chữ khi bạn nói thông qua vòng lặp dự đoán ký tự. Như vậy, tính năng chuyển giọng nói thành văn bản của Gboard sẽ hoạt động đáng tin cậy hơn, nhanh hơn và chính xác hơn trước kia.
Hiện nay, công cụ nhận dạng giọng nói nâng cao của Gboard sắp được phát hành cho điện thoại Pixel và bị giới hạn ở ngôn ngữ Tiếng Anh – Mỹ. Hi vọng rằng chúng ta sẽ thấy phiên bản nâng cấp của Gboard được bổ sung nhiều hơn các ngôn ngữ và thiết bị trong tương lai gần.
Biên tập bởi Trấn Minh
Trí tuệ nhân tạo có thể biến tín hiệu trong não thành giọng nói?
Đối với những người không thể nói, tín hiệu thể hiện lời nói của họ ẩn trong bộ não. Tất nhiên, chúng ta không có siêu năng lực để giải mã chúng. Nhưng mới đây, các nhà nghiên cứu đã tiến thêm một bước trong việc biến dữ liệu trong não thành lời nói bằng trí tuệ nhân tạo.
Thử thách khó khăn dành cho các nhà khoa học
Bằng cách phẫu thuật đặt điện cực lên vỏ não người bệnh, kết hợp cùng hệ thống máy tính tích hợp mạng thần kinh (một dạng của trí tuệ nhân tạo), các nhà khoa học có thể tái tạo câu từ để người bình thường có thể nghe được.
Với những người mất khả năng nói, họ thường sử dụng mắt hoặc ngón tay để điều khiển một hệ thống chọn chữ cái nhằm tạo thành câu hoàn chỉnh. Sử dụng não bộ máy tính để tạo ra giọng nói trực tiếp, việc giao tiếp của những người không may mắn sẽ trở nên dễ dàng hơn nhiều. Thậm chí, họ có thể điều chỉnh tốc độ, cao độ giọng nói và thảo luận nhanh.
Có không ít khó khăn cho đội ngũ nghiên cứu trong quá trình làm việc. Nima Mesgarani, nhà khoa học máy tính tại Đại học Columbia cho biết:
"Chúng tôi đang cố gắng tìm ra mô hình của các nơ-ron thần kinh khi chúng bật và tắt ở các thời điểm khác nhau để tạo thành âm thanh.
Việc chuyển đổi tín hiệu không hề dễ dàng. Tín hiệu của mỗi người hoàn toàn khác nhau, do đó các mô hình máy tính phải được 'đào tạo' theo từng cá nhân. Để có mô hình tốt thì dữ liệu phải cực kỳ chính xác, mà việc này đòi hỏi thao tác mở hộp sọ".
Những kiểm nghiệm thực tế ban đầu đầy khả quan
Nhóm nghiên cứu do Mesgarani đứng đầu dựa vào dữ liệu từ 5 người bị động kinh. Mạng thần kinh của họ đã phân tích các bản ghi âm từ vỏ não khi người bệnh nghe mọi người đếm số từ 0 đến 9. Khá bất ngờ, máy tính "nói ra" các con số với độ chính xác đạt được là 75% (bạn có thể nghe thử ngay dưới đây).
Một nhóm khác, dẫn đầu bởi nhà khoa học máy tính Tanja Schultz tại Đại học Bremen ở Đức đã dựa vào dữ liệu từ 6 người đang phẫu thuật khối u não. Họ sử dụng một micro để thu giọng nói của chính mình, trong khi điện cực gắn lên vùng não của bệnh nhân sẽ thu lại những tín hiệu điện xuất hiện.
Trong trường hợp này, mạng lưới thần kinh đào tạo bởi 2 nhà khoa học máy tính Miguel Angrick và Christian Herff thuộc Đại học Maastricht đã ánh xạ các chỉ số điện cực dựa vào bản ghi âm rồi tái tạo lại các từ từ dữ liệu não. Kết quả: Khoảng 40% các từ do máy tính tạo ra có thể hiểu được.
Bạn có thể nhận biết đâu là giọng nói của người và đâu là giọng nói của máy tính?
Cuối cùng, bác sĩ phẫu thuật thần kinh Edward Chang và nhóm nghiên cứu tại Đại học California, San Francisco đã tái cấu trúc toàn bộ câu từ mà hoạt động não thu được trong khi 3 bệnh nhân động kinh đọc lớn những từ được yêu cầu.
Sau đó, 166 người tham gia khảo sát được nghe câu nói do máy tính tạo thành và phải chọn ra nó trong số 10 lựa chọn bằng văn bản. Một số câu ghi nhận tỷ lệ chính xác lên đến hơn 80%.
Tuy nhiên, những phương pháp kể trên sẽ hoạt động như thế nào khi bệnh nhân không thể nói vẫn còn là một dấu hỏi. Tín hiệu não khi một người âm thầm "nói" hoặc "nghe" giọng nói của họ trong đầu không giống với tín hiệu khi họ nghe, nói thông thường. Nếu không có âm thanh bên ngoài phù hợp với hoạt động của não, máy tính thậm chí khó có thể xác định vị trí lời nói bắt đầu và kết thúc.
Nhà khoa học Herff đưa ra một giải pháp là dựa vào phản hồi của những người đã từng trải nghiệm qua hệ thống "não máy tính" để đưa ra tùy chỉnh. Bởi vì trí tuệ nhân tạo càng thông minh khi có dữ liệu chính xác, nếu cả con người và mạng lưới thần kinh đều được cung cấp nhiều dữ liệu, khoảng cách giữa não và máy tính có thể sẽ dần được thu hẹp.
Bạn cảm thấy thế nào về nghiên cứu "Biến tín hiệu não thành giọng nói bằng trí tuệ nhân tạo? Cùng chia sẻ suy nghĩ thông qua phần bình luận phía dưới nhé.
Nguồn: Science Mag
Việt Nam đã có Kaggle đầu tiên trong lĩnh vực trí tuệ nhân tạo Khởi động từ ngày 08/08/2018, Zalo AI Challenge là một sân chơi thực thụ cho cộng đồng AI Việt. Với nền tảng Data (Dữ liệu) chất lượng, những tài năng AI trẻ sẽ được thỏa chí thi thố, thậm chí hiện thực thóa giấc mơ tạo nên một sản phẩm AI cho người Việt. "Là một Master Kaggle (một nền tảng để các...











Tin đang nóng
Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

Thêm nhiều bang của Mỹ cấm TikTok

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

Xiaomi sa thải hàng nghìn nhân sự

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023
Có thể bạn quan tâm

Zoom cận nhan sắc xinh đẹp của Jisoo khi gặp fan Việt, khí chất sáng ngời chuẩn "hoa hậu Kpop"
Nhạc quốc tế
23:36:02 30/03/2025
Âm Dương Lộ: Xem drama xe cứu thương chở diễn viên còn cuốn hơn bộ phim này!
Phim việt
23:30:33 30/03/2025
Khi Cuộc Đời Cho Bạn Quả Quýt làm được điều chưa từng có trong lịch sử, đỉnh cỡ này thì Daesang trong tầm tay!
Hậu trường phim
23:27:53 30/03/2025
Phim thất bại ê chề vì chỉ bán được 1 vé, netizen mỉa mai "diễn tốt nhất là con ngựa"
Phim châu á
23:16:12 30/03/2025
"Nữ hoàng rồng" đẹp nhất Trung Quốc hiện tại: Xứng danh tuyệt sắc giai nhân, ngắm mê không dứt nổi
Sao châu á
23:12:53 30/03/2025
Đặc sản chả cá Lã Vọng lọt top 100 món hải sản ngon nhất thế giới, trên cả sushi của Nhật Bản, dễ làm với nồi chiên không dầu
Ẩm thực
22:54:18 30/03/2025
Hà Hồ - Kim Lý hôn nhau trên phố Paris, Midu ngọt ngào bên chồng doanh nhân
Sao việt
22:43:10 30/03/2025
NSND Như Quỳnh xúc động tái ngộ người chồng màn ảnh sau 50 năm
Tv show
22:40:02 30/03/2025
Rashford bùng nổ giúp Aston Villa vào bán kết FA Cup
Sao thể thao
22:32:32 30/03/2025
Dương Domic, Quân A.P bùng nổ trong live concert The East
Nhạc việt
22:12:59 30/03/2025