Công cụ dịch giọng nói tiếng Phúc Kiến sang tiếng Anh của Meta gây ’sốt’ ở Trung Quốc

Sơn Vân17:07 22/10/2022

Hệ thống dịch thuật đầu tiên thuộc loại này đã gây tò mò cho cư dân mạng ở Trung Quốc.

Hệ thống dịch giọng nói thời gian thực mới của Meta Platforms cho tiếng Phúc Kiến , một phương ngữ được sử dụng rộng rãi ở tỉnh Phúc Kiến (đông nam Trung Quốc), Đài Loan và cộng đồng gốc Hoa trên khắp Đông Nam Á, đã thu hút được sự quan tâm mạnh mẽ ở Trung Quốc, nơi Facebook bị chặn.

Tuần này, gã khổng lồ công nghệ Mỹ cho biết hệ thống trí tuệ nhân tạo (AI) có thể dịch giữa tiếng Phúc Kiến và tiếng Anh là một phần trong nỗ lực của Meta Platforms nhằm “phá vỡ rào cản ngôn ngữ trong cả thế giới thực và thế giới ảo”.

Các hệ thống dịch giọng nói được hỗ trợ bởi AI hiện tại chủ yếu tập trung vào ngôn ngữ viết và dựa trên phiên âm để đào tạo các mô hình AI của chúng. Tuy nhiên, tiếng Phúc Kiến là ngôn ngữ chủ yếu nói bằng miệng, thiếu hình thức viết chuẩn, theo Meta Platforms.

Một thách thức khác là ít người nói tiếng Phúc Kiến hơn nhiều so với tiếng Anh hoặc tiếng Tây Ban Nha, đồng nghĩa là không có đủ dữ liệu đào tạo.

Khó khăn trong việc dịch giọng nói được minh họa vào đầu tháng này khi Douyin gây tranh cãi sau khi cắt các phiên phát trực tiếp (livestream) của một số người có ảnh hưởng nói tiếng Quảng Đông vì hệ thống của họ không thể nhận dạng được phương ngữ Trung Quốc này. Douyin là phiên bản tiếng Trung của TikTok, do tập đoàn ByteDance sở hữu.

Hệ thống dịch thuật speech-to-speech của Meta Platforms đã khắc phục được vấn đề này bằng cách dịch văn bản tiếng Anh sang tiếng Quan thoại trước tiên, sau đó chuyển đổi nó thành tiếng Phúc Kiến và ngược lại, trước khi thêm vào dữ liệu đào tạo.

Khi thực hiện dịch thời gian thực, hệ thống chuyển đổi tiếng Phúc Kiến thành các đơn vị âm thanh và tạo ra các dạng sóng từ chúng. Các dạng sóng sau đó được chuyển đổi thành văn bản tiếng Quan Thoại và cuối cùng được dịch sang các đơn vị âm thanh của tiếng Anh.

Video đang HOT

Mark Zuckerberg và nhà nghiên cứu AI Chen Peng-Jen sử dụng công cụ dịch thuật của Meta Plaforms để nói chuyện với nhau bằng tiếng Anh và tiếng Phúc Kiến

Hệ thống dịch thuật đầu tiên thuộc loại đó đã gây tò mò cho cư dân mạng ở Trung Quốc, nơi một đoạn video cho thấy Giám đốc điều hành Meta Platforms – Mark Zuckerberg và nhà nghiên cứu AI Chen Peng-Jen sử dụng công cụ này để nói chuyện với nhau bằng tiếng Anh và tiếng Phúc Kiến.

” Ấn tượng. WeChat thậm chí không hỗ trợ nhập liệu bằng giọng nói ở Phúc Kiến “, một người ở tỉnh Phúc Kiến dùng siêu ứng dụng WeChat (của Tencent Holdings) viết.

Một số người dùng internet Trung Quốc cũng khuyến khích Meta Platforms chấp nhận thách thức lớn hơn là phát triển một hệ thống dịch cho tiếng địa phương của thành phố Ôn Châu ở tỉnh Chiết Giang, vốn nổi tiếng là khó nắm bắt ngay cả với những người bản xứ Trung Quốc.

Tuy nhiên, những người khác coi hệ thống dịch thuật mới của Meta Platforms là mối đe dọa tiềm tàng cho Trung Quốc trong bối cảnh căng thẳng gia tăng với Mỹ. Họ lo ngại rằng công nghệ này có thể trở thành một công cụ hữu ích cho chính phủ và quân đội Mỹ.

Trong khi Meta Plaforms đã làm cho hệ thống dịch thuật tiếng Phúc Kiến của mình có mã nguồn mở với hy vọng rằng những người khác sẽ sử dụng nó cho nhiều ngôn ngữ hơn, mô hình AI “vẫn đang trong quá trình phát triển” và chỉ có thể dịch một câu đầy đủ tại một thời điểm, công ty Mỹ cho biết.

Cuối tháng 9 vừa qua, Meta Platforms cũng gây chú ý với Make-A-Video, hệ thống AI mới giúp tạo ra những video nghệ thuật từ văn bản và hình ảnh.

Trong một video, con chó mặc áo choàng đỏ và đeo kính râm bay trên bầu trời. Trong một video khác, những con kỳ lân phi nước đại dọc theo một bãi biển. Meta Platforms đã tạo ra những video kỳ quặc này bằng Make-A-Video. Đó là một phần trong nghiên cứu của Meta Platforms về công nghệ có thể tạo nội dung mới từ thông báo văn bản.

Meta Platforms nói rằng Make-A-Video cũng có thể tạo video từ hình ảnh hoặc các video tương tự. Meta Platforms cho biết nghiên cứu của họ về AI có tiềm năng mở ra cơ hội mới cho người sáng tạo và nghệ sĩ.

Ảnh chụp màn hình video về một chú chó siêu anh hùng được tạo ra bởi hệ thống AI của Meta Platforms

Meta Platforms nói rằng có kế hoạch phát hành bản demo của Make-A-Video, nhưng công cụ này hiện không khả dụng cho tất cả mọi người. Nhóm nghiên cứu AI của Meta Platforms sẽ nhận các yêu cầu về hình ảnh thông qua tài khoản Twitter của mình.

” Nghiên cứu về trí tuệ nhân tạo đang thúc đẩy sự thể hiện sáng tạo bằng cách cung cấp cho mọi người các công cụ để tạo nội dung mới một cách nhanh chóng và dễ dàng. Chỉ với một vài từ hoặc vài dòng văn bản, Make-A-Video có thể khiến trí tưởng tượng trở nên sống động và tạo ra những video có một không hai với đầy màu sắc và phong cảnh sống động “, Meta Platforms thông báo trong một bài đăng trên blog.

Meta Platforms cũng đã xây dựng một mô hình AI có tên Make-A-Scene tạo ra “hình ảnh minh họa chân thực và nghệ thuật chất lượng như sách truyện” từ các từ và bản phác thảo.

Khi các hãng công nghệ giúp người dùng tạo hình ảnh và video dễ dàng hơn, cũng đã có những lo ngại về việc liệu các công cụ AI này có thể bị lạm dụng hay không.

Thượng nghị sĩ Anna Eshoo, đảng viên đảng Dân chủ ở bang California (Mỹ), bày tỏ mối lo ngại đó, trong một bức thư hồi tháng 9, lưu ý rằng AI Stable Diffusion đã được sử dụng “để tạo ra những bức ảnh về phụ nữ châu Á bị đánh đập bạo lực và nội dung khiêu dâm mô tả người thật”.

Meta Platforms cho biết thận trọng khi xây dựng các hệ thống AI mang tính tổng thể và sẵn sàng nhận phản hồi khi công ty chia sẻ công khai nghiên cứu của họ.

Facebook thêm công cụ giúp ngăn ngừa thông tin sai lệch phát tán trong nhóm

Facebook mới đây đã bổ sung thêm công cụ giúp quản trị viên (admin) của các nhóm (group) tự động sàng lọc những bài đăng được cho là chứa thông tin sai lệch, trong bối cảnh công ty chủ quản Meta đang nỗ lực nâng cao chất lượng và độ tin cậy của tin tức lan truyền trên nền tảng mạng xã hội này.

Biểu tượng Facebook và Meta. Ảnh: AFP/TTXVN

Người đứng đầu ban điều hành ứng dụng Facebook, ông Tom Alison cho biết để đảm bảo các nội dung được đăng đáng tin cậy hơn, các bài đã được một bên thứ 3 kiểm duyệt và đánh giá là chứa thông tin sai lệch có thể được tự động đưa vào mục "chờ duyệt" riêng để các admin xem xét trước khi xóa.

Theo dữ liệu chính thức của Facebook, mỗi tháng nền tảng này ghi nhận hơn 1,8 tỷ người hoạt động trên các hội nhóm, trong đó các thành viên thường tham gia do cùng quan tâm một chủ đề cụ thể. Các chủ đề có phạm vi rộng rãi, từ nuôi dạy con cái cho đến chính trị.

Tuy nhiên, giới phê bình cho rằng các đặc điểm trên về hoạt động của nhóm lại dễ dàng tạo điều kiện cho việc lan truyền thông tin giả mạo và sai lệch, trong đó lợi dụng việc các thành viên có cùng mối quan tâm đến một vấn đề cụ thể. Một số nghiên cứu cũng cho thấy các tính năng cộng đồng và riêng tư trên Facebook đều bị những đối tượng xấu lợi dụng để phát tán những thông tin độc hại.

Hồi tháng 3, Facebook đã bắt đầu cho phép các nhóm tự động từ chối đăng tải các nội dung mới được xác định là chứa thông tin sai hoặc giả, đồng thời cập nhật một công cụ khác cho phép các admin tạm thời chặn một số thành viên đăng bài, bình luận hoặc tham gia nhóm. Đối với các nhóm đang tìm cách thu hút thành viên mới, Facebook bổ sung tính năng giúp họ quảng bá cho nhóm bằng cách sử dụng mã QR hoặc email.

Ông Alison cho biết mục tiêu phát triển và nâng cao chất lượng hoạt động trên các nhóm là một phần trong tầm nhìn của Meta về một tương lai Metaverse (vũ trụ ảo) hoàn toàn trở thành hiện thực. Facebook cho biết công cụ sàng lọc thông tin sai lệch nằm trong số các cải tiến nhằm mục đích giúp quản trị viên quản lý nhóm dễ dàng hơn, đồng thời thúc đẩy những tương tác tích cực trên mạng xã hội khổng lồ này.

Nhà điều hành Meta Mark Zuckerberg cam kết sẽ tiếp tục cải tiến và phát triển các tính năng mới để giúp người dùng "kết nối sâu sắc hơn nữa trên phương diện các chủ đề cùng quan tâm", đặc biệt khi đây là một trong những ưu tiên trong phát triển "vũ trụ thực tế ảo" - được ông Zuckerberg coi là chìa khóa cho tương lai của công ty, cũng như nền công nghệ trên toàn cầu.

Mô hình AI của OpenAI tự động nhận dạng giọng nói và dịch sang tiếng Anh Ngày 21/9, OpenAI phát hành một mô hình AI mã nguồn mở mới có tên là Whisper có thể nhận dạng và dịch âm thanh ở cấp độ tiếp cận với khả năng nhận dạng con người qua giọng nói. Sóng âm thanh. Ảnh minh họa Ars Technica. Theo nhóm phóng viên của Ars Technica, phần mềm mã nguồn mở Whisper có thể...

Bạn thấy bài viết này có hữu ích không?

Có

Không

Tin liên quan

Xem thêm Share

Xem nhiều

Cầu vồng ở phía chân trời - Tập 25: Chị giúp việc tiết lộ Oanh thất nghiệp, bết bát nhưng vẫn sĩ03:16

Bảo vệ kể lý do cô gái Hà Nội phản đòn, khống chế nam thanh niên xăm trổ12:06

Hoàng Thùy Linh - Đen Vâu dính kè kè nhau, có phản ứng lạ hậu công khai01:11

Chế tài xử lý người nước ngoài cướp trang sức hơn 800 triệu tại Đà Nẵng00:53

Chuyện gì đang xảy ra khiến Á hậu Phương Nga khóc nức nở còn Bình An thì bất lực?01:03

Bài hát xứng đáng nổi tiếng hơn: 2 lần gây bão concert quốc gia, Chị Đẹp cứ lên sân khấu là bùng nổ visual03:44

Nhạc sĩ tỷ view Nguyễn Văn Chung bắt tay Quốc Thiên, Neko Lê trong ca khúc chủ đề của Chiến Sĩ Quả Cảm03:29

Mỹ nhân Mưa Đỏ hát chơi chơi ca khúc hot nhất 2/9 mà được khen tới tấp, visual trời sinh một cặp với nam chính05:43

Chàng trai có ca khúc được chọn cho Đại lễ 2/9: "Con tướng" mạnh của Anh Trai mùa 2, chạm tay là có hit08:21

Sốc visual tài tử điện ảnh đẹp nhất Việt Nam, chỉ nói 1 câu mà khiến 3 triệu người đổ gục01:34

NSND Thanh Hoa hạnh phúc ngập tràn bên Hoà Minzy, dàn diễn viên 'Mưa đỏ' gây sốt00:18

Tiêu điểm

Tin đang nóng

Tin mới nhất

Dàn robot hình người đang gây sốt tại Triển lãm thành tựu 80 năm

16:57:59 30/08/2025

Điểm đáng chú ý là những chú robot không chỉ hiện diện ở các gian hàng công nghệ mà còn xuất hiện tại nhiều gian trưng bày của các bộ, ngành, địa phương cũng như doanh nghiệp khác, tạo nên dấu ấn hiện đại và sinh động cho triển lãm.

Google ngày càng 'Apple hóa' hệ điều hành Android

10:12:19 30/08/2025

Việc lấy bảo mật làm cái cớ để xây dựng một hệ sinh thái đóng chính là chiến lược mà Apple đã sử dụng trong nhiều năm. Và giờ đây, Google dường như đang đi theo vết xe đổ đó.

AI thay đổi cách con người lên kế hoạch du lịch như thế nào?

12:53:59 28/08/2025

Trong khi lời truyền miệng và các gợi ý từ người thân vẫn luôn là cách truyền thống để tìm kiếm địa điểm du lịch, thì một số khảo sát đã chỉ ra một đối thủ mới mạnh mẽ hơn: các nền tảng mạng xã hội và video trực tuyến.

Tội phạm mạng dùng Claude để vibe hacking, biến AI thành vũ khí nguy hiểm

12:34:37 28/08/2025

Vibe hacking là thuật ngữ mới nổi, dùng để chỉ việc tội phạm mạng lạm dụng công cụ AI để thực hiện các cuộc tấn công mà không cần quá nhiều kiến thức chuyên sâu về kỹ thuật.

Cách cơ bản để tìm lại iPhone bị mất kịp thời và chính xác

12:32:25 28/08/2025

Mất iPhone có thể khiến bạn lo lắng, nhưng đừng hoảng. Với các cách cơ bản và tiện lợi như dùng Find My, iCloud hoặc thiết bị Apple khác, bạn hoàn toàn có thể định vị và tìm lại iPhone nhanh chóng, chính xác.

Google Dịch chính thức có 'quyền năng' được mong đợi từ rất lâu

11:30:19 28/08/2025

Google Dịch lập cú đúp phiên dịch viên AI thời gian thực, vừa là thầy dạy ngoại ngữ cá nhân.

Cách làm icon chat bằng ảnh tự sướng cực nhanh và đơn giản

10:02:16 28/08/2025

Cách dùng các ứng dụng này cũng rất dễ, tương tự như những ứng dụng bàn phím đã đề cập. Bạn chỉ cần tải ứng dụng về, chọn và tải lên bức ảnh muốn biến thành icon. Tiếp đó, thực hiện vài thao tác cắt, chỉnh sửa theo ý muốn.

Một câu hỏi cho AI tốn bao nhiêu tài nguyên?

20:34:47 27/08/2025

Google vừa công bố báo cáo kỹ thuật đầu tiên, vén màn bức màn bí mật về mức tiêu thụ năng lượng và tài nguyên của Gemini, mô hình trí tuệ nhân tạo (AI) mạnh mẽ nhất của hãng.

Sạc nhanh không làm chai pin, 'thủ phạm' là thứ ít ai ngờ tới.

13:50:52 27/08/2025

Công nghệ sạc nhanh cho điện thoại từ lâu mang tiếng là kẻ thù thầm lặng của pin, nhưng thực tế phức tạp hơn và một số thói quen sử dụng của người dùng mới là nguyên nhân gây ra nhiều thiệt hại. Tại sao sạc nhanh không phải thủ phạm chí...

YouTube tự ý dùng AI làm nét video gây phẫn nộ trong cộng đồng sáng tạo

13:40:55 27/08/2025

TheoAndroid Authority, nếu gần đây khi lướt YouTube Shorts và thấy các video có vẻ nhòe nhoẹt, mịn màng một cách kỳ lạ như thể đang bật một bộ lọc làm đẹp, bạn không hề đơn độc.

Gemini thêm sức mạnh nhờ loạt tính năng mới

13:34:21 27/08/2025

Mặc dù tính năng này mang lại nhiều tiện ích, tuy nhiên chúng vẫn tồn tại một số hạn chế làm ảnh hưởng đến trải nghiệm người dùng Gemini, như sự không nhất quán trong diện mạo của chủ thể giữa các bức ảnh.

NVIDIA ra mắt 'bộ não mới' cho robot

13:16:36 27/08/2025

Hiện tại nhiều công ty như Agility Robotics, Amazon, Meta và Boston Dynamics đang sử dụng dòng chip Jetson, trong khi NVIDIA cũng đầu tư vào các startup như Field AI.