Hệ thống dịch tự động của Microsoft đã thông minh như con người

Theo dõi VGT trên

Microsoft đã tạo ra được hệ thống dịch tự động đầu tiên có thể dịch bài báo từ tiếng Trung Quốc sang tiếng Anh với chất lượng và độ chính xác như con người.

Vừa qua, những nhà khoa học tại phòng nghiên cứu ở Mỹ và châu Á của Microsoft đã đạt được thành quả bất ngờ khi đưa hệ thống dịch tự động tham gia chương trình dịch các bài báo newstest2017. Theo đó, hệ thống dịch tự động của Microsoft được xác nhận có khả năng dịch chính xác như con người.

Hệ thống dịch tự động của Microsoft đã thông minh như con người - Hình 1

Xuedong Huang, nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch tự động của Microsoft. Ảnh: Scott Eklund/Red Box Pictures

Xuedong Huang, nhà nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch thuật tự động của Microsoft, gọi đây là một cột mốc quan trọng của một trong những quy trình xử lý ngôn ngữ tự nhiên phức tạp nhất. “Đạt được sự tương đồng với con người trong việc dịch tự động là ước mơ của tất cả chúng tôi”, Huang bày tỏ.

Huang cũng là người dẫn đầu nhóm nghiên cứu gần đây đạt được hiệu quả nhận diện giọng nói hội thoại tương đồng như con người. Ông chia sẻ rằng, cột mốc dịch thuật này đặc biệt đáng ghi nhớ vì khả năng giúp con người hiểu nhau tốt hơn. “Giúp xóa bỏ rào cản ngôn ngữ và mang con người lại gần với nhau hơn là điều rất tuyệt,” ông nói.

Dịch tự động là một vấn đề mà các chuyên gia đã nghiên cứu hàng thập kỷ. Trong suốt thời gian qua, nhiều người tin việc dịch tự động tương đương với con người là không bao giờ đạt được. Tuy nhiên, đạt được cột mốc này không có nghĩa là những thách thức của việc dịch tự động đã được giải quyết.

Video đang HOT

Ming Zhou – Phó Giám đốc khối Nghiên cứu Microsoft châu Á và là trưởng bộ phận xử lý ngôn ngữ tự nhiên cùng làm việc trong dự án, nói rằng nhóm rất vui mừng khi đạt được cột mốc dịch tự động tương đồng với con người trên bộ dữ liệu; nhưng vẫn còn nhiều khó khăn phía trước, như thử nghiệm hệ thống trên các tin tức theo thời gian thực.

Hệ thống dịch tự động của Microsoft đã thông minh như con người - Hình 2

Arul Menezes, Giám đốc quản lý đối tác nghiên cứu của nhóm dịch tự động của Microsoft. Ảnh: Dan DeLong.

Arul Menezes, Giám đốc Quản lý đối tác nghiên cứu của nhóm dịch tự động tại Microsoft cho biết, nhóm nghiên cứu có thể áp dụng những kỹ thuật mà họ đã làm được trong dự án này cho các sản phẩm thương mại về dịch thuật đa ngôn ngữ. Đây là khởi đầu cho các công cụ dịch thuật chính xác và tự nhiên hơn giữa các ngôn ngữ và những đoạn văn có các từ vựng phức tạp.

Để đạt được sự tương đồng như trên, ba nhóm nghiên cứu của Microsoft Bắc Kinh, Redmond vàWashington đã làm việc cùng nhau, bổ sung các phương pháp đào tạo mới, giúp hệ thống dịch thuật dần trôi chảy và chính xác. Trong nhiều trường hợp, những phương pháp mới bắt chước cách con người học việc bằng cách lặp đi lặp lại, thực hiện nhiều lần đến khi làm được.

Một phương pháp mà họ sử dụng là học kép. Đây là cách kiểm tra thực tế kết quả làm việc của hệ thống: Mỗi lần họ gửi một câu qua hệ thống để dịch từ tiếng Trung sang tiếng Anh, nhóm nghiên cứu cũng dịch ngược lại từ tiếng Anh sang tiếng Trung. Việc này tương tự với những gì người ta hay làm để đảm bảo độ chính xác của việc dịch thuật tự động, đồng thời cho phép hệ thống tái xác định và học hỏi từ lỗi sai.

Một phương pháp khác được gọi là hệ thống cân nhắc, tương tự với cách con người hiệu chỉnh và sửa bài viết của mình bằng cách đọc đi đọc lại nhiều lần. Những nhà nghiên cứu dạy cho hệ thống lặp lại quy trình dịch cùng một câu nhiều lần, từ đó dần hiệu chỉnh và cải thiện dịch thuật.

Những nhà nghiên cứu cũng phát triển hai kỹ thuật mới để cải thiện độ chính xác của việc dịch thuật. Một kỹ thuật gọi là đào tạo kết hợp, được sử dụng để liên tục thúc đẩy các hệ thống dịch tiếng Anh sang Trung và ngược lại. Với phương pháp này, hệ thống dịch Anh – Trung thực hiện dịch câu tiếng Anh sang Trung để có được một cặp câu. Sau đó, chúng được bổ sung vào bộ dữ liệu đào tạo, dịch ngược lại từ tiếng Trung sang Anh. Quy trình giống y sau đó được áp dụng, khi đó, kết quả dịch của hai hệ thống dần được cải thiện hơn.

Một kỹ thuật mới nữa gọi là quy tắc hóa thỏa thuận. Với phương pháp này, dịch thuật được thực hiện từ trái sang phải và phải sang trái. Khi kết quả càng giống nhau thì độ chính xác càng được đánh giá cao. Phương pháp này dùng để khuyến khích hệ thống đưa ra các mẫu dịch tương đồng hơn.

Bộ tài liệu kiểm tra mà nhóm đã dùng để đạt được mốc tương đương với con người này gồm khoảng 2.000 câu, lấy từ các báo mạng đã được dịch chuyên nghiệp. Microsoft thực hiện nhiều vòng đánh giá trên bộ kiểm tra này, ngẫu nhiên chọn hàng trăm đoạn dịch để đánh giá mỗi lần. Mặc dù đã vượt các yêu cầu của bộ kiểm tra, để xác minh chất lượng thực sự của bộ máy dịch thuật tự động, Microsoft còn thuê một nhóm các chuyên gia ngôn ngữ từ bên ngoài để so sánh kết quả của Microsoft với nội dung dịch thủ công bởi con người.

Theo Danviet.vn

Thông tin cá nhân người dùng 'đẻ' ra tiền cho Facebook

Trên Facebook, dữ liệu người dùng là "sản phẩm", còn nhà quảng cáo là "khách hàng".

Facebook đã cán mốc 2 tỷ người dùng vào tháng 6 năm ngoái và mạng xã hội này vẫn đang "miễn phí" cho mọi người. Thế nhưng sự thật không phải như vậy, bởi mạng xã hội lớn nhất thế giới vẫn đang kinh doanh thứ mà mọi người ít hoặc không để ý đến: thông tin cá nhân.

Sự riêng tư và thông tin cá nhân là thứ mà người dùng đánh đổi để được sử dụng Facebook mỗi ngày. Theo CNN, những thao tác "thích", "bình luận", "chia sẻ" hay đang bạn đang ở đâu, làm gì... thậm chí là các nội dung bạn trao đổi được Facebook ghi lại chi tiết. Cộng thêm các dữ liệu mà bạn đã cung cấp trước đó như tên, ngày sinh, số điện thoại, địa chỉ... Facebook có một kho dữ liệu khổng lồ.

Thông tin cá nhân người dùng đẻ ra tiền cho Facebook - Hình 1

Thông tin cá nhân của người dùng là công cụ hái ra tiền của Facebook, Google.

Chúng sau đó được lưu trữ tại các trung tâm dữ liệu cực lớn và bán cho các nhà quảng cáo. Với những gì thu thập được, hệ thống của Facebook sẽ phân tích và gợi ý quảng cáo dựa trên thói quen người dùng. Bạn đừng ngạc nhiên khi một món hàng nào đó xuất hiện trên Newsfeed mà bạn từng trao đổi với người khác thông qua tin nhắn hay gọi video bằng Messenger chỉ ít phút trước đó, bởi mọi thứ đã được Facebook theo dõi.

Facebook không đơn độc. Hầu hết các nhà kinh doanh dịch vụ trực tuyến lớn, như Google, Microsoft, Yahoo, AOL, Amazon, Twitter và Yelp cũng làm như vậy, bởi đó là thứ để họ tồn tại và phát triển. Việc trao đổi dữ liệu với bên thứ ba cũng biến Facebook, Google thành những nhà quảng cáo trực tuyến hàng đầu thế giới. Họ đã có trong tay hàng tỷ người dùng và tất nhiên các nhà quảng cáo phải đổ xô đến họ. Theo eMarketer, Facebook và Google kiểm soát 3/4 thị trường quảng cáo kỹ thuật số trị giá 83 tỷ USD chỉ riêng tại Mỹ.

Tất nhiên, các công ty cũng có những quy định riêng, điều khoản riêng để người dùng không cảm thấy mình bị lợi dụng. Nhưng điều đó không đúng 100%.

Cuối tuần qua, công ty dữ liệu công cộng Cambridge Analytica đã tiết lộ thông tin gây hoang mang, khi có tới 50 triệu thông tin cá nhân của người dùng Facebook bị lợi dụng. Thuật toán của mạng xã hội này đã tìm cách tiếp cận, làm nhiễu thông tin và từ đó làm ảnh hưởng đến cuộc bầu cử Mỹ năm 2016.

Lâm Anh

Theo VNE

Bạn thấy bài viết này có hữu ích không?
Có;
Không

Tin liên quan

Tin đang nóng

Chồng H'Hen Niê tung loạt ảnh hẹn hò bí mật suốt 7 năm, netizen liền phán: "Bị block là xứng đáng!"Chồng H'Hen Niê tung loạt ảnh hẹn hò bí mật suốt 7 năm, netizen liền phán: "Bị block là xứng đáng!"
20:13:29 22/02/2025
Kinh hoàng clip nữ diễn viên bị xe đụng, hoảng loạn nhưng phản ứng của ekip mới gây phẫn nộKinh hoàng clip nữ diễn viên bị xe đụng, hoảng loạn nhưng phản ứng của ekip mới gây phẫn nộ
19:49:08 22/02/2025
Nam thần "ma ca rồng" của showbiz bất ngờ thông báo hủy cưới, chia tay bạn gái diễn viên kém 19 tuổiNam thần "ma ca rồng" của showbiz bất ngờ thông báo hủy cưới, chia tay bạn gái diễn viên kém 19 tuổi
19:58:35 22/02/2025
Lại thêm drama: Xuất hiện 1 nhân vật đặc biệt vội bay từ Hàn Quốc đến "cứu" chồng Từ Hy ViênLại thêm drama: Xuất hiện 1 nhân vật đặc biệt vội bay từ Hàn Quốc đến "cứu" chồng Từ Hy Viên
18:41:47 22/02/2025
"Thần đồng" học xong chương trình tiểu học trong 1,5 ngày, 10 tuổi thi đỗ ĐH nhưng nhanh chóng lâm vào bi kịch: Chuyện gì đã xảy ra?"Thần đồng" học xong chương trình tiểu học trong 1,5 ngày, 10 tuổi thi đỗ ĐH nhưng nhanh chóng lâm vào bi kịch: Chuyện gì đã xảy ra?
21:01:39 22/02/2025
1,4 triệu người hóng xem con trai Nhã Phương có 1 hành động lạ giữa đêm lúc Trường Giang vắng nhà1,4 triệu người hóng xem con trai Nhã Phương có 1 hành động lạ giữa đêm lúc Trường Giang vắng nhà
20:18:31 22/02/2025
Quách Phú Thành rời quê vợ trong đêm vì bị khán giả vây kínQuách Phú Thành rời quê vợ trong đêm vì bị khán giả vây kín
22:16:12 22/02/2025
Cuối cùng, nỗi lo sợ của MC Quyền Linh với Lọ Lem - Hạt Dẻ đã xảy đến!Cuối cùng, nỗi lo sợ của MC Quyền Linh với Lọ Lem - Hạt Dẻ đã xảy đến!
20:36:02 22/02/2025

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn
Cách đăng Facebook để có nhiều lượt thích và chia sẻ

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết
Thêm nhiều bang của Mỹ cấm TikTok

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung
Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022
Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...
Facebook trấn áp hàng loạt công ty phần mềm gián điệp

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia
Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...
Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter
Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm
Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR
'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022
Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn
Xiaomi sa thải hàng nghìn nhân sự

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn
Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022
Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Có thể bạn quan tâm

'Bạn trai' Mỹ Tâm khoe body săn chắc, NSND Mỹ Uyên trẻ đẹp tuổi U50

'Bạn trai' Mỹ Tâm khoe body săn chắc, NSND Mỹ Uyên trẻ đẹp tuổi U50

Sao việt

23:57:41 22/02/2025
Diễn viên Mai Tài Phến - bạn trai tin đồn của Mỹ Tâm mặc áo ba lỗ khoe body săn chắc. NSND Mỹ Uyên trẻ đẹp tuổi U50.
Trung Tâm Chăm Sóc Chấn Thương: Phim y khoa Hàn Quốc một lần nữa thắng lớn!

Trung Tâm Chăm Sóc Chấn Thương: Phim y khoa Hàn Quốc một lần nữa thắng lớn!

Phim châu á

23:50:58 22/02/2025
Trung Tâm Chăm Sóc Chấn Thương (The Trauma Code: Heroes on Call) đã thành công tái hiện chân thực những thách thức của hệ thống y tế hiện đại, đồng thời tôn vinh nghị lực và sức mạnh con người!
Đây là Lan Ngọc hay Bạch Lộc?

Đây là Lan Ngọc hay Bạch Lộc?

Hậu trường phim

23:42:16 22/02/2025
Bức hình này đang khiến cư dân mạng cực lú vì không biết người trong hình là Ninh Dương Lan Ngọc hay mỹ nhân Hoa ngữ Bạch Lộc.
G-Dragon phát hành teaser MV mới gây phấn khích

G-Dragon phát hành teaser MV mới gây phấn khích

Nhạc quốc tế

23:35:35 22/02/2025
Trưa nay (22/2), G-Dragon đã công bố teaser của MV mới Too Bad trên các kênh thông tin cá nhân của mình, tại các nền tảng như Youtube, Instagram...
Tân Sơn Nhất chật kín fan vì cặp đôi bách hợp hot nhất Thái Lan, nhìn đến nhan sắc mà "sốc visual"!

Tân Sơn Nhất chật kín fan vì cặp đôi bách hợp hot nhất Thái Lan, nhìn đến nhan sắc mà "sốc visual"!

Sao châu á

23:29:46 22/02/2025
Không quản ngại đường xa, rất nhiều fan đã ra đón cặp đôi girllove hot nhất hiện nay, tạo nên bầu không khí vô cùng náo nhiệt tại Tân Sơn Nhất.
Hồ Quang Hiếu tiết lộ cuộc sống sau khi lấy vợ, có con

Hồ Quang Hiếu tiết lộ cuộc sống sau khi lấy vợ, có con

Tv show

22:47:26 22/02/2025
Trong chương trình Khách hàng là thượng đế , Hồ Quang Hiếu có những tiết lộ với Trường Giang và Hoa hậu Mai Phương về cuộc sống sau khi có con đầu lòng.
Bóc profile hệ tư tưởng "F4 Vũng Tàu" đang ầm ầm cõi mạng, đu trend này chưa các người đẹp?

Bóc profile hệ tư tưởng "F4 Vũng Tàu" đang ầm ầm cõi mạng, đu trend này chưa các người đẹp?

Netizen

22:23:09 22/02/2025
Lướt TikTok thời gian gần đây, hẳn cộng đồng mạng đều cảm thấy tò mò khi hệ tư tưởng F4 Vũng Tàu xâm chiếm. Nhiều người thắc mắc, đoạn clip chỉ đơn giản là một hội bạn thân cùng đứng quay trend
Hamas thả thêm 5 con tin tại Gaza

Hamas thả thêm 5 con tin tại Gaza

Thế giới

22:14:27 22/02/2025
Hai con tin Tal Shoham (40 tuổi) và Avera Mengistu (39 tuổi) đã được thả trước đó tại Rafah, miền Nam Gaza. Con tin thứ sáu, Hisham Al-Sayed (36 tuổi), dự kiến sẽ được thả tại thành phố Gaza.
Kim Kardashian hậu ly hôn Kanye West: Là tỷ phú USD, ngày càng quyến rũ

Kim Kardashian hậu ly hôn Kanye West: Là tỷ phú USD, ngày càng quyến rũ

Sao âu mỹ

22:05:38 22/02/2025
Sau khi ly hôn rapper Kanye West, Kim Kardashian tập trung hoàn thiện bản thân, làm việc và nuôi con. Hiện, ngôi sao truyền hình thực tế sở hữu khối tài sản lên tới 1,7 tỷ USD.
Lý do tiền vệ kỳ cựu Kevin De Bruyne chia tay Man City

Lý do tiền vệ kỳ cựu Kevin De Bruyne chia tay Man City

Sao thể thao

22:04:18 22/02/2025
Manchester City mong ký hợp đồng với Florian Wirtz và Andrea Cambiaso trong kỳ chuyển nhượng mùa hè, sẵn sàng để tiền vệ kỳ cựu Kevin De Bruyne ra đi.
Đã xuất hiện những mặt trái: fan sờ soạng, bám đuôi và có hành vi đầu độc nghệ sĩ - Giới hạn nào cho "văn hoá thần tượng quốc nội"?

Đã xuất hiện những mặt trái: fan sờ soạng, bám đuôi và có hành vi đầu độc nghệ sĩ - Giới hạn nào cho "văn hoá thần tượng quốc nội"?

Nhạc việt

21:43:25 22/02/2025
Sức mạnh của văn hoá thần tượng thể hiện rõ nhất ở loạt concert cháy vé, với quy mô hàng chục nghìn người của 2 chương trình Anh Trai Say Hi và Anh Trai Vượt Ngàn Chông Gai.