Hệ thống dịch tự động của Microsoft đã thông minh như con người

Theo dõi VGT trên

Microsoft đã tạo ra được hệ thống dịch tự động đầu tiên có thể dịch bài báo từ tiếng Trung Quốc sang tiếng Anh với chất lượng và độ chính xác như con người.

Vừa qua, những nhà khoa học tại phòng nghiên cứu ở Mỹ và châu Á của Microsoft đã đạt được thành quả bất ngờ khi đưa hệ thống dịch tự động tham gia chương trình dịch các bài báo newstest2017. Theo đó, hệ thống dịch tự động của Microsoft được xác nhận có khả năng dịch chính xác như con người.

Hệ thống dịch tự động của Microsoft đã thông minh như con người - Hình 1

Xuedong Huang, nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch tự động của Microsoft. Ảnh: Scott Eklund/Red Box Pictures

Xuedong Huang, nhà nghiên cứu kỹ thuật phụ trách mảng lời nói, ngôn ngữ tự nhiên và dịch thuật tự động của Microsoft, gọi đây là một cột mốc quan trọng của một trong những quy trình xử lý ngôn ngữ tự nhiên phức tạp nhất. “Đạt được sự tương đồng với con người trong việc dịch tự động là ước mơ của tất cả chúng tôi”, Huang bày tỏ.

Huang cũng là người dẫn đầu nhóm nghiên cứu gần đây đạt được hiệu quả nhận diện giọng nói hội thoại tương đồng như con người. Ông chia sẻ rằng, cột mốc dịch thuật này đặc biệt đáng ghi nhớ vì khả năng giúp con người hiểu nhau tốt hơn. “Giúp xóa bỏ rào cản ngôn ngữ và mang con người lại gần với nhau hơn là điều rất tuyệt,” ông nói.

Dịch tự động là một vấn đề mà các chuyên gia đã nghiên cứu hàng thập kỷ. Trong suốt thời gian qua, nhiều người tin việc dịch tự động tương đương với con người là không bao giờ đạt được. Tuy nhiên, đạt được cột mốc này không có nghĩa là những thách thức của việc dịch tự động đã được giải quyết.

Video đang HOT

Ming Zhou – Phó Giám đốc khối Nghiên cứu Microsoft châu Á và là trưởng bộ phận xử lý ngôn ngữ tự nhiên cùng làm việc trong dự án, nói rằng nhóm rất vui mừng khi đạt được cột mốc dịch tự động tương đồng với con người trên bộ dữ liệu; nhưng vẫn còn nhiều khó khăn phía trước, như thử nghiệm hệ thống trên các tin tức theo thời gian thực.

Hệ thống dịch tự động của Microsoft đã thông minh như con người - Hình 2

Arul Menezes, Giám đốc quản lý đối tác nghiên cứu của nhóm dịch tự động của Microsoft. Ảnh: Dan DeLong.

Arul Menezes, Giám đốc Quản lý đối tác nghiên cứu của nhóm dịch tự động tại Microsoft cho biết, nhóm nghiên cứu có thể áp dụng những kỹ thuật mà họ đã làm được trong dự án này cho các sản phẩm thương mại về dịch thuật đa ngôn ngữ. Đây là khởi đầu cho các công cụ dịch thuật chính xác và tự nhiên hơn giữa các ngôn ngữ và những đoạn văn có các từ vựng phức tạp.

Để đạt được sự tương đồng như trên, ba nhóm nghiên cứu của Microsoft Bắc Kinh, Redmond vàWashington đã làm việc cùng nhau, bổ sung các phương pháp đào tạo mới, giúp hệ thống dịch thuật dần trôi chảy và chính xác. Trong nhiều trường hợp, những phương pháp mới bắt chước cách con người học việc bằng cách lặp đi lặp lại, thực hiện nhiều lần đến khi làm được.

Một phương pháp mà họ sử dụng là học kép. Đây là cách kiểm tra thực tế kết quả làm việc của hệ thống: Mỗi lần họ gửi một câu qua hệ thống để dịch từ tiếng Trung sang tiếng Anh, nhóm nghiên cứu cũng dịch ngược lại từ tiếng Anh sang tiếng Trung. Việc này tương tự với những gì người ta hay làm để đảm bảo độ chính xác của việc dịch thuật tự động, đồng thời cho phép hệ thống tái xác định và học hỏi từ lỗi sai.

Một phương pháp khác được gọi là hệ thống cân nhắc, tương tự với cách con người hiệu chỉnh và sửa bài viết của mình bằng cách đọc đi đọc lại nhiều lần. Những nhà nghiên cứu dạy cho hệ thống lặp lại quy trình dịch cùng một câu nhiều lần, từ đó dần hiệu chỉnh và cải thiện dịch thuật.

Những nhà nghiên cứu cũng phát triển hai kỹ thuật mới để cải thiện độ chính xác của việc dịch thuật. Một kỹ thuật gọi là đào tạo kết hợp, được sử dụng để liên tục thúc đẩy các hệ thống dịch tiếng Anh sang Trung và ngược lại. Với phương pháp này, hệ thống dịch Anh – Trung thực hiện dịch câu tiếng Anh sang Trung để có được một cặp câu. Sau đó, chúng được bổ sung vào bộ dữ liệu đào tạo, dịch ngược lại từ tiếng Trung sang Anh. Quy trình giống y sau đó được áp dụng, khi đó, kết quả dịch của hai hệ thống dần được cải thiện hơn.

Một kỹ thuật mới nữa gọi là quy tắc hóa thỏa thuận. Với phương pháp này, dịch thuật được thực hiện từ trái sang phải và phải sang trái. Khi kết quả càng giống nhau thì độ chính xác càng được đ.ánh giá cao. Phương pháp này dùng để khuyến khích hệ thống đưa ra các mẫu dịch tương đồng hơn.

Bộ tài liệu kiểm tra mà nhóm đã dùng để đạt được mốc tương đương với con người này gồm khoảng 2.000 câu, lấy từ các báo mạng đã được dịch chuyên nghiệp. Microsoft thực hiện nhiều vòng đ.ánh giá trên bộ kiểm tra này, ngẫu nhiên chọn hàng trăm đoạn dịch để đ.ánh giá mỗi lần. Mặc dù đã vượt các yêu cầu của bộ kiểm tra, để xác minh chất lượng thực sự của bộ máy dịch thuật tự động, Microsoft còn thuê một nhóm các chuyên gia ngôn ngữ từ bên ngoài để so sánh kết quả của Microsoft với nội dung dịch thủ công bởi con người.

Theo Danviet.vn

Thông tin cá nhân người dùng 'đẻ' ra t.iền cho Facebook

Trên Facebook, dữ liệu người dùng là "sản phẩm", còn nhà quảng cáo là "khách hàng".

Facebook đã cán mốc 2 tỷ người dùng vào tháng 6 năm ngoái và mạng xã hội này vẫn đang "miễn phí" cho mọi người. Thế nhưng sự thật không phải như vậy, bởi mạng xã hội lớn nhất thế giới vẫn đang kinh doanh thứ mà mọi người ít hoặc không để ý đến: thông tin cá nhân.

Sự riêng tư và thông tin cá nhân là thứ mà người dùng đ.ánh đổi để được sử dụng Facebook mỗi ngày. Theo CNN, những thao tác "thích", "bình luận", "chia sẻ" hay đang bạn đang ở đâu, làm gì... thậm chí là các nội dung bạn trao đổi được Facebook ghi lại chi tiết. Cộng thêm các dữ liệu mà bạn đã cung cấp trước đó như tên, ngày sinh, số điện thoại, địa chỉ... Facebook có một kho dữ liệu khổng lồ.

Thông tin cá nhân người dùng đẻ ra t.iền cho Facebook - Hình 1

Thông tin cá nhân của người dùng là công cụ hái ra t.iền của Facebook, Google.

Chúng sau đó được lưu trữ tại các trung tâm dữ liệu cực lớn và bán cho các nhà quảng cáo. Với những gì thu thập được, hệ thống của Facebook sẽ phân tích và gợi ý quảng cáo dựa trên thói quen người dùng. Bạn đừng ngạc nhiên khi một món hàng nào đó xuất hiện trên Newsfeed mà bạn từng trao đổi với người khác thông qua tin nhắn hay gọi video bằng Messenger chỉ ít phút trước đó, bởi mọi thứ đã được Facebook theo dõi.

Facebook không đơn độc. Hầu hết các nhà kinh doanh dịch vụ trực tuyến lớn, như Google, Microsoft, Yahoo, AOL, Amazon, Twitter và Yelp cũng làm như vậy, bởi đó là thứ để họ tồn tại và phát triển. Việc trao đổi dữ liệu với bên thứ ba cũng biến Facebook, Google thành những nhà quảng cáo trực tuyến hàng đầu thế giới. Họ đã có trong tay hàng tỷ người dùng và tất nhiên các nhà quảng cáo phải đổ xô đến họ. Theo eMarketer, Facebook và Google kiểm soát 3/4 thị trường quảng cáo kỹ thuật số trị giá 83 tỷ USD chỉ riêng tại Mỹ.

Tất nhiên, các công ty cũng có những quy định riêng, điều khoản riêng để người dùng không cảm thấy mình bị lợi dụng. Nhưng điều đó không đúng 100%.

Cuối tuần qua, công ty dữ liệu công cộng Cambridge Analytica đã tiết lộ thông tin gây hoang mang, khi có tới 50 triệu thông tin cá nhân của người dùng Facebook bị lợi dụng. Thuật toán của mạng xã hội này đã tìm cách tiếp cận, làm nhiễu thông tin và từ đó làm ảnh hưởng đến cuộc bầu cử Mỹ năm 2016.

Lâm Anh

Theo VNE

Bạn thấy bài viết này có hữu ích không?
Có;
Không

Tin liên quan

Tin đang nóng

Diễn biến mới nhất drama Nam Thư: "Chính thất" bị mẹ chồng đổ lỗi, sẽ giao hết bằng chứng nếu ra toà
19:44:44 07/07/2024
Hoàng Thùy đã căng: Đăng đàn ám chỉ ai đó bề ngoài tỏ ra thân thiết nhưng... thực chất bên trong nham hiểm
21:32:34 07/07/2024
Livestream tâm sự, Xoài Non "sượng trân" trước câu hỏi nhắc về chồng cũ
21:32:32 07/07/2024
Anh Trai Vượt Ngàn Chông Gai tập 2 có lượt xem trực tiếp trên YouTube tăng gấp 10 lần, có thời điểm còn vượt qua show "đối thủ"
19:34:00 07/07/2024
Nữ minh tinh Giày Thủy Tinh gặp biến chứng đáng sợ hậu "dao kéo"
20:46:31 07/07/2024
Con gái 4 t.uổi lau nước mắt cho mẹ trong lễ cúng 49 ngày diễn viên Đức Tiến
23:12:31 07/07/2024
Team qua đường tóm dính Đặng Văn Lâm và Yến Xuân cùng xuất hiện địa điểm làm "đám cưới bí mật"
18:47:37 07/07/2024
Hoàng tử màn ảnh Việt không cưới vợ, thông báo lên chức bố ở t.uổi 42, chăm làm từ thiện, hướng Phật
21:27:07 07/07/2024

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung

Microsoft cấm khai thác t.iền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022
Microsoft đã cập nhật thỏa thuận cấm khai thác t.iền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác t.iền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản t.iền phạt lên tới ...

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022
Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022
Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Có thể bạn quan tâm

Những kiểu đầm suông mang lại sự thoải mái cho mùa hè nóng bức

Thời trang

01:14:11 08/07/2024
Chiếc đầm suông phù hợp với mọi dáng người, với thiết kế rộng rãi không ôm sát cơ thể, dễ dàng suông tự nhiên từ vai xuống mà không cần định hình eo, mang lại sự thoải mái cho mùa hè nóng bức.

Tuần mới (8-14/7): 2 t.uổi nhận lộc kinh doanh lãi đậm, 1 t.uổi chịu đủ vận hạn

Trắc nghiệm

23:56:09 07/07/2024
Trong khi 2 con giáp may mắn đổi đời nhờ kinh doanh thuận lợi, 1 con giáp lại phải đối mặt với nhiều khó khăn, thử thách.

Đến Sài Gòn ai cũng thích mê 1 món súp: Mách bạn 7 địa chỉ chất lượng nhất!

Ẩm thực

23:26:54 07/07/2024
Để tìm một quán súp cua ở Sài Gòn thì không khó, nhưng dưới đây là 7 địa chỉ bán món súp trứ danh này chất lượng nhất!

Cây hài sân khấu: Dũng Nhí - Gian khổ vẫn không ngớt tiếng cười

Sao việt

23:18:16 07/07/2024
Diễn viên Dũng Nhí có thể xem là cây hài trẻ của cải lương dù anh không còn trẻ nữa và đã lăn lóc với nghề hơn 20 năm.

'Anh trai say hi' tập 4: Chơi đùa với lửa, nóng hơn sa mạc

Tv show

23:15:41 07/07/2024
Trong tập phát sóng mới nhất của chương trình Anh trai say hi , khán giả đã được chứng kiến những tiết mục cực kỳ n.óng b.ỏng với sân khấu dàn dựng hoành tráng, ấn tượng và đầy bất ngờ.

Fan mong Daesung hát bài gì tại concert ở Việt Nam?

Nhạc quốc tế

23:09:36 07/07/2024
Tin vui dành cho các bạn fan của Daesung, nhiều bài hát nổi tiếng gắn liền với BIGBANG đã được anh chàng đem đến các concert diễn ra trước đó.

Những điều kỳ lạ nhất định phải trải nghiệm khi đi du lịch ở châu Âu

Du lịch

22:39:42 07/07/2024
Danh sách này tập hợp những điều kỳ lạ nhất mà bạn có thể trải nghiệm khi đi du lịch ở châu Âu. Lễ hội trứng tráng khổng lồ (Bessières, Pháp)

Suzy kỷ niệm 14 năm gia nhập làng giải trí

Sao châu á

22:27:29 07/07/2024
Nữ thần tượng kiêm diễn viên chia sẻ khoảnh khắc vui vẻ trên Instagram cá nhân và nhận được nhiều lời chúc mừng từ khán giả toàn cầu.

Bin đổ cho Riot "giúp" T1 dù lỗi hoàn toàn là "tự hủy"

Mọt game

22:09:20 07/07/2024
Trong cuộc đối đầu mới đây giữa hai đội Bilibili Gaming và T1 thuộc khuôn khổ Esports World Cup 2024, T1 đã giành chiến thắng với tỉ số 2-1.