Mô hình AI của OpenAI tự động nhận dạng giọng nói và dịch sang tiếng Anh

Theo dõi VGT trên

Ngày 21/9, OpenAI phát hành một mô hình AI mã nguồn mở mới có tên là Whisper có thể nhận dạng và dịch âm thanh ở cấp độ tiếp cận với khả năng nhận dạng con người qua giọng nói.

Mô hình AI của OpenAI tự động nhận dạng giọng nói và dịch sang tiếng Anh - Hình 1

Sóng âm thanh. Ảnh minh họa Ars Technica.

Theo nhóm phóng viên của Ars Technica, phần mềm mã nguồn mở Whisper có thể ghi lại các cuộc phỏng vấn, podcast, cuộc trò chuyện, nhận dạng âm thanh của các ngôn ngữ khác nhau, phiên dịch ra Tiếng Anh và lưu thành văn bản. Phần mềm có khả năng tự học và có thể được phát triển để nhận dạng con người qua giọng nói.

OpenAI đã đào tạo Whisper trên 680.000 giờ dữ liệu âm thanh và bảng dịch lại khớp với 98 ngôn ngữ được thu thập từ web. Theo OpenAI, phương pháp tiếp cận tập hợp mở này mang đến “sự tăng cường độ chính xác của các trọng âm, làm rõ tiếng ồn xung quanh và kỹ thuật ngôn ngữ.” Phần mềm cũng có khả năng phát hiện ngôn ngữ nói và dịch sang tiếng Anh.

Video đang HOT

OpenAI mô tả Whisper như một mô hình biến đổi mã hóa-giải mã, một loại mạng thần kinh có thể sử dụng ngữ cảnh thu thập được từ dữ liệu đầu vào, tìm hiểu các liên kết tình huống, sau đó có thể được dịch sang ngôn ngữ cần thiết ở đầu ra của mô hình. OpenAI trình bày tổng quan về phương thức hoạt động của Whisper:

Âm thanh đầu vào được chia thành các đoạn dài 30 giây, chuyển đổi thành biểu đồ quang phổ log-Mel và sau đó chuyển vào bộ mã hóa. Một bộ giải mã được đào tạo để dự đoán văn bản chú thích tương ứng, trộn lẫn với các mã thông báo đặc biệt, chỉ đạo mô hình duy nhất thực hiện các tác vụ như nhận dạng ngôn ngữ, khoảng thời gian của các cụm từ, phiên âm giọng nói đa ngôn ngữ và dịch giọng nói sang tiếng Anh.

Sử dụng mã nguồn mở Whisper, OpenAI hy vọng sẽ giới thiệu một mô hình nền tảng mới mà những chuyên gia công nghệ khác, có thể cùng xây dựng và phát triển trong tương lai để nâng cấp các công cụ hỗ trợ tiếp cận và xử lý giọng nói. OpenAI có một thành tích đáng kể trên lĩnh vực này. Tháng 1/2021, OpenAI phát hành CLIP , một mô hình thị giác máy tính mã nguồn mở, mở đầu cho kỷ nguyên công nghệ tổng hợp hình ảnh đang phát triển nhanh chóng gần đây như DALL-E 2 và Stable Diffusion .Tại Ars Technica, nhóm phóng viên đã thử nghiệm Whisper từ mã có sẵn trên GitHub, cung cấp cho mô hình nhiều mẫu, bao gồm một tệp podcast (tệp âm thanh) và một phần âm thanh đặc biệt khó hiểu, được lấy từ một cuộc phỏng vấn qua điện thoại. Mặc dù phải mất một khoảng thời gian khi chạy qua CPU máy tính để bàn tiêu chuẩn của Intel (công nghệ Whisper chưa hoạt động được trong thời gian thực) nhưng Whisper đã thực hiện tốt việc chuyển âm thanh thành văn bản thông qua chương trình Python trình diễn, tốt hơn nhiều so với một số ứng dụng AI hỗ trợ dịch vụ phiên âm mà Ars Technica đã thử dùng trước đây.

Mô hình AI của OpenAI tự động nhận dạng giọng nói và dịch sang tiếng Anh - Hình 2

Ví dụ bảng điều khiển đầu ra từ chương trình Whisper của OpenAI khi phiên âm một podcast. Ảnh Ars Technica

Với thiết lập phù hợp, Whisper có thể dễ dàng được sử dụng để phiên âm các cuộc phỏng vấn, podcast và có khả năng dịch các podcast được tạo từ các ngôn ngữ không phải tiếng Anh sang tiếng Anh trên máy tính miễn phí. Đây là sự kết hợp công nghệ mạnh mẽ mà sự phát triển có thể phá vỡ ngành công nghiệp phiên dịch.

Như với hầu hết các mô hình AI hiện nay, Whisper mang lại những lợi thế tích cực và khả năng bị lạm dụng. Trên thẻ mô hình của Whisper (trong phần “Hàm ý rộng hơn”), OpenAI cảnh báo rằng Whisper có thể bị sử dụng để tự động hóa việc giám sát theo điện thoại hoặc xác định từng người nói trong một cuộc trò chuyện, nhưng công ty hy vọng công nghệ sẽ được sử dụng “chủ yếu cho các mục đích có ích cho nhân loại”.

SK Telecom giới thiệu trợ lý ảo đầu tiên làm mô hình minh họa sản phẩm viễn thông

Ngày 26/9, Tập đoàn viễn thông SK Telecom của Hàn Quốc đã giới thiệu mô hình trợ lý ảo mang tên Sua nhằm thúc đẩy nền tảng hỗ trợ dựa trên trí tuệ nhân tạo (AI) do tập đoàn này phát triển.

SK Telecom giới thiệu trợ lý ảo đầu tiên làm mô hình minh họa sản phẩm viễn thông - Hình 1

SK Telecom giới thiệu trợ lý ảo Sua do công ty phát triển đồ họa 3D Onmind Inc tạo nên. Ảnh: sktelecom.com

Theo SK Telecom, nữ trợ lý ảo có tên là Sua này do công ty phát triển đồ họa 3D Onmind Inc tạo nên và sẽ được ra mắt lần đầu tiên dưới dạng mô hình trong quảng cáo cho nền tảng hỗ trợ AI của công ty.

Như vậy, Sua sẽ là trợ lý ảo đầu tiên được sử dụng làm mô hình minh họa sản phẩm trong ngành viễn thông của Hàn Quốc. Dự kiến, Sua sẽ xuất hiện cùng ca sĩ Jang Won-young trong chiến dịch quảng cáo mới nhất của SK Telecom.

Theo tập đoàn này, hình ảnh khuôn mặt của Sua được chuyển đổi bằng đồ họa từ hình ảnh của một nữ diễn viên thực đã thể hiện vai diễn trong buổi quay quảng cáo. Trong khi đó, giọng nói của Sua được tạo ra bằng công nghệ tổng hợp giọng nói dựa trên AI của SK Telecom.

Sua là sản phẩm mới nhất trong các dự án phát triển người ảo gần đây được giới thiệu ở Hàn Quốc, chủ yếu là của các công ty trò chơi. Trong đó, đáng chú ý nhất là Rozy - một người mẫu ảo do công ty công nghệ video Sidus Studio X tạo ra. Rozy đã thu hút sự quan tâm của cộng đồng khi đóng vai chính trong một số quảng cáo sản phẩm nổi tiếng.

SK Telecom cho biết tập đoàn này sẽ tiếp tục ứng dụng nhiều công nghệ đa dạng (như AI) vào các chương trình dịch vụ và quảng cáo.

https://viettimes.vn/mo-hinh-ai-cua-openai-tu-dong-nhan-dang-giong-noi-va-dich-sang-tieng-anh-post160705.html
Bạn thấy bài viết này có hữu ích không?
Không

Tin liên quan

Tiêu điểm

Apple chở 600 tấn iPhone sang Mỹ để tránh thuếApple chở 600 tấn iPhone sang Mỹ để tránh thuế
6 giờ trước
Apple như con thuyền bị lật giữa đại dương mà không có phao cứu sinhApple như con thuyền bị lật giữa đại dương mà không có phao cứu sinh
3 giờ trước
Siêu phẩm này sẽ khiến iPhone 18 và Galaxy S26 khiếp sợSiêu phẩm này sẽ khiến iPhone 18 và Galaxy S26 khiếp sợ
3 giờ trước
Công nghệ sạch thay thế chất làm mát độc hạiCông nghệ sạch thay thế chất làm mát độc hại
hôm qua
CEO Apple đang tập trung vào 1 sản phẩm 'hot' hơn iPhoneCEO Apple đang tập trung vào 1 sản phẩm 'hot' hơn iPhone
10 giờ trước
ChatGPT lập kỷ lục mới nhờ hiệu ứng Studio GhibliChatGPT lập kỷ lục mới nhờ hiệu ứng Studio Ghibli
9 giờ trước
'Chìa khoá' để Apple không tăng giá iPhone 17 Pro'Chìa khoá' để Apple không tăng giá iPhone 17 Pro
9 giờ trước
Jack Ma muốn AI phục vụ, không phải 'chúa tể' con ngườiJack Ma muốn AI phục vụ, không phải 'chúa tể' con người
6 giờ trước

Tin đang nóng

MC Quyền Linh lên tiếng thông tin quảng cáo sữa giảMC Quyền Linh lên tiếng thông tin quảng cáo sữa giả
4 giờ trước
Lộ diện 2 giám đốc 'bù nhìn' trong vụ sữa bột giả thu lợi 500 tỷ đồngLộ diện 2 giám đốc 'bù nhìn' trong vụ sữa bột giả thu lợi 500 tỷ đồng
3 giờ trước
Màn "du hành vũ trụ" hơn 10 phút của Katy Perry: Lady Gaga và dàn sao Hollywood "đăng đàn" mỉa mai khắp MXHMàn "du hành vũ trụ" hơn 10 phút của Katy Perry: Lady Gaga và dàn sao Hollywood "đăng đàn" mỉa mai khắp MXH
1 giờ trước
Sao nam Vbiz bị "Dispatch" Trường Giang khui chuyện huỷ hôn đã có bạn gái mới?Sao nam Vbiz bị "Dispatch" Trường Giang khui chuyện huỷ hôn đã có bạn gái mới?
2 giờ trước
Nhóm người đánh nhau trên đèo Hải Vân, hô 'có chủ tịch, khỏi lo'Nhóm người đánh nhau trên đèo Hải Vân, hô 'có chủ tịch, khỏi lo'
3 giờ trước
Cặp vợ chồng giàu nức tiếng Vbiz đi du hí Nhật Bản: Mang hẳn 10 vali hành lý, có ê-kíp hộ tống chụp hìnhCặp vợ chồng giàu nức tiếng Vbiz đi du hí Nhật Bản: Mang hẳn 10 vali hành lý, có ê-kíp hộ tống chụp hình
4 giờ trước
Chu Thanh Huyền mở tiệc sang chảnh cho Quang Hải, khoá môi cực ngọt còn khoe được chồng lái xế hộp đưa đi làmChu Thanh Huyền mở tiệc sang chảnh cho Quang Hải, khoá môi cực ngọt còn khoe được chồng lái xế hộp đưa đi làm
5 giờ trước
Song Hye Kyo bị 1 nữ diễn viên làm bỏng daSong Hye Kyo bị 1 nữ diễn viên làm bỏng da
4 giờ trước

Tin mới nhất

12 tháng, Apple lắp ráp 22 tỷ USD iPhone tại Ấn Độ

12 tháng, Apple lắp ráp 22 tỷ USD iPhone tại Ấn Độ

9 giờ trước
Như vậy, Ấn Độ đang sản xuất 20% iPhone cho Apple. Theo nguồn tin, con số 22 tỷ USD dựa trên định giá tại cổng nhà máy (FGP), không phải giá bán lẻ.
Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

1 năm trước
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn
Cách đăng Facebook để có nhiều lượt thích và chia sẻ

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

2 năm trước
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết
Thêm nhiều bang của Mỹ cấm TikTok

Thêm nhiều bang của Mỹ cấm TikTok

2 năm trước
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung
Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

2 năm trước
Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...
Facebook trấn áp hàng loạt công ty phần mềm gián điệp

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

2 năm trước
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia
Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

2 năm trước
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...
Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

2 năm trước
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter
Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

2 năm trước
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm
Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

2 năm trước
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR
'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

2 năm trước
Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn
Xiaomi sa thải hàng nghìn nhân sự

Xiaomi sa thải hàng nghìn nhân sự

2 năm trước
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn

Có thể bạn quan tâm

Người vợ tử vong sau trận đòn từ chồng

Người vợ tử vong sau trận đòn từ chồng

Pháp luật

4 phút trước
Bà Đ.T.D. (Gia Lai) bị phát hiện đã tử vong bất thường với vết thương dài trên trán sau trận đòn từ người chồng.
Thi thể trẻ sơ sinh bị cuốn chặt trong áo mưa đặt trước cổng chùa

Thi thể trẻ sơ sinh bị cuốn chặt trong áo mưa đặt trước cổng chùa

Tin nổi bật

8 phút trước
Chiều nay (15/4), Lãnh đạo UBND phường Nam Sơn, Quận An Dương, TP Hải Phòng xác nhận với VietNamNet, tại địa bàn vừa phát hiện thi thể trẻ sơ sinh bị bỏ lại ở cổng chùa Quán Âm.
Bậc thầy phong thủy dự báo 10 ngày tới, 4 con giáp sẽ phất lên như diều gặp gió, tài lộc thăng hoa rực rỡ

Bậc thầy phong thủy dự báo 10 ngày tới, 4 con giáp sẽ phất lên như diều gặp gió, tài lộc thăng hoa rực rỡ

Trắc nghiệm

10 phút trước
Những ngày tới, 4 con giáp này sẽ gặp nhiều may mắn trong công việc và đời sống.Tích đức càng nhiều, phúc khí càng vượng: 4 con giáp bước qua tuổi 30 là có quý nhân theo chân, không bao giờ đơn độc
Jennie ở Coachella 2025: Nỗ lực cho 1 tham vọng "nửa vời"

Jennie ở Coachella 2025: Nỗ lực cho 1 tham vọng "nửa vời"

Nhạc quốc tế

45 phút trước
Sân khấu Coachella của Jennie không hẳn là tệ, nhưng cũng chưa đủ WOW để nâng tầm vị thế cho cô nàng sau 1 album quá đỗi thành công từ thương mại cho đến chất lượng nghệ thuật.
9 siêu sao bóng đá giàu từ trong trứng: Pirlo, Van Persie và hơn thế nữa

9 siêu sao bóng đá giàu từ trong trứng: Pirlo, Van Persie và hơn thế nữa

Sao thể thao

49 phút trước
9 siêu sao bóng đá giàu từ trong trứng trước khi nổi tiếng trong làng túc cầu, bao gồm một người sống trong lâu đài 60 phòng.
Bạn gái 8 năm của HURRYKNG chính thức lên tiếng giữa tin trục trặc

Bạn gái 8 năm của HURRYKNG chính thức lên tiếng giữa tin trục trặc

Sao việt

55 phút trước
Kem - bạn gái của HURRYKNG chia sẻ hình ảnh mới bên nửa kia trên trang cá nhân như 1 câu trả lời cho các nghi vấn thời gian qua
"Búp bê gầy đáng sợ" của showbiz vào viện cấp cứu lúc nửa đêm

"Búp bê gầy đáng sợ" của showbiz vào viện cấp cứu lúc nửa đêm

Sao châu á

1 giờ trước
Ngày 15/4, tờ 163 đưa tin 1 tài khoản MXH đăng tải hình ảnh bắt gặp Trương Dư Hi được mẹ đưa đi bệnh viện cấp cứu vào lúc nửa đêm.
Park Bo Gum, IU bị sử dụng trái phép hình ảnh ở Trung Quốc

Park Bo Gum, IU bị sử dụng trái phép hình ảnh ở Trung Quốc

Hậu trường phim

1 giờ trước
Một siêu thị Trung Quốc sử dụng trái phép hình ảnh của Park Bo Gum và IU từ bộ phim truyền hình When Life Gives You Tangerines của Netflix để quảng cáo sản phẩm
Vì sao tín đồ kinh dị giật gân không nên bỏ lỡ 'Buổi hẹn hò kinh hoàng'?

Vì sao tín đồ kinh dị giật gân không nên bỏ lỡ 'Buổi hẹn hò kinh hoàng'?

Phim âu mỹ

1 giờ trước
Không chỉ là một bộ phim kinh dị ly kỳ, tác phẩm còn là hồi chuông báo động về cái giá của sự riêng tư thời đại số - nơi ranh giới giữa an toàn và nguy hiểm mong manh đến bất ngờ.
Tranh cãi quanh vụ người đàn ông bị Mỹ trục xuất nhầm sang El Salvador

Tranh cãi quanh vụ người đàn ông bị Mỹ trục xuất nhầm sang El Salvador

Thế giới

1 giờ trước
Tuyên bố này từ ông Evan Katz, quan chức thuộc bộ phận Thực thi và Trục xuất của ICE, đồng nghĩa nếu Abrego Garcia quay lại Mỹ, chính phủ sẽ nhanh chóng trục xuất ông.
Mẹ biển - Tập 22: Đại trở về, cố tình tránh mặt kẻ thù

Mẹ biển - Tập 22: Đại trở về, cố tình tránh mặt kẻ thù

Phim việt

1 giờ trước
Trong trích đoạn giới thiệu Mẹ biển tập 22, Đại - người được cho là mất tích sau trận bão 20 năm trước - bất ngờ tái xuất. Việc đầu tiên Đại làm khi trở về quê là ra chợ mua quà cho vợ.