AI “Rosetta” của Facebook có thể trích xuất văn bản từ 1 tỷ hình ảnh mỗi ngày

Theo dõi VGT trên

Tính năng biên dịch tự động của mạng xã hội lớn nhất hành tinh này hiện còn có thể hoạt động với 24 ngôn ngữ mới.

Mọi người khi online không chỉ giao tiếp với nhau thông qua ngôn từ mà còn qua hình ảnh. Đối với một nền tảng như Facebook với hơn 2 tỷ người hoạt động mỗi tháng, điều đó có nghĩa là có vô số các hình ảnh được đăng tải mỗi ngày, bao gồm cả các meme. Nhằm đưa các hình ảnh đi kèm với văn bản vào các kết quả tìm kiếm hình ảnh tương ứng, để các chương trình đọc màn hình có thể hiểu được nội dung được viết trên các hình ảnh và đảm bảo chúng không chứa các nội dung xấu, các từ ngữ vi phạm chính sách nội dung của website, Facebook đã tạo và triển khai một hệ thống machine learning quy mô rộng gọi là “Rosetta”.

Facebook cần một hệ thống nhận diện ký tự quang học có thể thường xuyên xử lý một lượng lớn nội dung, do đó họ phải “cầu cứu” đến công nghệ của riêng mình. Theo mạng xã hội này, Rosetta có thể trích xuất văn bản từ hơn 1 tỷ hình ảnh và khung hình video có bao gồm rất nhiều loại ngôn ngữ khác nhau mỗi ngày trong thời gian thực!

Trong một bài đăng blog mới, công ty đã giải thích cách thức hoạt động của Rosetta như sau: nó bắt đầu bằng cách phát hiện các vùng hình chữ nhật trong các hình ảnh có khả năng chứa văn bản. Sau đó, nó sử dụng một mạng thần kinh xoắn ốc để nhận diện và biên dịch nội dung được viết trong vùng đó, kể cả các từ không phải Tiếng Anh hay các ký tự không phải Tiếng Latin, như Ả-rập và Hindi. Để huấn luyện hệ thống này, Facebook đã sử dụng một tập hợp các hình ảnh công khai được ghi chú bởi cả con người lẫn máy tính.

AI Rosetta của Facebook có thể trích xuất văn bản từ 1 tỷ hình ảnh mỗi ngày - Hình 1

AI của Facebook tìm kiếm các vùng hình chữ nhật có khả năng chứa văn bản trong một hình ảnh

Các nhóm khác nhau trong nội bộ Facebook và Instagram đã và đang sử dụng Rosetta để kiểm duyệt các nội dung và giữ cho các nền tảng mạng xã hội của họ luôn trong tình trạng “sạch sẽ”. Công ty có dự định tiếp tục “dạy” cho AI của mình biết thêm nhiều ngôn ngữ nữa, đồng thời cải thiện kỹ năng trích xuất văn bản từ các khung hình video của nó.

Hiện Facebook đã thêm vào dịch vụ biên dịch tự động của mình 24 ngôn ngữ mới, bao gồm tiếng Serbia, Belarus, Marathi, Sinhal, Telugu, Nepal, Kannada, Urdu, Punjabi, Cambodia, Pashto, Mongolia, Zulu, Xhosa và Somali. Facebook thừa nhận rằng khả năng biên dịch các ngôn ngữ mới thêm vào này vẫn còn ở giai đoạn sơ khai, do đó sẽ có khá nhiều lỗi biên dịch. Hãng dự định tiếp tục cải tiến chúng và giới thiệu thêm nhiều ngôn ngữ nữa trong tương lai.

Theo Genk

Bạn thấy bài viết này có hữu ích không?
Có;
Không

Tin đang nóng

Tôn Bằng đ.ập cửa xông vào nhà riêng của Hằng Du Mục, xé giấy tờ gây bức xúc hậu l.y h.ôn
12:42:41 22/09/2024
Từ thiện Làng Nủ: Hoàng Hường bị Phạm Thoại lên lớp dạy đời, nhắc nhở 1 điều
13:18:36 22/09/2024
25 hộ Làng Nủ: dời về nhà tạm cư của Vingroup, vật chất bên trong gây ngỡ ngàng
14:19:31 22/09/2024
Phương Anh: Em trai chuyển giới "bốc lửa" của Ngân 98, bị tình cũ "phốt" ở bẩn
14:01:41 22/09/2024
Hôn lễ hot nhất hôm nay: Nữ diễn viên hạng A và thiếu gia kém 9 t.uổi tung ảnh cưới đẹp tựa poster phim trước giờ G
12:52:57 22/09/2024
Á hậu HongKong 'đam mê' làm bé 3, "con gái" Lương Triều Vỹ, bị tẩy chay?
14:36:16 22/09/2024
Mỗi tháng chị gái đều cho tôi 2 triệu, đến khi anh rể đem áo ngực của chị đặt lên bàn, tôi nghẹn đắng mất ngủ cả đêm
15:41:28 22/09/2024
Kỳ Duyên đăng quang HH Du Lịch VN toàn cầu, bị phốt mua giải, lộ ảnh nhạy cảm
13:05:00 22/09/2024

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung

Microsoft cấm khai thác t.iền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022
Microsoft đã cập nhật thỏa thuận cấm khai thác t.iền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác t.iền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản t.iền phạt lên tới ...

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022
Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Nếu đã từ bỏ Twitter, đây là những nền tảng mới thay thế

09:33:06 21/12/2022
Nếu đã từ bỏ Twtter để đọc tin tức, hãy tìm đến những nền tảng mới dưới đây. Twitter luôn được biết đến là nền tảng cung cấp tin tức tuyệt vời cho người dùng. Nhưng với các xáo trộn gần đây, mạng xã hội này đang khiến nhiều người nghĩ đ...

Có thể bạn quan tâm

Bầu cử Mỹ 2024: Ông Trump từ chối tham gia cuộc tranh luận thứ hai với bà Harris

Thế giới

18:10:44 22/09/2024
Ông Trump đã tham gia 2 cuộc tranh luận trực tiếp, lần đầu với Tổng thống Mỹ Joe Biden hồi cuối tháng 6 và sau đó là với Phó Tổng thống Harris vào tối 10/9.

Phim của Tuấn Trần có thể lọt top 3 phim ăn khách năm 2024

Hậu trường phim

18:09:09 22/09/2024
Theo số liệu tham khảo của trang Box Office Vietnam, tính đến ngày 21/9, doanh thu của phim Làm giàu với ma là 122 tỷ đồng, bám sát con số 127 tỷ đồng của phim Ma Da.

Thu nhập 20 triệu vẫn không mua nổi 1 chỉ vàng mỗi tháng, biết lý do xong không một ai dám trách

Netizen

17:59:04 22/09/2024
20 triệu hoàn toàn không phải mức ngân sách quá thấp với những người đang sống một mình, chẳng phải lo cho ai ngoài chính bản thân.

Hoả hoạn tại chùa Vạn Phật, Công an tỉnh Gia Lai cùng người dân nỗ lực dập lửa

Tin nổi bật

17:57:36 22/09/2024
40 CBCS thuộc Phòng Cảnh sát PCCC&CNCH (Công an tỉnh Gia Lai) cùng với sự hỗ trợ người dân nỗ lực không chế vụ hoả hoạn tại chùa Vạn Phật.

Từ vụ án Xuyên Việt Oil: Sơ hở trong quản lý Quỹ bình ổn giá xăng dầu cần sớm khắc phục

Pháp luật

17:54:27 22/09/2024
Theo quy định của pháp luật trong lĩnh vực kinh doanh xăng dầu, thuế bảo vệ môi trường là loại thuế gián thu, thu vào sản phẩm, hàng hóa là xăng, dầu.

Haaland ưu tiên đến Barca nếu Man City có 'biến'

Sao thể thao

17:49:00 22/09/2024
Haaland được cho ưu tiên đến Barca, không màng Real Madrid, trường hợp quyết định rời Man City, đội đang đứng trước 115 cáo buộc vi phạm tài chính.

Tuyệt chiêu làm sushi cuộn dưa chuột ngon, giòn ngọt cho bữa ăn cuối tuần thêm hấp dẫn

Ẩm thực

17:30:51 22/09/2024
Món sushi cuộn dưa chuột không chỉ dễ làm mà còn rất tươi ngon và bổ dưỡng, thích hợp cho cả những bữa tiệc nhỏ hay đơn giản là một bữa ăn nhẹ tại nhà.

3 thứ trong nhà càng nhiều càng nghèo khổ: Đó là gì?

Trắc nghiệm

16:32:35 22/09/2024
Trong phong thủy những đồ vật dưới đây càng giữ lại nhiều trong nhà càng hao tài kém lộc nên tránh.Vì sao nên gõ 3 lần trước khi mở cửa nếu bạn đi vắng nhiều ngày mới về?

Lưu Đức Hoa sắp ra mắt phim về thảm hoạ phóng xạ

Phim châu á

16:04:33 22/09/2024
Bộ phim Thiêu rụi thành phố với sự tham gia của các diễn viên Lưu Đức Hoa, Mạc Văn Úy, Bạch Vũ, Vương Đan Ni... đang nhận được sự quan tâm của công chúng sau khi công bố trailer.

Em gái đi làm ăn xa, 10 năm sau trở về với chiếc ô tô Mercedes, phát cho mỗi người cọc t.iền trị giá 200 triệu

Góc tâm tình

15:44:06 22/09/2024
Sau 10 năm, cả nhà tôi đều ngỡ ngàng khi thấy em gái bước xuống từ chiếc xe Mercedes sang trọng. 10 năm trước, em gái tôi quyết tâm đi xa để làm ăn.

Tỏa sáng với áo khoác dáng dài, chinh phục mọi phong cách trong tiết trời thu

Thời trang

15:36:21 22/09/2024
Với khả năng kết hợp đa dạng, từ trang phục công sở đến dạo phố, áo khoác dáng dài thực sự là một lựa chọn hoàn hảo để bạn tỏa sáng trong mọi khoảnh khắc.