Gemini Omni: AI hiểu thế giới đa phương thức của Google

Khi Google giới thiệu Gemini Omni tại Google I/O 2026, điều khiến giới công nghệ chú ý không chỉ là một mô hình AI tạo video mới.

Thứ thực sự gây tranh luận là tham vọng lớn hơn phía sau dự án này: Xây dựng một hệ AI có khả năng “hiểu thế giới” thay vì chỉ xử lý ngôn ngữ.

Trong nhiều năm, AI hiện đại phát triển dựa trên các mô hình ngôn ngữ lớn. Chúng có thể viết văn bản, trả lời câu hỏi, lập trình hay dịch thuật với tốc độ và độ chính xác ngày càng cao. Tuy nhiên, phần lớn những hệ thống này vẫn hoạt động theo nguyên lý dự đoán xác suất: phân tích lượng dữ liệu khổng lồ để tạo ra phản hồi hợp lý tiếp theo.

Gemini Omni: AI hiểu thế giới đa phương thức của Google - Hình 1

Bài đăng của Google trên X.

Gemini Omni cho thấy Google đang muốn vượt khỏi giới hạn AI đã chạm tới

Theo các tài liệu công bố từ Google DeepMind, Gemini Omni được xây dựng như một mô hình “omni-modal”, có thể xử lý đồng thời văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống.

Nhưng điểm đáng chú ý hơn nằm ở cách Google mô tả công nghệ này. Thay vì nhấn mạnh khả năng tạo nội dung, hãng liên tục nhắc đến những khái niệm như “simulation”, “physics” hay “multimodal reasoning” – có nghĩa là, AI không chỉ tạo ra hình ảnh đẹp hay video mượt, mà phải hiểu cách thế giới vận hành.

Điều đó nghe có vẻ trừu tượng, nhưng lại là khác biệt rất lớn.

Điểm đáng chú ý nhất của mô hình này chính là bước “nhảy vọt” khi khiến cho AI hiểu “thế giới vật lý”. Google nhấn mạnh rằng Gemini Omni không chỉ tạo video đẹp mà còn cố mô phỏng: trọng lực, chuyển động cơ thể, ánh sáng, tính liên tục giữa các cảnh.

Theo đó, chỉ cần người dùng đưa ảnh, đoạn ghi âm và mô tả văn bản bất kỳ, Omni có thể tạo thành một video hoàn chỉnh với chuyển động, ánh sáng và lời thoại phù hợp.

Gemini Omni: AI hiểu thế giới đa phương thức của Google - Hình 2

Gemini Omni có thể mô phỏng sinh động các chuyển động vật lý gần giống thế giới thực.

“World model” – cuộc đua mới của ngành AI

Một chatbot truyền thống có thể biết rằng khi trời mưa thì đường thường ướt, đơn giản vì nó đã học từ hàng triệu đoạn văn bản tương tự. Nhưng với “world model”, AI được kỳ vọng sẽ hiểu sâu hơn về mối quan hệ giữa các hiện tượng vật lý: ánh sáng thay đổi theo góc máy, vật thể chuyển động chịu tác động của trọng lực, hay một nhân vật phải giữ tính nhất quán giữa nhiều khung hình liên tiếp.

Đây cũng là lý do các mô hình video AI đang trở thành trung tâm của cuộc đua công nghệ mới. Video chứa đồng thời không gian, thời gian, chuyển động và logic nhân quả. Để tạo ra một đoạn video thuyết phục, AI không thể chỉ ghép những khung hình đẹp với nhau. Nó cần mô phỏng được hành vi của thế giới thực.

Theo TechCrunch, Google đang định vị Gemini Omni như một hệ thống có thể tạo nội dung từ bất kỳ dạng dữ liệu đầu vào nào. Tham vọng này khá tương đồng với hướng đi mà OpenAI từng mô tả cho Sora, nơi mô hình video được xem như “world simulator” – công cụ mô phỏng thế giới.

Gemini Omni có thể mô tả thực tại, edit video bằng hội thoại

Các demo đầu tiên của Gemini Omni cho thấy Google không chỉ muốn AI tạo video, mà còn muốn AI chỉnh sửa và duy trì logic của video thông qua hội thoại liên tục. Người dùng có thể yêu cầu thay đổi thời tiết, góc quay hay phong cách hình ảnh chỉ bằng ngôn ngữ tự nhiên, trong khi nhân vật và bối cảnh vẫn được giữ ổn định giữa các cảnh quay. Đây là điểm mà nhiều công cụ text-to-video trước đó vẫn gặp khó khăn.

Đằng sau các demo này là một thay đổi lớn hơn trong chiến lược AI của Google. Thay vì phát triển các sản phẩm rời rạc cho chatbot, hình ảnh hay video, công ty đang hợp nhất chúng thành một hệ thống thống nhất có thể nhìn, nghe, hiểu và tạo nội dung đa phương thức trong cùng một môi trường.

Nói cách khác, Google dường như không còn xem Gemini đơn thuần là chatbot, mà là nền tảng AI có khả năng tương tác với thế giới thực theo cách toàn diện hơn.

Dĩ nhiên, khoảng cách giữa tham vọng và thực tế vẫn còn rất lớn. Các bản thử nghiệm hiện tại vẫn xuất hiện lỗi chuyển động, inconsistency nhân vật hay các chi tiết vật lý chưa hoàn toàn tự nhiên. Google cũng chưa công bố đầy đủ benchmark kỹ thuật của Omni, khiến giới nghiên cứu khó đánh giá chính xác năng lực thật sự của mô hình này.

Dù Gemini Omni vẫn chưa thể “hiểu thế giới” như con người, công nghệ này cho thấy AI đang bước sang một giai đoạn mới. Mục tiêu giờ đây không chỉ là tạo ra các chatbot trả lời thông minh hơn, mà là xây dựng những hệ thống có thể hiểu môi trường xung quanh, nhận biết không gian và dự đoán điều gì sẽ xảy ra trong thế giới thực.

Nếu xu hướng này tiếp tục phát triển, AI tương lai có thể không chỉ dừng ở việc trò chuyện, mà còn có khả năng quan sát, suy luận và tương tác với cuộc sống thực theo cách ngày càng giống trí tuệ con người hơn.

Bạn thấy bài viết này có hữu ích không?
Không

Tin liên quan

Tiêu điểm

Xiaomi HyperOS 4 Launcher rò rỉ: Thiết kế Liquid Glass và đột phá với ngôn ngữ RustXiaomi HyperOS 4 Launcher rò rỉ: Thiết kế Liquid Glass và đột phá với ngôn ngữ Rust
08:55:58 20/05/2026
Tranh cãi về quy định cấm robot hình người lên máy bayTranh cãi về quy định cấm robot hình người lên máy bay
09:14:53 20/05/2026
'Gây sốt' video robot hình người nâng và di chuyển một chiếc tủ lạnh nặng 23kg'Gây sốt' video robot hình người nâng và di chuyển một chiếc tủ lạnh nặng 23kg
09:18:31 20/05/2026
Gemini 4, tác tử AI và những điều đáng mong chờ ở Google I/O 2026Gemini 4, tác tử AI và những điều đáng mong chờ ở Google I/O 2026
09:21:37 20/05/2026
Apple có thể trở lại với titan sau các vấn đề trên iPhone 17 ProApple có thể trở lại với titan sau các vấn đề trên iPhone 17 Pro
12:12:59 21/05/2026
YouTube thêm tính năng AI mới giúp tìm video nhanh hơnYouTube thêm tính năng AI mới giúp tìm video nhanh hơn
12:15:54 21/05/2026
Google muốn Gemini có thể thay đổi cách nhân loại làm khoa họcGoogle muốn Gemini có thể thay đổi cách nhân loại làm khoa học
12:18:59 21/05/2026

Tin đang nóng

Rapper Pháo thi Hoa hậuRapper Pháo thi Hoa hậu
12:35:27 21/05/2026
Cả khán phòng lặng đi khi Thạc sĩ người Việt hát "Ước mơ của mẹ" trong lễ tốt nghiệp tại MỹCả khán phòng lặng đi khi Thạc sĩ người Việt hát "Ước mơ của mẹ" trong lễ tốt nghiệp tại Mỹ
10:57:08 21/05/2026
4,3 triệu lượt xem video nam sinh lao tới đẩy xe ve chai giúp bà cụ giữa dốc cầu: "Nuôi con như vậy mới đáng!"4,3 triệu lượt xem video nam sinh lao tới đẩy xe ve chai giúp bà cụ giữa dốc cầu: "Nuôi con như vậy mới đáng!"
14:48:49 21/05/2026
"Nữ hoàng dao kéo" Lee Da Hae vỡ òa mang thai con đầu lòng cho ông xã tai tiếng Se7en sau 3 năm cưới"Nữ hoàng dao kéo" Lee Da Hae vỡ òa mang thai con đầu lòng cho ông xã tai tiếng Se7en sau 3 năm cưới
11:12:38 21/05/2026
Nóng nhất vụ Kim Soo Hyun bị tố hẹn hò trẻ vị thành niên: Công tố viên phát hiện kẻ ngụy tạo bằng chứng, xin lệnh bắt khẩn cấpNóng nhất vụ Kim Soo Hyun bị tố hẹn hò trẻ vị thành niên: Công tố viên phát hiện kẻ ngụy tạo bằng chứng, xin lệnh bắt khẩn cấp
11:16:31 21/05/2026
Rúng động xứ Trung vụ 2 nam ca sĩ bị bắt vì ma túy: Chủ động khai báo 120 bạn nghiện là nghệ sĩ, 2 người đẹp showbiz liên quanRúng động xứ Trung vụ 2 nam ca sĩ bị bắt vì ma túy: Chủ động khai báo 120 bạn nghiện là nghệ sĩ, 2 người đẹp showbiz liên quan
11:10:07 21/05/2026
Không phải nghỉ dưỡng sang chảnh, đây mới là kiểu du lịch đang khiến giới trẻ mê mẩn mùa hè 2026Không phải nghỉ dưỡng sang chảnh, đây mới là kiểu du lịch đang khiến giới trẻ mê mẩn mùa hè 2026
10:41:41 21/05/2026
Trúng số độc đắc sau 16h30 chiều nay (21/5/2026), Thần Tài trao tiền tỷ, 3 con giáp tay trái chạm vàng, tay phải vét bạc thiên hạ, vạn sự hanh thông ngoài mong đợiTrúng số độc đắc sau 16h30 chiều nay (21/5/2026), Thần Tài trao tiền tỷ, 3 con giáp tay trái chạm vàng, tay phải vét bạc thiên hạ, vạn sự hanh thông ngoài mong đợi
10:13:14 21/05/2026

Tin mới nhất

Chip Exynos 2800 rò rỉ công nghệ HBM: Bước tiến đột phá cho trí tuệ nhân tạo trên di động

Chip Exynos 2800 rò rỉ công nghệ HBM: Bước tiến đột phá cho trí tuệ nhân tạo trên di động

12:01:27 19/05/2026
Samsung được cho là đang tích hợp bộ nhớ băng thông cao HBM vào chip Exynos 2800 thông qua công nghệ đóng gói mới, hứa hẹn thay đổi hoàn toàn hiệu suất xử lý AI.
Kỹ sư Google nghỉ việc sau gần 20 năm vì lạc lõng trước AI

Kỹ sư Google nghỉ việc sau gần 20 năm vì lạc lõng trước AI

12:00:31 19/05/2026
Sau gần 20 năm làm việc tại Google, một kỹ sư 55 tuổi quyết định nghỉ việc vì cảm thấy khó theo kịp làn sóng AI đang thay đổi cách lập trình.
Xiaomi chi 9 tỷ USD đưa chip AI lên điều hòa và robot hút bụi

Xiaomi chi 9 tỷ USD đưa chip AI lên điều hòa và robot hút bụi

11:48:47 19/05/2026
Để giải quyết vấn đề này, Xiaomi đã tiên phong đưa AI vào các thiết bị gia dụng, với sản phẩm đầu tiên là điều hòa Mijia Air Conditioner Strong Wind Pro.
Apple sẽ nâng cấp Genmoji trong iOS 27

Apple sẽ nâng cấp Genmoji trong iOS 27

11:42:16 19/05/2026
Nếu được triển khai tốt, đây có thể là một tính năng khá thú vị, đặc biệt trong trường hợp hệ thống có thể hiểu ngữ cảnh để tạo ra các Genmoji phù hợp thay vì chỉ đưa ra gợi ý ngẫu nhiên.
Meta cắt giảm nhân sự quy mô lớn nhằm tái cấu trúc bộ máy theo định hướng AI

Meta cắt giảm nhân sự quy mô lớn nhằm tái cấu trúc bộ máy theo định hướng AI

10:37:29 19/05/2026
Gã khổng lồ sở hữu mạng xã hội Facebook dự kiến sẽ sa thải 10% lực lượng lao động vào 20/5, đồng thời chuẩn bị cho các đợt cắt giảm mạnh tay khác vào cuối năm nay.
OpenAI đưa tính năng truy cập từ xa Codex lên ChatGPT

OpenAI đưa tính năng truy cập từ xa Codex lên ChatGPT

14:20:04 18/05/2026
OpenAI đưa trợ lý lập trình Codex lên ứng dụng ChatGPT di động, cho phép người dùng iPhone và Android truy cập từ xa các phiên làm việc trên máy Mac.
AI, dữ liệu lớn, năng lượng sạch vào nhóm công nghệ được ưu tiên hàng đầu

AI, dữ liệu lớn, năng lượng sạch vào nhóm công nghệ được ưu tiên hàng đầu

14:16:48 18/05/2026
Chính phủ ban hành danh mục 70 công nghệ cao ưu tiên đầu tư phát triển, trong đó có nhiều công nghệ mới như lượng tử, mô phỏng cơ thể người, lưu trữ carbon, vật liệu tiên tiến.
Robot hình người làm việc liên tục 8 giờ

Robot hình người làm việc liên tục 8 giờ

14:09:09 18/05/2026
Trong sự kiện phát sóng trực tiếp mới đây trên mạng xã hội, người xem đã có cơ hội chứng kiến màn trình diễn ấn tượng của hệ thống robot thông minh mang tên Helix 02.
Apple giấu một tính năng hữu ích ngay trên màn hình khóa iPhone

Apple giấu một tính năng hữu ích ngay trên màn hình khóa iPhone

11:48:16 18/05/2026
Trung tâm điều khiển trên iPhone là một tính năng hữu ích mà nhiều người dùng có thể đang bỏ lỡ nếu như không khai thác hết.
Những thói quen tưởng vô hại nhưng âm thầm làm chai pin smartphone

Những thói quen tưởng vô hại nhưng âm thầm làm chai pin smartphone

09:40:40 18/05/2026
Hầu hết smartphone hiện nay đều sử dụng pin lithium-ion (Li-ion), một công nghệ phổ biến nhưng vẫn còn nhiều hiểu lầm.
Những quan niệm về pin điện thoại đã lỗi thời

Những quan niệm về pin điện thoại đã lỗi thời

10:10:38 17/05/2026
Nhiều thói quen dùng điện thoại tưởng đúng lại có thể khiến pin lithium-ion nhanh xuống cấp hơn theo thời gian sử dụng hằng ngày.
3 tinh chỉnh Windows 11 cần làm sau khi 'đập hộp' laptop

3 tinh chỉnh Windows 11 cần làm sau khi 'đập hộp' laptop

10:08:20 17/05/2026
Ngay cả khi sở hữu chip xử lý đời mới nhất cùng bộ nhớ RAM lớn, chiếc laptop của bạn vẫn có thể chịu cảnh trì trệ nếu không được dọn dẹp các thiết lập mặc định ngốn tài nguyên của hệ điều hành Windows 11.

Có thể bạn quan tâm

Vụ núi đá bất ngờ sạt lở: Đã tìm thấy thi thể hai người đàn ông bị vùi lấp

Vụ núi đá bất ngờ sạt lở: Đã tìm thấy thi thể hai người đàn ông bị vùi lấp

Tin nổi bật

15:33:02 21/05/2026
Sau nhiều giờ nỗ lực tìm kiếm, lực lượng chức năng tỉnh Thanh Hóa đã tìm thấy thi thể hai nạn nhân bị vùi lấp trong vụ sạt lở mỏ đá.
Tai nghe kẹp tai mới của Xiaomi tương thích mạng Find My của Apple

Tai nghe kẹp tai mới của Xiaomi tương thích mạng Find My của Apple

Đồ 2-tek

15:23:12 21/05/2026
Mẫu tai nghe open-ear đầu tiên của Xiaomi hỗ trợ mạng Find My của Apple, sở hữu thiết kế siêu nhẹ 5.5g cùng công nghệ chống rò rỉ âm thanh tiên tiến.
Lời khai lạnh người của kẻ dùng dao đâm chết 'vợ hờ', giả tự tử

Lời khai lạnh người của kẻ dùng dao đâm chết 'vợ hờ', giả tự tử

Pháp luật

15:22:35 21/05/2026
Vũ Trọng Tuấn khai, thấy chị M. nhắn tin với người lạ, Tuấn nổi ghen giật điện thoại dẫn đến xô xát, sau đó dùng dao đâm nạn nhân tử vong rồi khóa cửa bỏ trốn.
Điều gì đang khiến những "đảo hội" trở thành "thỏi nam châm" hút khách du lịch?

Điều gì đang khiến những "đảo hội" trở thành "thỏi nam châm" hút khách du lịch?

Du lịch

15:19:43 21/05/2026
Từ các siêu show triệu đô, công viên chủ đề đến những cuộc vui kéo dài tới tận đêm khuya, những đảo hội quy mô lớn đang tạo nên sức hút mới cho du lịch hiện đại.
Chủ nhân hit quốc dân Khúc Hát Mừng Sinh Nhật thông báo nóng: Toàn bộ doanh thu tiền tỷ bị tạm giữ, bản quyền nhập nhằng

Chủ nhân hit quốc dân Khúc Hát Mừng Sinh Nhật thông báo nóng: Toàn bộ doanh thu tiền tỷ bị tạm giữ, bản quyền nhập nhằng

Nhạc việt

15:05:44 21/05/2026
Mới đây, nam ca sĩ Phan Đinh Tùng đã đăng tải một thông báo chính thức trên trang cá nhân, thu hút sự chú ý lớn từ dư luận.
Trần Bích Hạnh - vợ Văn Thanh lộ trạng thái bất ổn sau đám cưới

Trần Bích Hạnh - vợ Văn Thanh lộ trạng thái bất ổn sau đám cưới

Sao thể thao

15:05:37 21/05/2026
Mới đây, trên trang cá nhân, Trần Bích Hạnh - vợ vừa cưới của Văn Thanh đã bất ngờ cập nhật dòng trạng thái đầy mệt mỏi: Nhiều khi bị buồn xong suy nghĩ cái mất ngủ luôn, Bích Hạnh chia sẻ.
Nữ NSƯT mang bầu 6 tháng vẫn có trai tán, kết hôn 24 năm cả nước không biết mặt chồng

Nữ NSƯT mang bầu 6 tháng vẫn có trai tán, kết hôn 24 năm cả nước không biết mặt chồng

Hậu trường phim

15:00:33 21/05/2026
Hạnh Thúy nổi tiếng là nghệ sĩ cực kỳ kín tiếng. Cô kết hôn được 24 năm và có hai con gái. Dù hoạt động nghệ thuật lâu năm, nữ nghệ sĩ hiếm khi chia sẻ hình ảnh gia đình trên truyền thông hay mạng xã hội.
Toàn bộ mâu thuẫn khiến cô dâu cởi váy cưới, chú rể huỷ hôn trước mặt khách mời

Toàn bộ mâu thuẫn khiến cô dâu cởi váy cưới, chú rể huỷ hôn trước mặt khách mời

Netizen

14:55:14 21/05/2026
Một đám cưới ở Giang Tây (Trung Quốc) những ngày gần đây đang trở thành chủ đề bàn tán trên MXH sau khi hôn lễ bất ngờ bị hủy ngay tại chỗ chỉ vì khoản tiền đổi cách xưng hô trị giá 188 nghìn tệ (gần 729 triệu đồng).
Nữ ca sĩ Vbiz có biệt thự rải rác khắp nơi: U50 mới kết hôn, có con mà không ai hay biết

Nữ ca sĩ Vbiz có biệt thự rải rác khắp nơi: U50 mới kết hôn, có con mà không ai hay biết

Sao việt

14:51:54 21/05/2026
Hiện tại, Hồ Quỳnh Hương tận hưởng cuộc sống nhẹ nhàng và bình yên bên gia đình. Nữ ca sĩ dành phần lớn thời gian cho công việc kinh doanh, chăm sóc sức khỏe và theo đuổi lối sống xanh, an lành.
Chàng trai Việt vừa giải được bài toán bỏ ngỏ hơn nửa thế kỷ của nhân loại: Cựu HS chuyên Lam Sơn, từng đạt Huy chương Vàng Toán quốc tế

Chàng trai Việt vừa giải được bài toán bỏ ngỏ hơn nửa thế kỷ của nhân loại: Cựu HS chuyên Lam Sơn, từng đạt Huy chương Vàng Toán quốc tế

Học hành

14:49:15 21/05/2026
Nhà nghiên cứu trẻ Lê Quang Dũng vừa gây chú ý khi trở thành đồng tác giả chính của công trình giải quyết thành công một bài toán lớn tồn đọng hơn nửa thế kỷ trong lĩnh vực phi tham số Bayesian.
Lời hứa đầu tiên - Tập 11: Hoa hậu vì cộng đồng bị tố mập mờ chuyện từ thiện

Lời hứa đầu tiên - Tập 11: Hoa hậu vì cộng đồng bị tố mập mờ chuyện từ thiện

Phim việt

14:18:49 21/05/2026
Với bản tính tham lam và xấu xa, bố của Dín sau khi trở về luôn tìm cách vòi tiền Vi Minh. Nhưng âm mưu bất thành nên gã đàn ông này quyết định đăng đàn tố Vi Minh.