Gemini Omni: AI hiểu thế giới đa phương thức của Google
Khi Google giới thiệu Gemini Omni tại Google I/O 2026, điều khiến giới công nghệ chú ý không chỉ là một mô hình AI tạo video mới.
Thứ thực sự gây tranh luận là tham vọng lớn hơn phía sau dự án này: Xây dựng một hệ AI có khả năng “hiểu thế giới” thay vì chỉ xử lý ngôn ngữ.
Trong nhiều năm, AI hiện đại phát triển dựa trên các mô hình ngôn ngữ lớn. Chúng có thể viết văn bản, trả lời câu hỏi, lập trình hay dịch thuật với tốc độ và độ chính xác ngày càng cao. Tuy nhiên, phần lớn những hệ thống này vẫn hoạt động theo nguyên lý dự đoán xác suất: phân tích lượng dữ liệu khổng lồ để tạo ra phản hồi hợp lý tiếp theo.
Bài đăng của Google trên X.
Gemini Omni cho thấy Google đang muốn vượt khỏi giới hạn AI đã chạm tới
Theo các tài liệu công bố từ Google DeepMind, Gemini Omni được xây dựng như một mô hình “omni-modal”, có thể xử lý đồng thời văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống.
Nhưng điểm đáng chú ý hơn nằm ở cách Google mô tả công nghệ này. Thay vì nhấn mạnh khả năng tạo nội dung, hãng liên tục nhắc đến những khái niệm như “simulation”, “physics” hay “multimodal reasoning” – có nghĩa là, AI không chỉ tạo ra hình ảnh đẹp hay video mượt, mà phải hiểu cách thế giới vận hành.
Điều đó nghe có vẻ trừu tượng, nhưng lại là khác biệt rất lớn.
Điểm đáng chú ý nhất của mô hình này chính là bước “nhảy vọt” khi khiến cho AI hiểu “thế giới vật lý”. Google nhấn mạnh rằng Gemini Omni không chỉ tạo video đẹp mà còn cố mô phỏng: trọng lực, chuyển động cơ thể, ánh sáng, tính liên tục giữa các cảnh.
Theo đó, chỉ cần người dùng đưa ảnh, đoạn ghi âm và mô tả văn bản bất kỳ, Omni có thể tạo thành một video hoàn chỉnh với chuyển động, ánh sáng và lời thoại phù hợp.
Gemini Omni có thể mô phỏng sinh động các chuyển động vật lý gần giống thế giới thực.
“World model” – cuộc đua mới của ngành AI
Một chatbot truyền thống có thể biết rằng khi trời mưa thì đường thường ướt, đơn giản vì nó đã học từ hàng triệu đoạn văn bản tương tự. Nhưng với “world model”, AI được kỳ vọng sẽ hiểu sâu hơn về mối quan hệ giữa các hiện tượng vật lý: ánh sáng thay đổi theo góc máy, vật thể chuyển động chịu tác động của trọng lực, hay một nhân vật phải giữ tính nhất quán giữa nhiều khung hình liên tiếp.
Đây cũng là lý do các mô hình video AI đang trở thành trung tâm của cuộc đua công nghệ mới. Video chứa đồng thời không gian, thời gian, chuyển động và logic nhân quả. Để tạo ra một đoạn video thuyết phục, AI không thể chỉ ghép những khung hình đẹp với nhau. Nó cần mô phỏng được hành vi của thế giới thực.
Theo TechCrunch, Google đang định vị Gemini Omni như một hệ thống có thể tạo nội dung từ bất kỳ dạng dữ liệu đầu vào nào. Tham vọng này khá tương đồng với hướng đi mà OpenAI từng mô tả cho Sora, nơi mô hình video được xem như “world simulator” – công cụ mô phỏng thế giới.
Gemini Omni có thể mô tả thực tại, edit video bằng hội thoại
Các demo đầu tiên của Gemini Omni cho thấy Google không chỉ muốn AI tạo video, mà còn muốn AI chỉnh sửa và duy trì logic của video thông qua hội thoại liên tục. Người dùng có thể yêu cầu thay đổi thời tiết, góc quay hay phong cách hình ảnh chỉ bằng ngôn ngữ tự nhiên, trong khi nhân vật và bối cảnh vẫn được giữ ổn định giữa các cảnh quay. Đây là điểm mà nhiều công cụ text-to-video trước đó vẫn gặp khó khăn.
Đằng sau các demo này là một thay đổi lớn hơn trong chiến lược AI của Google. Thay vì phát triển các sản phẩm rời rạc cho chatbot, hình ảnh hay video, công ty đang hợp nhất chúng thành một hệ thống thống nhất có thể nhìn, nghe, hiểu và tạo nội dung đa phương thức trong cùng một môi trường.
Nói cách khác, Google dường như không còn xem Gemini đơn thuần là chatbot, mà là nền tảng AI có khả năng tương tác với thế giới thực theo cách toàn diện hơn.
Dĩ nhiên, khoảng cách giữa tham vọng và thực tế vẫn còn rất lớn. Các bản thử nghiệm hiện tại vẫn xuất hiện lỗi chuyển động, inconsistency nhân vật hay các chi tiết vật lý chưa hoàn toàn tự nhiên. Google cũng chưa công bố đầy đủ benchmark kỹ thuật của Omni, khiến giới nghiên cứu khó đánh giá chính xác năng lực thật sự của mô hình này.
Dù Gemini Omni vẫn chưa thể “hiểu thế giới” như con người, công nghệ này cho thấy AI đang bước sang một giai đoạn mới. Mục tiêu giờ đây không chỉ là tạo ra các chatbot trả lời thông minh hơn, mà là xây dựng những hệ thống có thể hiểu môi trường xung quanh, nhận biết không gian và dự đoán điều gì sẽ xảy ra trong thế giới thực.
Nếu xu hướng này tiếp tục phát triển, AI tương lai có thể không chỉ dừng ở việc trò chuyện, mà còn có khả năng quan sát, suy luận và tương tác với cuộc sống thực theo cách ngày càng giống trí tuệ con người hơn.
AI Trung Quốc thống lĩnh bảng xếp hạng sử dụng toàn cầu
Mới đây, hai nền tảng AI Trung Quốc nổi bật là MiniMax và Moonshot đã chính thức vươn lên dẫn đầu bảng xếp hạng lượng sử dụng AI trên toàn cầu, khép lại một năm thống trị thị trường của các ông lớn công nghệ đến từ Mỹ. Đầu tháng 2 năm nay, nền tảng lưu trữ trí tuệ nhân tạo OpenRouter đã...
Tiêu điểm
Tin đang nóng
Tin mới nhất

Chip Exynos 2800 rò rỉ công nghệ HBM: Bước tiến đột phá cho trí tuệ nhân tạo trên di động

Kỹ sư Google nghỉ việc sau gần 20 năm vì lạc lõng trước AI

Xiaomi chi 9 tỷ USD đưa chip AI lên điều hòa và robot hút bụi

Apple sẽ nâng cấp Genmoji trong iOS 27

Meta cắt giảm nhân sự quy mô lớn nhằm tái cấu trúc bộ máy theo định hướng AI

OpenAI đưa tính năng truy cập từ xa Codex lên ChatGPT

AI, dữ liệu lớn, năng lượng sạch vào nhóm công nghệ được ưu tiên hàng đầu

Robot hình người làm việc liên tục 8 giờ

Apple giấu một tính năng hữu ích ngay trên màn hình khóa iPhone

Những thói quen tưởng vô hại nhưng âm thầm làm chai pin smartphone

Những quan niệm về pin điện thoại đã lỗi thời

3 tinh chỉnh Windows 11 cần làm sau khi 'đập hộp' laptop
Có thể bạn quan tâm

Vụ núi đá bất ngờ sạt lở: Đã tìm thấy thi thể hai người đàn ông bị vùi lấp
Tin nổi bật
15:33:02 21/05/2026
Tai nghe kẹp tai mới của Xiaomi tương thích mạng Find My của Apple
Đồ 2-tek
15:23:12 21/05/2026
Lời khai lạnh người của kẻ dùng dao đâm chết 'vợ hờ', giả tự tử
Pháp luật
15:22:35 21/05/2026
Điều gì đang khiến những "đảo hội" trở thành "thỏi nam châm" hút khách du lịch?
Du lịch
15:19:43 21/05/2026
Chủ nhân hit quốc dân Khúc Hát Mừng Sinh Nhật thông báo nóng: Toàn bộ doanh thu tiền tỷ bị tạm giữ, bản quyền nhập nhằng
Nhạc việt
15:05:44 21/05/2026
Trần Bích Hạnh - vợ Văn Thanh lộ trạng thái bất ổn sau đám cưới
Sao thể thao
15:05:37 21/05/2026
Nữ NSƯT mang bầu 6 tháng vẫn có trai tán, kết hôn 24 năm cả nước không biết mặt chồng
Hậu trường phim
15:00:33 21/05/2026
Toàn bộ mâu thuẫn khiến cô dâu cởi váy cưới, chú rể huỷ hôn trước mặt khách mời
Netizen
14:55:14 21/05/2026
Nữ ca sĩ Vbiz có biệt thự rải rác khắp nơi: U50 mới kết hôn, có con mà không ai hay biết
Sao việt
14:51:54 21/05/2026
Chàng trai Việt vừa giải được bài toán bỏ ngỏ hơn nửa thế kỷ của nhân loại: Cựu HS chuyên Lam Sơn, từng đạt Huy chương Vàng Toán quốc tế
Học hành
14:49:15 21/05/2026
Gemini 3.5 Flash gây sốt vì có thể xử lý nhiều yêu cầu ‘rối rắm’ ngoài đời thật

Nghiên cứu của Google: Mô hình AI tốt nhất chỉ trả lời chính xác gần 69%
Công nghệ AI mới của Google được thử thách với văn bản 2.000 năm tuổi
Google Gemini có thể sắp áp đặt giới hạn sử dụng hàng tuần đối với phiên bản miễn phí
Apple ra mắt Siri với tính năng tự động xóa lịch sử trò chuyện
Microchip ra mắt chip Ethernet MACsec bảo mật phần cứng cho xe ô tô
Anthropic đã xử lý mô hình AI tống tiền người dùng như thế nào?
AI chưa thể thay thế vai trò của con người trong y học khẩn cấp
Google đặt cược lớn vào nhân tố đang lên Anthropic
So sánh 3 mô hình AI: GPT-5.5, Gemini 3.1 và Claude Opus 4.7
Open AI, DeepSeek 'rủ nhau' ra mắt mô hình AI thế hệ mới
ChatGPT có nâng cấp lớn
DeepSeek: V4 vượt trội các mô hình AI mã nguồn mở, tương thích với chip Huawei
Google Chrome chính thức tích hợp Gemini AI tại Việt Nam: Những tính năng đột phá cho người dùng
Claude Mythos bị truy cập trái phép gây hoang mang, Anthropic điều tra
Facebook theo dõi chuột, bàn phím của nhân viên
Đột phá trong lĩnh vực robot
Google hợp tác Marvell phát triển chip AI giải bài toán hiệu năng suy luận
Nguy cơ hacker AI gia tăng đe dọa an ninh tài chính toàn cầu
AI kém tin cậy hơn cả mạng xã hội?
OpenAI ra mắt GPT-5.4-Cyber, AI chuyên bảo vệ an ninh mạng
Anthropic hợp tác với các 'ông lớn' công nghệ phát triển AI an ninh mạng
Cả khán phòng lặng đi khi Thạc sĩ người Việt hát "Ước mơ của mẹ" trong lễ tốt nghiệp tại Mỹ
Vụ livestream tố thịt bò giả ở Quy Nhơn: Bán thịt heo cho khách
4,3 triệu lượt xem video nam sinh lao tới đẩy xe ve chai giúp bà cụ giữa dốc cầu: "Nuôi con như vậy mới đáng!"
Xiaomi HyperOS 4 Launcher rò rỉ: Thiết kế Liquid Glass và đột phá với ngôn ngữ Rust
Tranh cãi về quy định cấm robot hình người lên máy bay
'Gây sốt' video robot hình người nâng và di chuyển một chiếc tủ lạnh nặng 23kg
Gemini 4, tác tử AI và những điều đáng mong chờ ở Google I/O 2026
Apple có thể trở lại với titan sau các vấn đề trên iPhone 17 Pro
YouTube thêm tính năng AI mới giúp tìm video nhanh hơn
Google muốn Gemini có thể thay đổi cách nhân loại làm khoa học
Rapper Pháo thi Hoa hậu
"Nữ hoàng dao kéo" Lee Da Hae vỡ òa mang thai con đầu lòng cho ông xã tai tiếng Se7en sau 3 năm cưới
Nóng nhất vụ Kim Soo Hyun bị tố hẹn hò trẻ vị thành niên: Công tố viên phát hiện kẻ ngụy tạo bằng chứng, xin lệnh bắt khẩn cấp
Rúng động xứ Trung vụ 2 nam ca sĩ bị bắt vì ma túy: Chủ động khai báo 120 bạn nghiện là nghệ sĩ, 2 người đẹp showbiz liên quan
Không phải nghỉ dưỡng sang chảnh, đây mới là kiểu du lịch đang khiến giới trẻ mê mẩn mùa hè 2026
Trúng số độc đắc sau 16h30 chiều nay (21/5/2026), Thần Tài trao tiền tỷ, 3 con giáp tay trái chạm vàng, tay phải vét bạc thiên hạ, vạn sự hanh thông ngoài mong đợi
Daehan - Minguk - Manse làm gì mà để bố lên hẳn truyền hình thốt ra: "3 đứa con tôi đã biến mất, giờ chúng như người xa lạ"?
Bắt tạm giam ca sĩ Long Nhật và ca sĩ Sơn Ngọc Minh
Ca sĩ Long Nhật khai chuyển tiền mua ma túy đá để hút cùng quản lý
Ca sĩ Long Nhật: "Trong lòng mặc cảm tội lỗi, tôi không thích ma tuý chút nào"
Lập hồ sơ xử lý người phụ nữ chửi bới, tát nam tài xế ô tô ở Hà Nội
Ba người trong một gia đình tử vong bất thường, trên người nhiều vết thương
Long Nhật, Sơn Ngọc Minh vừa bị khởi tố trong đường dây ma tuý đặc biệt lớn là ai?
Ca sĩ Long Nhật và Sơn Ngọc Minh bị bắt tạm giam vì tội gì?
10 mỹ nhân đẹp nhất Hàn Quốc 2026: Song Hye Kyo xếp sau IU, hạng 1 đố ai ngắm mà không mê
Gia đình không rõ tung tích Sơn Ngọc Minh