Tencent vượt Google, dẫn đầu bảng xếp hạng mô hình AI tạo sinh hình ảnh
Việc Hunyuan Image 3.0 của Tencent vượt Google DeepMind trên bảng xếp hạng quốc tế cho thấy sự trỗi dậy mạnh mẽ của ngành trí tuệ nhân tạo (AI) Trung Quốc trong lĩnh vực tạo sinh hình ảnh.
Ảnh minh họa được tạo bằng mô hình Hunyuan Image 3.0 của Tencent Holdings . Ảnh: Overchat.ai
Theo SCMP ngày 6/10, Tencent Holdings vừa giành vị trí dẫn đầu trong lĩnh vực tạo AI khi mô hình Hunyuan Image 3.0 vượt qua Nano Banana của Google DeepMind trên bảng xếp hạng LMArena, nền tảng đánh giá mô hình do nhóm nghiên cứu tại Đại học California, Berkeley phát triển.
Theo LMArena, Hunyuan Image 3.0 hiện đứng đầu hạng mục chuyển văn bản thành hình ảnh trong cả các mô hình mã nguồn mở và đóng. Sản phẩm này được Tencent công bố cuối tháng 9, với 80 tỷ tham số, mức cao nhất trong số các mô hình tạo ảnh mã nguồn mở hiện nay. Số lượng tham số phản ánh quy mô và khả năng học hỏi của mô hình, đồng thời cũng yêu cầu nguồn lực tính toán lớn hơn để huấn luyện và vận hành.
Trước đó, vị trí số một thuộc về Gemini 2.5 Flash Image, hay còn gọi là Nano Banana, của Google DeepMind. Mô hình này nhanh chóng thu hút người dùng sau khi ra mắt vào cuối tháng 8 nhờ khả năng chỉnh sửa ảnh chính xác và dựng hình 3D. Tuy nhiên, Tencent cho biết Hunyuan Image 3.0 “hoàn toàn có thể sánh ngang với các mô hình hàng đầu mã nguồn đóng”, đồng thời được huấn luyện trên tập dữ liệu khổng lồ gồm 5 tỷ cặp ảnh-văn bản, khung hình video và 6 nghìn tỷ token ngôn ngữ.
Trên nền tảng Fal.ai, Hunyuan Image 3.0 có giá 0,10 đô la Mỹ cho mỗi megapixel hình ảnh được tạo ra, cao hơn so với mức 0,039 đô la Mỹ của Gemini 2.5 Flash Image và 0,03 đô la Mỹ của Seedream 4.0 do ByteDance phát triển. Tencent cho biết mô hình này có thể giúp người dùng như họa sĩ, nhà thiết kế hay nhà sáng tạo rút ngắn đáng kể thời gian làm việc.
Hiện Hunyuan Image 3.0 mới hỗ trợ chức năng tạo ảnh từ văn bản, song Tencent có kế hoạch mở rộng sang các tính năng khác như chỉnh sửa ảnh và chuyển ảnh thành ảnh. Mô hình đã được mở mã nguồn trên GitHub và Hugging Face, trở thành một trong những dự án AI Trung Quốc được quan tâm nhất hiện nay.
Video đang HOT
Nano Banana là gì mà khiến mọi người xôn xao, đứng đầu Google Trends Việt Nam?
Nano Banana - tên gọi thân mật của mô hình tạo, chỉnh sửa ảnh AI miễn phí Gemini 2.5 Flash Image đến từ Google - đang 'gây bão' khắp cõi mạng.
Google DeepMind vừa giới thiệu một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo tạo sinh (GenAI): mô hình Gemini 2.5 Flash Image.
Được cộng đồng gọi với cái tên thân mật "Nano Banana", mô hình này là công cụ mạnh mẽ, có khả năng biến đổi văn bản thành hình ảnh và chỉnh sửa hình ảnh hiện có với độ chính xác và tính linh hoạt cao.
Đây là sản phẩm tiếp nối của dòng mô hình Gemini, nhưng được tối ưu hóa riêng cho các tác vụ liên quan đến hình ảnh.
Từ khóa Gemini đứng đầu danh sách thịnh hành trên Google Trends tại Việt Nam ngày 4/9. Ảnh chụp màn hình.
Với những ưu điểm vượt trội trong khả năng tạo và chỉnh sửa ảnh, Nano Banana đang thu hút sự chú ý lớn của người dùng công nghệ toàn cầu, bao gồm Việt Nam.
Theo Google Trends, trong 24 giờ qua, lượng tìm kiếm Gemini và Nano Banana tăng vọt. Thống kê ngày 4/9 cho thấy từ khóa "Gemini" đứng đầu bảng xếp hạng Thịnh hành ở tất cả chủ đề.
Trên các diễn đàn và hội nhóm mạng xã hội, người dùng cũng chia sẻ và thử nghiệm các câu lệnh tạo ảnh và kịch bản sử dụng Nano Banana.
Phần lớn đều đánh giá cao khả năng tạo ảnh "nhanh, gọn, lẹ" cũng như chất lượng sản phẩm đầu ra của công cụ.
Không chỉ đơn thuần tạo ảnh từ các mô tả văn bản, Gemini 2.5 Flash Image còn vượt trội ở một số khía cạnh cốt lõi: chỉnh sửa ảnh theo lệnh, duy trì tính nhất quán của nhân vật, tốc độ xử lý ấn tượng và công nghệ bảo mật SynthID.
Người dùng có thể sử dụng ngôn ngữ tự nhiên để thay đổi các yếu tố trong một bức ảnh. Ví dụ, chỉ cần nhập lệnh "thêm một chiếc ghế màu đỏ bên cạnh cái bàn" hoặc "thay đổi phông nền thành một khu rừng", mô hình sẽ thực hiện chỉnh sửa một cách chính xác và liền mạch.
Duy trì tính nhất quán của nhân vật được xem là tính năng đột phá nhất. Mô hình có thể ghi nhớ và tái tạo hình ảnh một nhân vật hoặc vật thể với các đặc điểm nhất quán (như khuôn mặt, trang phục, phong cách) trong nhiều bức ảnh khác nhau.
Điều này đặc biệt hữu ích cho các dự án sáng tạo cần tạo ra một chuỗi hình ảnh liên quan, từ truyện tranh cho đến các chiến dịch marketing.
Ảnh gốc và ảnh sau khi chỉnh sửa bằng Gemini 2.5 Flash Image
Với kiến trúc được tối ưu hóa, Gemini 2.5 Flash Image có thể tạo ra các kết quả chất lượng cao chỉ trong vài giây, giúp tăng tốc đáng kể quy trình sáng tạo.
Tất cả các hình ảnh được tạo ra hoặc chỉnh sửa bởi mô hình đều được gắn một dấu nhận diện kỹ thuật số vô hình (invisible digital watermark) độc quyền của Google, cho phép nhận biết hình ảnh được tạo ra bằng AI, góp phần đảm bảo tính minh bạch và nguồn gốc của nội dung.
Mô hình Gemini 2.5 Flash Image đang mở ra nhiều tiềm năng ứng dụng, từ người dùng cá nhân đến các nhà phát triển chuyên nghiệp.
Các nhà phát triển có thể truy cập mô hình thông qua Gemini API và Google AI Studio để xây dựng các ứng dụng của riêng mình, trong khi các doanh nghiệp có thể sử dụng mô hình trên nền tảng Vertex AI.
Đối với người dùng phổ thông, mô hình này được tích hợp trực tiếp vào Google Gemini và các ứng dụng khác, biến AI tạo ảnh thành một công cụ dễ tiếp cận và trực quan.
Với các tính năng vượt trội, đặc biệt là khả năng duy trì tính nhất quán của nhân vật, Gemini 2.5 Flash Image được kỳ vọng sẽ trở thành đối thủ cạnh tranh đáng gờm với các phần mềm chỉnh sửa ảnh truyền thống như Photoshop, thay đổi cách thức các nhà sáng tạo và người dùng tương tác với hình ảnh số.
Jack Ma nằm mơ cũng không thể nghĩ có ngày này: Alibaba và Tencent chứng kiến 1 nghìn tỷ USD vốn hóa 'không cánh mà bay' sau 1 năm Alibaba và Tencent "ngồi khóc" trong suốt 1 năm qua khi chứng kiến hơn 1 nghìn tỷ USD vốn hóa bốc hơi. Tờ Bloomberg đưa tin, 2 gã khổng lồ công nghệ Trung Quốc là Tencent Holdings và Alibaba Group đã chứng kiến vốn hóa mất 1 ngìn tỷ USD kể từ khi cổ phiếu của họ trên sàn Hong Kong lao dốc...











Tiêu điểm
Tin đang nóng
Tin mới nhất

"Độ" tản nhiệt SSD cho iPhone 17 Pro Max và cái kết

Nền tảng chuyển đổi số cho doanh nghiệp

Yet the path of trading finds its way through Quotex

Meta "bắt tay" BRIDGE tạo cú hích cho tương lai ngành truyền thông toàn cầu

Khi nhãn dán 'Video này có sử dụng AI' xuất hiện nhiều hơn

8 ứng dụng Android huyền thoại gắn liền với ký ức người dùng

Khi AI trở nên bất chính

Thực tế sử dụng AI trong giới xuất bản quốc tế

'Đũa thần AI' chạm vào ngành bán lẻ

Apple sắp học theo Mark Zuckerberg

Microsoft tích hợp AI thế hệ mới vào Office, Word và Excel sắp 'tự suy nghĩ'

Mẹo tiết kiệm pin cho laptop Windows và MacBook
Có thể bạn quan tâm

One UI 8.5 hé lộ 4 tính năng AI mới giúp nâng cao trải nghiệm người dùng
Uncat
13:49:57 07/10/2025
Victoria Beckham mượn chuyện để "bóng gió" sâu cay về mâu thuẫn với con trai cả?
Sao âu mỹ
13:48:53 07/10/2025
Gió ngang khoảng trời xanh - Tập 26: Xuất hiện 'tiểu tam' xen vào hôn nhân Mỹ Anh - Đăng?
Phim việt
13:23:27 07/10/2025
Cả cõi mạng áp lực vì săn vé concert G-DRAGON tại Hà Nội: Hơn 360 nghìn người xếp hàng chỉ sau 1 phút, vé VVIP sold-out nhanh như gió!
Nhạc quốc tế
13:07:42 07/10/2025
Tình thế gây lo ngại của Dương Domic
Nhạc việt
12:58:48 07/10/2025
Lãnh đạo Triều Tiên nói về mối quan hệ đồng minh với Nga
Thế giới
12:42:01 07/10/2025
'Cơn ác mộng' lúc sáng sớm ở Thủ đô, nước mênh mông tận vành đai 3 trên cao
Tin nổi bật
12:39:30 07/10/2025
Nấu cháo nhớ thêm 1 thìa này, nhiều nhà có mà không biết, vừa nhanh nhừ, thơm ngậy lại gấp đôi dinh dưỡng
Ẩm thực
12:39:13 07/10/2025
Khởi tố tài xế xe tải gây tai nạn, đè lên ô tô khiến 4 trẻ em bị thương nặng
Pháp luật
12:30:32 07/10/2025
Máy ảnh 2025: Loạt lựa chọn khiến dân nhiếp ảnh rút ví không do dự
Đồ 2-tek
12:26:00 07/10/2025