Meta tạo mô hình AI chuyên phục vụ toán học, lập trình và suy luận

Meta vừa hé lộ một bước tiến mới đầy hứa hẹn trong lĩnh vực trí tuệ nhân tạo : mô hình 2-simplicial Transformer .

Meta tạo mô hình AI chuyên phục vụ toán học, lập trình và suy luận - Hình 1

Dân toán học sẽ dễ dàng hơn khi có AI là trợ lý

Đây không chỉ là một mô hình AI thông thường, mà là một kiến trúc được thiết kế đặc biệt để vượt trội hơn các mô hình Transformer tiêu chuẩn trong những lĩnh vực đòi hỏi sự chính xác và logic cao như toán học, lập trình suy luận .

2-simplicial Transformer là gì?

Về cơ bản, 2-simplicial Transformer là một cải tiến so với kiến trúc Transformer truyền thống – nền tảng của hầu hết các mô hình ngôn ngữ lớn (LLM) hiện nay như ChatGPT , Gemini . Nếu các Transformer thông thường xử lý thông tin theo một “luồng” tuyến tính (hoặc dựa trên mối quan hệ giữa từng cặp token riêng lẻ), thì 2-simplicial Transformer mang đến một cách tiếp cận phức tạp hơn:

Trước hết là xử lý các mối quan hệ “cấp cao hơn”. Cái tên “2-simplicial” gợi ý rằng mô hình này không chỉ nhìn vào mối quan hệ giữa hai phần tử (ví dụ: hai từ, hai token) mà còn xem xét mối quan hệ giữa ba hoặc nhiều hơn các phần tử trong dữ liệu. Hãy hình dung nó như việc không chỉ nhìn vào các cạnh của một hình tam giác (mối quan hệ giữa hai đỉnh), mà còn hiểu được bản thân hình tam giác đó như một khối (mối quan hệ giữa ba đỉnh).

Ngoài ra, nó cải thiện hiệu quả token. Một trong những thách thức của các LLM là quản lý token (các đơn vị ngôn ngữ nhỏ nhất mà mô hình xử lý). Việc cải thiện hiệu quả token (token efficiency) có nghĩa là mô hình có thể xử lý nhiều thông tin hơn với cùng một số lượng token, hoặc đạt được kết quả tốt hơn với ít token hơn. Điều này giúp tối ưu hóa chi phí tính toán và tăng cường khả năng xử lý các ngữ cảnh dài.

Video đang HOT

Thế mạnh của 2-simplicial Transformer

Điểm nhấn chính của mô hình này nằm ở khả năng thể hiện xuất sắc trong các tác vụ cụ thể. Chẳng hạn trong toán học. Các bài toán toán học yêu cầu sự hiểu biết sâu sắc về các mối quan hệ logic, cấu trúc và quy tắc. Kiến trúc 2-simplicial có thể giúp mô hình nắm bắt tốt hơn các mối liên kết này, dẫn đến khả năng giải quyết vấn đề toán học phức tạp hơn.

Hay trong lập trình vốn cũng đòi hỏi tư duy logic, khả năng nhận diện các mẫu (patterns) và hiểu mối quan hệ giữa các thành phần khác nhau của code. Việc cải thiện hiệu quả token và khả năng suy luận giúp mô hình này có thể tạo ra code chất lượng cao hơn, tìm lỗi tốt hơn và hiểu được cấu trúc lập trình phức tạp.

Đặc biệt hơn cả là khả năng suy luận (Reasoning), thứ vô cùng quan trọng cho mọi tác vụ AI nâng cao. Việc mô hình có thể suy luận tốt hơn nghĩa là nó có thể phân tích thông tin, đưa ra kết luận logic và giải quyết các vấn đề mà không chỉ dựa vào việc ghi nhớ các mẫu dữ liệu.

Ý nghĩa của mô hình này

Việc Meta phát triển 2-simplicial Transformer cho thấy một xu hướng quan trọng trong nghiên cứu AI: thay vì chỉ tăng kích thước mô hình, các nhà khoa học đang tìm kiếm các cải tiến kiến trúc sâu sắc hơn để nâng cao khả năng của AI trong các lĩnh vực cụ thể, đặc biệt là những lĩnh vực đòi hỏi sự chính xác, logic và khả năng suy luận cao.

Nếu thành công, 2-simplicial Transformer có thể mở đường cho thế hệ AI mới có khả năng giải quyết các bài toán khoa học, kỹ thuật và lập trình phức tạp hơn, đồng thời tối ưu hóa tài nguyên tính toán. Điều này sẽ có ý nghĩa lớn đối với việc phát triển các AI agent, các hệ thống tự động hóa và các công cụ hỗ trợ con người trong các lĩnh vực chuyên môn.

Google và hướng phát triển tương tự

Google có lịch sử lâu đời trong nghiên cứu Transformer và họ là người đã phát minh ra kiến trúc Transformer vào năm 2017. Google cũng đang khám phá nhiều cách để làm cho các LLM của mình thông minh và hiệu quả hơn.

Đầu tiên là tập trung vào hiệu quả token và suy luận. Google đã công bố các nghiên cứu về việc cải thiện hiệu quả token cho các tác vụ suy luận. Điều này bao gồm việc phát triển các chiến lược học tăng cường (RL) được điều chỉnh riêng cho suy luận trong LLM, đặc biệt là dưới các giới hạn về bộ nhớ và tính toán. Các phương pháp như S-GRPO (một biến thể ngẫu nhiên của Group Relative Policy Optimization) và T-SPMO (một phương pháp khớp tiền tố ở cấp độ token) đang được nghiên cứu để giảm mức sử dụng bộ nhớ và ổn định quá trình huấn luyện.

Google cũng đang khám phá các cách để LLM cộng tác với nhau (như trong nghiên cứu “Chain-of-Agents” của họ) để giải quyết các tác vụ yêu cầu ngữ cảnh rất dài. Thay vì cố gắng đưa tất cả các token vào một LLM duy nhất, họ để các tác nhân AI giao tiếp và tổng hợp thông tin, giúp cải thiện hiệu quả và khả năng suy luận trên các mẫu dài.

Google DeepMind đã giới thiệu các phương pháp như Differentiable Cache Augmentation, sử dụng bộ đồng xử lý để mở rộng bộ nhớ trong của LLM (cache key-value). Điều này giúp làm giàu thông tin cho mô hình, nâng cao khả năng suy luận mà không làm tăng gánh nặng tính toán trong quá trình thực thi.

OpenAI và hướng phát triển tương tự

OpenAI, với các mô hình GPT (Generative Pre-trained Transformer) đã trở thành chuẩn mực, cũng liên tục tìm cách nâng cao khả năng suy luận và hiệu quả của các LLM.

OpenAI đã cho thấy rằng có nhiều không gian để cải thiện khả năng suy luận của LLM thông qua việc đầu tư tính toán một cách chiến lược, đặc biệt là thông qua các phương pháp học tăng cường (RL) được tùy chỉnh cho các tác vụ suy luận. Các mô hình như o3 và o4-mini gần đây cho thấy sự tiến bộ đáng kể trong cả khả năng suy luận và khả năng sử dụng công cụ.

Mặc dù OpenAI chưa công bố trực tiếp một kiến trúc “2-simplicial Transformer”, họ liên tục tìm cách tối ưu hóa hiệu quả token trong các mô hình của mình. Việc tối ưu hóa này là rất quan trọng vì nó ảnh hưởng trực tiếp đến chi phí vận hành API và tốc độ phản hồi của mô hình. Các nghiên cứu về suy luận đa ngôn ngữ cũng cho thấy rằng việc suy luận trong các ngôn ngữ không phải tiếng Anh có thể giảm việc sử dụng token nhưng vẫn duy trì độ chính xác.

“Sparse Transformers” và cơ chế chú ý hiệu quả hơn: Từ những ngày đầu, OpenAI đã nghiên cứu các biến thể của kiến trúc Transformer, chẳng hạn như Sparse Transformers, nhằm cải thiện cơ chế chú ý (attention mechanism) để xử lý các chuỗi dài hơn một cách hiệu quả hơn so với cơ chế chú ý tiêu chuẩn. Mặc dù không phải là “2-simplicial” theo nghĩa đen, nhưng nó cho thấy OpenAI luôn tìm cách cải thiện cách mô hình xử lý mối quan hệ giữa các token.

OpenAI ra mắt các phiên bản của mô hình GPT-4.1 mới

Mới đây, OpenAI đã ra mắt mô hình AI mới nhất GPT-4.1, cùng với các phiên bản nhỏ hơn là GPT-4.1 mini và GPT-4.1 nano với những cải tiến đáng kể về khả năng lập trình, tuân thủ hướng dẫn và hiểu ngữ cảnh dài.

OpenAI ra mắt các phiên bản của mô hình GPT-4.1 mới - Hình 1
Biểu tượng công cụ ChatGPT của công ty OpenAI. Ảnh: AFP/TTXVN

Theo thông báo từ nhà sản xuất ứng dụng ChatGPT nổi tiếng, các mô hình mới vượt trội hơn so với mô hình GPT-4o tiên tiến nhất trước đó của công ty trên mọi phương diện. Nhưng hiện chúng chỉ có sẵn thông qua giao diện lập trình ứng dụng (API) của OpenAI.

Với khả năng hiểu ngữ cảnh được nâng cao, các mô hình mới có thể hỗ trợ tới 1 triệu "tokens" - một thuật ngữ chỉ các đơn vị dữ liệu được xử lý bởi một mô hình AI. Các mô hình này cũng được trang bị kiến thức được cập nhật đến tháng 6/2024.

GPT-4.1 cho thấy sự cải thiện 21% so với GPT-4o và 27% so với GPT-4.5 về khả năng lập trình. Bên cạnh đó, những cải tiến trong việc tuân thủ hướng dẫn và hiểu ngữ cảnh dài cũng giúp các mô hình GPT-4.1 hoạt động hiệu quả hơn trong việc hỗ trợ các tác nhân AI (AI agent).

CEO Sam Altman chia sẻ trên nền tảng mạng xã hội X rằng kết quả đánh giá các tiêu chuẩn cho những mô hình mới là rất cao. Tuy nhiên, OpenAI muốn tập trung vào tính hữu dụng trong thế giới thực.

Theo OpenAI, các mô hình mới hoạt động với chi phí thấp hơn đáng kể so với GPT-4.5. Công ty sẽ ngừng cung cấp bản xem trước GPT-4.5 hiện có sẵn trong API vào tháng 7/2025, vì các mô hình mới mang lại hiệu suất tương đương hoặc tốt hơn.

Trước đó vào tháng 2/2025, OpenAI đã phát hành bản xem trước phục vụ mục đích nghiên cứu GPT-4.5 cho một số người dùng và nhà phát triển, đồng thời công bố kế hoạch mở rộng quyền truy cập trong những giai đoạn tiếp theo.

Bạn thấy bài viết này có hữu ích không?
Không

Tin liên quan

Tiêu điểm

Mỹ cân nhắc áp phí 100.000 USD mỗi năm cho thị thực H-1BMỹ cân nhắc áp phí 100.000 USD mỗi năm cho thị thực H-1B
05:57:06 21/09/2025
Ông Trump chính thức tung 'thẻ vàng nhập cư' trị giá từ 1 triệu USDÔng Trump chính thức tung 'thẻ vàng nhập cư' trị giá từ 1 triệu USD
15:48:29 21/09/2025
Tổng thống Trump cảnh báo về 'rắc rối lớn' sau khi tiêm kích Nga vi phạm không phận NATOTổng thống Trump cảnh báo về 'rắc rối lớn' sau khi tiêm kích Nga vi phạm không phận NATO
21:14:59 20/09/2025
Mỹ siết chặt chính sách thị thựcMỹ siết chặt chính sách thị thực
21:21:15 21/09/2025
Xung đột Hamas - Israel: Israel không kích dữ dội thành phố GazaXung đột Hamas - Israel: Israel không kích dữ dội thành phố Gaza
07:01:10 21/09/2025
Tổng thống Trump thay đổi chính sách thị thực H-1B: Lao động nước ngoài gấp rút trở về MỹTổng thống Trump thay đổi chính sách thị thực H-1B: Lao động nước ngoài gấp rút trở về Mỹ
15:29:48 22/09/2025
Lý do chính quyền Tổng thống Trump muốn kiểm soát căn cứ Bagram của AfghanistanLý do chính quyền Tổng thống Trump muốn kiểm soát căn cứ Bagram của Afghanistan
07:20:17 21/09/2025
Nhiều nước chuẩn bị công nhận nhà nước PalestineNhiều nước chuẩn bị công nhận nhà nước Palestine
19:02:12 21/09/2025

Tin đang nóng

"Thánh keo kiệt" showbiz quay ngoắt 180 độ khi vợ mang bầu con trai!"Thánh keo kiệt" showbiz quay ngoắt 180 độ khi vợ mang bầu con trai!
18:04:50 22/09/2025
Bài văn viết thư hỏi thăm bà gây bão MXH, được 4 điểm nhưng dân mạng phán: "Không oan tí nào!"Bài văn viết thư hỏi thăm bà gây bão MXH, được 4 điểm nhưng dân mạng phán: "Không oan tí nào!"
15:39:33 22/09/2025
Không khí lạnh sẽ làm thay đổi hướng đi, cường độ siêu bão RagasaKhông khí lạnh sẽ làm thay đổi hướng đi, cường độ siêu bão Ragasa
16:25:18 22/09/2025
Nam diễn viên bị tố chia tay đòi quà khiến cả MXH chỉ trích: "Làm thế không đáng mặt đàn ông"Nam diễn viên bị tố chia tay đòi quà khiến cả MXH chỉ trích: "Làm thế không đáng mặt đàn ông"
18:51:57 22/09/2025
Con trai Son Ye Jin - Hyun Bin là "bản sao nhí" của bố, đẹp đến mức ai cũng sốcCon trai Son Ye Jin - Hyun Bin là "bản sao nhí" của bố, đẹp đến mức ai cũng sốc
15:26:37 22/09/2025
Á hậu Việt được bạn trai doanh nhân cầu hôn, trước khi gật đầu còn hỏi 1 câu khó lườngÁ hậu Việt được bạn trai doanh nhân cầu hôn, trước khi gật đầu còn hỏi 1 câu khó lường
15:30:01 22/09/2025
Nam thần Việt xa rời showbiz: Sống thầm lặng bên vợ đại gia, nhan sắc tụt dốc, phát tướng khiến ai cũng tiếc hùi hụiNam thần Việt xa rời showbiz: Sống thầm lặng bên vợ đại gia, nhan sắc tụt dốc, phát tướng khiến ai cũng tiếc hùi hụi
17:56:56 22/09/2025
Phòng An ninh mạng mời Ưng Hoàng Phúc lên làm việc về MV nghi dính hình ảnh quảng cáo web cá độPhòng An ninh mạng mời Ưng Hoàng Phúc lên làm việc về MV nghi dính hình ảnh quảng cáo web cá độ
18:56:49 22/09/2025

Tin mới nhất

Philippines ứng phó ở mức cao nhất khi siêu bão Ragasa quét qua miền Bắc

Philippines ứng phó ở mức cao nhất khi siêu bão Ragasa quét qua miền Bắc

19:58:36 22/09/2025
Hiện quần đảo Babuyan vẫn đang được đặt trong tình trạng cảnh báo bão ở cấp độ cao. Người dân được khuyến cáo tránh xa khu vực ven biển và ven sông.
Các địa phương của Trung Quốc ứng phó khẩn cấp với siêu bão Ragasa

Các địa phương của Trung Quốc ứng phó khẩn cấp với siêu bão Ragasa

19:55:12 22/09/2025
Các bệnh viện cũng được yêu cầu triển khai các biện pháp đặc biệt để đảm bảo duy trì dịch vụ cấp cứu trong thời gian có bão. Ngoài ra, các khu vực ven biển được triển khai các biện pháp chống ngập.
Anh xem xét bỏ phí thị thực dành cho nhân tài toàn cầu

Anh xem xét bỏ phí thị thực dành cho nhân tài toàn cầu

19:54:34 22/09/2025
Nhóm chuyên trách của Thủ tướng Anh về nhân tài toàn cầu đang nghiên cứu các ý tưởng nhằm thu hút các nhà khoa học, học giả và chuyên gia kỹ thuật số hàng đầu thế giới đến Anh trong nỗ lực thúc đẩy tăng trưởng kinh tế.
Triều Tiên tuyên bố sở hữu 'vũ khí bí mật', đặt mục tiêu xây dựng cường quốc hàng hải

Triều Tiên tuyên bố sở hữu 'vũ khí bí mật', đặt mục tiêu xây dựng cường quốc hàng hải

19:45:25 22/09/2025
Đáng chú ý, ông Kim Jong Un khẳng định Triều Tiên đã đạt được thành tựu trong nghiên cứu và khoa học quốc phòng, cho phép chế tạo ra một vũ khí bí mật mới.
Thổ Nhĩ Kỳ dỡ bỏ thuế bổ sung đối với nhiều mặt hàng nhập khẩu từ Mỹ

Thổ Nhĩ Kỳ dỡ bỏ thuế bổ sung đối với nhiều mặt hàng nhập khẩu từ Mỹ

19:38:46 22/09/2025
Trong diễn biến khác, cùng ngày, Thổ Nhĩ Kỳ thông báo áp thuế 25 - 30% đối với ô tô chở khách, ngoại trừ từ Liên minh châu Âu (EU) và những quốc gia đã ký hiệp định thương mại tự do với quốc gia Á - Âu này.
Trung Quốc siết chặt kiểm soát quà tặng bánh Trung thu xa xỉ

Trung Quốc siết chặt kiểm soát quà tặng bánh Trung thu xa xỉ

19:35:06 22/09/2025
Từ đầu năm nay, lực lượng chức năng đã tăng cường quản lý thị trường bằng cách tận dụng vai trò của các hiệp hội ngành nghề để thúc đẩy việc tuân thủ pháp luật giữa người sản xuất và người bán.
Làn sóng chip AI kích hoạt đợt tăng giá cổ phiếu công nghệ Trung Quốc

Làn sóng chip AI kích hoạt đợt tăng giá cổ phiếu công nghệ Trung Quốc

19:33:22 22/09/2025
Từ Huawei Technologies đến Alibaba Group, các tập đoàn công nghệ hàng đầu Trung Quốc đang đua nhau giới thiệu những bước tiến mới nhất về chip trí tuệ nhân tạo (AI).
Israel khó đạt được mục tiêu chiến tranh và giải cứu con tin

Israel khó đạt được mục tiêu chiến tranh và giải cứu con tin

19:27:43 22/09/2025
Dù Israel đã chiếm được phần lớn lãnh thổ Gaza - khiến Hamas khó có thể tiếp tục tự xưng là chính quyền cai quản Dải Gaza - các lãnh đạo của tổ chức này vẫn giữ được ưu thế vì Israel không dám gây nguy hiểm đến 20 con tin còn sống.
Cú sốc mới cho chuỗi cung ứng toàn cầu

Cú sốc mới cho chuỗi cung ứng toàn cầu

19:27:25 22/09/2025
Nhiệm kỳ thứ hai của Tổng thống Trump đang làm rung chuyển chuỗi cung ứng, khiến chi phí thương mại tăng vọt và các doanh nghiệp toàn cầu phải xoay xở trong một môi trường ngày càng bất ổn.
Rượu vang đặc biệt cho thú cưng gây sốt

Rượu vang đặc biệt cho thú cưng gây sốt

19:21:55 22/09/2025
Muttley s Estate nhận được nhiều phản hồi tích cực từ cả những người nuôi chó và mèo. Một số chủ nhân cho biết rượu vang giúp chó của họ giảm tình trạng căng thẳng, trong khi chủ nhân khác cho biết mèo của họ trở nên năng động và vui vẻ...
Tổng thống Mỹ Donald Trump hối thúc đồng minh châu Âu ngừng mua dầu Nga

Tổng thống Mỹ Donald Trump hối thúc đồng minh châu Âu ngừng mua dầu Nga

19:21:20 22/09/2025
Trước đó, vào ngày 13/9, Tổng thống Trump đã gửi thư tới các quốc gia NATO, kêu gọi họ ngừng mua dầu của Nga. Ông cũng cho biết sẽ sẵn sàng áp đặt các lệnh trừng phạt lớn để khiến xung đột ở Ukraine khép lại.
Nhật Bản: Ban tổ chức Triển lãm Osaka Expo 2025 kêu gọi tái sử dụng gian hàng và thiết bị

Nhật Bản: Ban tổ chức Triển lãm Osaka Expo 2025 kêu gọi tái sử dụng gian hàng và thiết bị

19:17:05 22/09/2025
Thành phố Fukuyama, tỉnh Hiroshima hy vọng sẽ mua được Sân chơi cuộc sống: Nhà trưng bày sứa biển, một gian trưng bày theo chủ đề do nhạc sĩ Sachiko Nakajima thực hiện.

Có thể bạn quan tâm

Hai vợ chồng mắc loại ung thư giống nhau, phát hiện nhờ 1 thói quen

Hai vợ chồng mắc loại ung thư giống nhau, phát hiện nhờ 1 thói quen

Sức khỏe

20:36:58 22/09/2025
Qua sinh thiết bằng kỹ thuật chọc hút kim nhỏ, cả hai được xác định mắc ung thư tuyến giáp thể nhú, một loại ung thư phổ biến nhưng hiếm gặp ở cả hai vợ chồng cùng lúc.
Qua đêm nay 23/9/2025, 3 con giáp ĐẠP TRÚNG MỎ VÀNG, giàu lên nhanh chóng, tiền bạc rủng rỉnh, ngồi một chỗ đếm tiền

Qua đêm nay 23/9/2025, 3 con giáp ĐẠP TRÚNG MỎ VÀNG, giàu lên nhanh chóng, tiền bạc rủng rỉnh, ngồi một chỗ đếm tiền

Trắc nghiệm

20:35:49 22/09/2025
Qua đêm nay 23/9/2025, 3 con giáp ĐẠP TRÚNG MỎ VÀNG, giàu lên nhanh chóng, tiền bạc rủng rỉnh, ngồi một chỗ đếm tiền
Phát hoảng khi xem clip 1 Em Xinh té cầu thang

Phát hoảng khi xem clip 1 Em Xinh té cầu thang

Sao việt

20:13:44 22/09/2025
Không may bị trượt chân, té ngã đến cả dép cũng văng ra. Hoàng Duyên trượt liền mấy bậc thang trước sự hốt hoảng của Han Sara và Sơn.K.
Mắc bẫy lừa xuất cảnh, vừa lĩnh án tù, vừa bị trục xuất về nước

Mắc bẫy lừa xuất cảnh, vừa lĩnh án tù, vừa bị trục xuất về nước

Pháp luật

20:02:38 22/09/2025
Bảo thực hiện hành vi tổ chức, làm hồ sơ, thủ tục, nhận tiền và cung cấp thị thực lao động giả để đưa nhiều công dân Việt Nam xuất cảnh sang châu Âu với mục đích trốn ở lại lao động.
Minh tinh Gia Đình Là Số 1 đột quỵ, hôn mê 9 năm qua: Đứng trước cửa tử, chỉ có 0,01% khả năng tỉnh lại

Minh tinh Gia Đình Là Số 1 đột quỵ, hôn mê 9 năm qua: Đứng trước cửa tử, chỉ có 0,01% khả năng tỉnh lại

Sao châu á

19:52:54 22/09/2025
Gia đình vẫn đang duy trì sự sống bằng máy móc cho Lee Soo Na tại bệnh viện dù nữ diễn viên chỉ có 0,01% cơ hội tỉnh lại
Khoảnh khắc thót tim của Phương Ly: Suýt ngã sấp mặt, hoảng quá quên luôn kịch bản

Khoảnh khắc thót tim của Phương Ly: Suýt ngã sấp mặt, hoảng quá quên luôn kịch bản

Nhạc việt

19:40:11 22/09/2025
Sau đêm diễn, đoạn video Phương Ly suýt ngã nhanh chóng được lan truyền trên MXH. Nhiều khán giả bày tỏ sự lo lắng cho nữ ca sĩ, đồng thời nhắn nhủ ban tổ chức nên cẩn thận hơn
Bí ẩn của thời gian và tham vọng vượt qua giới hạn của loài người

Bí ẩn của thời gian và tham vọng vượt qua giới hạn của loài người

Lạ vui

19:12:54 22/09/2025
Liệu có tồn tại một chiều không gian thứ tư? Và nếu có, điều gì sẽ xảy ra nếu con người, sinh vật bị ràng buộc bởi thời gian, có thể bước chân vào thế giới đó?