Mô hình AI mới dự đoán phản ứng hóa học chính xác nhờ bảo toàn khối lượng
Một nhóm nghiên cứu tại MIT đã tìm ra cách kết hợp các ràng buộc vật lý vào mô hình AI dự đoán phản ứng hóa học, từ đó đưa ra dự đoán thực tế cho nhiều loại phản ứng một cách chính xác, đồng thời tuân thủ các nguyên tắc vật lý trong thế giới thực.
Nhiều nỗ lực đã được thực hiện nhằm khai thác sức mạnh của trí tuệ nhân tạo (AI) và các mô hình ngôn ngữ lớn (LLM) để dự đoán kết quả của những phản ứng hóa học mới. Tuy nhiên, thành công còn hạn chế, phần lớn vì các mô hình này chưa được gắn chặt với những nguyên tắc vật lý nền tảng như định luật bảo toàn khối lượng.
Giờ đây, một nhóm nghiên cứu tại MIT đã tìm ra cách kết hợp các ràng buộc vật lý vào mô hình dự đoán phản ứng, từ đó cải thiện đáng kể độ chính xác và độ tin cậy của kết quả.
Hệ thống FlowER (Flow matching for Electron Redistribution), cho phép theo dõi chi tiết sự dịch chuyển của các electron, đảm bảo không có electron nào bị thêm hoặc mất một cách giả tạo. Ảnh: MIT News
Công trình này được công bố ngày 20/8 trên tạp chí Nature, do Joonyoung Joung (hiện là Trợ lý giáo sư tại Đại học Kookmin, Hàn Quốc), cựu kỹ sư phần mềm Mun Hong Fong (nay tại Đại học Duke), nghiên cứu sinh kỹ thuật hóa học Nicholas Casetti , nghiên cứu sau tiến sĩ Jordan Liles, sinh viên vật lý Ne Dassanayake và tác giả chính Connor Coley – Giáo sư phát triển sự nghiệp lớp 1957 tại Khoa Kỹ thuật Hóa học và Khoa Khoa học & Kỹ thuật Điện – đồng tác giả.
Vì sao việc dự đoán phản ứng quan trọng?
“Dự đoán kết quả phản ứng là một nhiệm vụ rất quan trọng,” Joung giải thích. Chẳng hạn, nếu muốn tạo ra một loại thuốc mới, “bạn cần biết cách tổng hợp nó. Điều này đòi hỏi phải xác định được sản phẩm nào có khả năng xuất hiện” từ tập hợp chất đầu vào.
Những nỗ lực trước đây thường chỉ nhìn vào dữ liệu đầu vào và đầu ra, mà bỏ qua các bước trung gian cũng như các ràng buộc vật lý như việc không thể tự nhiên tạo thêm hay mất đi khối lượng.
Joung chỉ ra rằng, mặc dù các LLM như ChatGPT đã đạt được nhiều thành công trong nghiên cứu, chúng không có cơ chế để đảm bảo kết quả tuân theo các quy luật vật lý. “Nếu không bảo toàn các ‘token’ (tương ứng với nguyên tử), mô hình LLM sẽ tự ý tạo ra hoặc xóa bỏ nguyên tử trong phản ứng,” ông nói. “Điều này giống giả kim thuật hơn là khoa học.”
Giải pháp FlowER : Dựa trên nền tảng cũ, áp dụng cho công nghệ mới
Để khắc phục, nhóm nghiên cứu sử dụng một phương pháp từ thập niên 1970 của nhà hóa học Ivar Ugi – ma trận liên kết điện tử (bond-electron matrix) – nhằm biểu diễn electron trong phản ứng.
Dựa trên đó, họ phát triển chương trình FlowER (Flow matching for Electron Redistribution), cho phép theo dõi chi tiết sự dịch chuyển của các electron, đảm bảo không có electron nào bị thêm hoặc mất một cách giả tạo.
Ma trận này dùng giá trị khác 0 để biểu diễn liên kết hoặc cặp electron tự do, và 0 cho trường hợp ngược lại. “Điều này giúp chúng tôi bảo toàn cả nguyên tử lẫn electron,” Fong giải thích. Đây là yếu tố then chốt để đưa tính bảo toàn khối lượng vào mô hình.
Bằng chứng ban đầu nhưng đầy hứa hẹn
Video đang HOT
Theo Coley, hệ thống hiện tại mới chỉ là minh chứng – một bằng chứng khái niệm cho thấy phương pháp “flow matching” rất phù hợp để dự đoán phản ứng hóa học.
Mặc dù được huấn luyện với dữ liệu từ hơn một triệu phản ứng hóa học (thu thập từ Cơ quan Sáng chế Mỹ), cơ sở dữ liệu này vẫn thiếu các phản ứng có kim loại và phản ứng xúc tác.
“Chúng tôi rất phấn khích vì hệ thống có thể đưa ra dự đoán đáng tin cậy về cơ chế phản ứng,” Coley nói. “Nó bảo toàn khối lượng, bảo toàn electron, nhưng chắc chắn còn nhiều hướng mở rộng và nâng cao độ bền vững trong những năm tới.”
Hiện mô hình đã được công khai trên GitHub . Coley kỳ vọng nó sẽ là công cụ hữu ích trong việc đánh giá khả năng phản ứng và xây dựng sơ đồ phản ứng.
Mở nguồn dữ liệu và tiềm năng ứng dụng rộng
“Chúng tôi công khai tất cả – từ mô hình, dữ liệu cho đến bộ dữ liệu trước đó do Joung xây dựng liệt kê chi tiết các bước cơ chế của phản ứng đã biết,” Fong cho biết.
Theo nhóm, FlowER có thể bằng hoặc vượt các phương pháp hiện có trong việc tìm cơ chế chuẩn, đồng thời tổng quát hóa cho những loại phản ứng chưa từng thấy. Tiềm năng ứng dụng trải dài từ hóa dược, khám phá vật liệu, nghiên cứu cháy nổ, hóa học khí quyển cho tới hệ thống điện hóa.
Trong so sánh với các hệ thống khác, Coley nhấn mạnh: “Với lựa chọn kiến trúc mà chúng tôi sử dụng, chúng tôi đạt được bước nhảy vọt về độ hợp lệ và tính bảo toàn, đồng thời duy trì hoặc cải thiện một chút về độ chính xác.”
Điểm độc đáo, theo Coley, là mô hình không “bịa ra” cơ chế, mà suy luận chúng dựa trên dữ liệu thực nghiệm từ văn liệu sáng chế. “Chúng tôi đang trích xuất cơ chế từ dữ liệu thí nghiệm – điều chưa từng được thực hiện và chia sẻ ở quy mô này.”
Bước tiếp theo
Nhóm nghiên cứu dự định mở rộng hiểu biết của mô hình về kim loại và chu trình xúc tác. “Chúng tôi mới chỉ chạm tới bề nổi,” Coley thừa nhận.
Trong dài hạn, ông tin rằng hệ thống này có thể hỗ trợ khám phá các phản ứng phức tạp mới, cũng như làm sáng tỏ các cơ chế chưa từng được biết đến. “Tiềm năng lâu dài là rất lớn, nhưng đây mới chỉ là bước khởi đầu.”
Nghiên cứu được hỗ trợ bởi Liên sort học máy cho khám phá và tổng hợp dược phẩm (Machine Learning for Pharmaceutical Discovery and Synthesis consortium) và Quỹ Khoa học Quốc gia Mỹ (NSF).
Vì sao các tập đoàn công nghệ trả hàng triệu USD để thu hút nhân tài AI?
Cuộc chạy đua trong ngành trí tuệ nhân tạo (AI) đang nóng lên và khi các tập đoàn công nghệ lớn tranh nhau giành vị trí dẫn đầu và đưa ra mức đãi ngộ hàng triệu USD để thu hút một nhóm nhỏ chuyên gia trong "cuộc chiến giành nhân tài AI".
Theo kênh CNBC, các công ty công nghệ lớn như Meta, Microsoft và Google đang cạnh tranh quyết liệt để có được những nhà nghiên cứu AI hàng đầu nhằm củng cố bộ phận trí tuệ nhân tạo và thống trị thị trường trị giá hàng tỷ USD này.
Giám đốc điều hành Meta Mark Zuckerberg gần đây đã khởi động một chiến dịch tuyển dụng tốn kém nhằm mở rộng phòng thí nghiệm AI Superintelligence Labs mới của công ty. Trong đó có sự kiện chiêu mộ đồng sáng lập Scale AI, ông Alexander Wang. Đây là một phần trong khoản đầu tư 14 tỷ USD vào công ty Scale AI.
Trong khi đó, Giám đốc điều hành OpenAI Sam Altman cho biết gần đây Meta đã tìm cách lôi kéo nhân tài hàng đầu của OpenAI bằng khoản tiền thưởng ký hợp đồng 100 triệu USD cùng các gói thù lao hấp dẫn hơn.
Google cũng tham gia cuộc chiến này khi lôi kéo ông Varun Mohan, đồng sáng lập kiêm Giám đốc điều hành công ty lập trình AI Windsurf, gia nhập Google DeepMind trong một thương vụ trị giá 2,4 tỷ USD. Trong khi đó, Microsoft AI âm thầm tuyển dụng hơn 20 nhân viên của Google DeepMind.
Ông Alexandru Voica, Giám đốc phụ trách đối ngoại và chính sách của nền tảng video AI Synthesia, nói: "Trong lĩnh vực kỹ sư phần mềm, đã từng có sự cạnh tranh gay gắt về nhân tài cách đây 15 năm. Nhưng khi trí tuệ nhân tạo ngày càng phát triển, số lượng các nhà nghiên cứu và kỹ sư chuyên sâu trong lĩnh vực này vẫn tương đối ổn định".
Ông Voica bổ sung: "Nhu cầu hiện nay đã tăng vọt, trong khi nguồn cung gần như không thay đổi, dẫn đến tình trạng lạm phát lương".
Ông Voica cho rằng các gói thù lao nhiều triệu USD là hiện tượng "chưa từng có trong ngành này".
Chi phí xây dựng mô hình AI lên tới hàng tỷ USD
Mức lương phình to của chuyên gia đi kèm với chi phí hàng tỷ USD để xây dựng các mô hình AI - công nghệ đứng sau những sản phẩm quen thuộc như ChatGPT.
Có nhiều loại công ty AI khác nhau. Một số như Synthesia, Cohere, Replika và Lovable tập trung xây dựng sản phẩm; trong khi OpenAI, Anthropic, Google và Meta xây dựng và huấn luyện các mô hình ngôn ngữ lớn.
Ông Voica nói: "Chỉ có một vài công ty đủ khả năng tài chính để xây dựng các mô hình kiểu này. Đây là lĩnh vực đòi hỏi vốn đầu tư rất lớn. Bạn phải chi hàng tỷ USD và không nhiều công ty có sẵn hàng tỷ USD để đầu tư. Do đó, nếu tôi chi 1 tỷ USD cho một mô hình thì 10 triệu USD cho một kỹ sư chỉ là khoản đầu tư nhỏ".
Giám đốc điều hành Anthropic, ông Dario Amodei, nói với tạp chí Time năm 2024 rằng ông dự kiến chi phí huấn luyện các mô hình AI tiên tiến sẽ lên tới 1 tỷ USD trong năm đó.
Viện AI của Đại học Stanford gần đây công bố báo cáo cho thấy chi phí ước tính để xây dựng một số mô hình AI giai đoạn 2019 - 2024. Ví dụ, GPT-4 của OpenAI tốn 79 triệu USD năm 2023, trong khi Gemini 1.0 Ultra của Google tốn 192 triệu USD. Mô hình Llama 3.1-405B của Meta tốn 170 triệu USD để xây dựng năm 2024.
Ông Voica bình luận: "Các công ty xây dựng sản phẩm phải trả tiền để dùng các mô hình sẵn có và phát triển thêm dựa trên đó. Vì thế, chi phí vốn thấp hơn và áp lực tài chính không quá nặng nề. Nơi mức lương nóng nhất là các công ty trực tiếp xây dựng mô hình".
Chuyên gia AI trở nên khan hiếm
Theo dữ liệu của Indeed, mức lương trung bình của kỹ sư học máy ở Mỹ năm 2025 là 175.000 USD.
Ông Ben Litvinoff, Phó Giám đốc tại công ty tuyển dụng công nghệ Robert Walters, cho biết: "Nhu cầu đã tăng mạnh cả về phân tích AI lẫn học máy, đặc biệt là những người làm việc với mô hình ngôn ngữ lớn và triển khai công nghệ AI tiên tiến hơn".
Ông nói thêm, nhóm nhân tài này gồm những chuyên gia kỳ cựu đã làm việc nhiều năm trong ngành cũng như các nhà khoa học AI vừa hoàn thành bằng tiến sĩ tại 5 hay 6 trường đại học hàng đầu thế giới, rồi ngay khi tốt nghiệp đã được các tập đoàn lớn săn đón.
Điều này dẫn đến những khoản chi khổng lồ. Theo báo chí, ông Zuckerberg từng đề nghị trả 250 triệu USD cho thiên tài AI 24 tuổi Matt Deitke, người đã bỏ chương trình tiến sĩ khoa học máy tính tại Đại học Washington.
Meta dẫn CNBC đến phát biểu của ông Zuckerberg trên The Information, nơi ông chủ Facebook nói rằng có một "khoản phí tuyệt đối" để sở hữu nhân tài hàng đầu.
Ông Zuckerberg nói với tạp chí công nghệ này: "Nhiều thông tin cụ thể được đưa ra không hoàn toàn chính xác. Nhưng đây thực sự là một thị trường nóng. Có một số ít nhà nghiên cứu giỏi nhất đang được tất cả phòng thí nghiệm tranh giành. Khoản tiền dùng để tuyển dụng những người này vẫn còn nhỏ so với tổng đầu tư, đặc biệt khi nói đến siêu trí tuệ".
Ông Litvinoff ước tính, tại London, mức lương của kỹ sư học máy và kỹ sư chính hiện dao động từ 140.000 đến 300.000 bảng Anh mỗi năm. Tại Mỹ, mức lương trung bình của kỹ sư học máy là 175.000 USD, có thể đạt gần 300.000 USD ở cấp cao.
Công ty khởi nghiệp và ngành truyền thống bị bỏ lại phía sau
Khi các tập đoàn công nghệ tiếp tục hút hết chất xám trong lĩnh vực AI nhờ mức lương khổng lồ, nguy cơ các công ty khởi nghiệp bị bỏ lại ngày càng rõ ràng.
Ông Voica nhận định: "Một số công ty khởi nghiệp đang cố cạnh tranh trong mảng xây dựng mô hình rất khó có lối đi, bởi xây dựng mô hình quá đắt đỏ, trong khi các công ty mua lại mô hình không chắc đủ khả năng trả chi phí tương ứng".
Ông Mark Miller, nhà sáng lập kiêm Giám đốc điều hành Insurevision.ai, gần đây nói với Startups Magazine rằng cuộc chiến giành nhân tài này cũng tạo ra một khoảng cách cơ hội lớn trong các ngành truyền thống.
Ông Miller nói: "Toàn bộ ngành như bảo hiểm, y tế và logistics không thể cạnh tranh về lương. Họ cần đổi mới nhưng không thể tiếp cận nhân tài. Tình hình hiện tại hoàn toàn không bền vững. Không thể để một ngành giữ hết nhân tài trong khi các ngành khác cạn kiệt".
Ông Voica cho biết các chuyên gia AI sẽ phải lựa chọn: hoặc nhận mức lương cao nhưng vướng bộ máy cồng kềnh tại tập đoàn công nghệ lớn, hoặc tham gia công ty khởi nghiệp với mức lương thấp hơn nhưng có nhiều quyền sở hữu và tác động hơn.
Ông nói: "Trong một công ty lớn, bạn chỉ như một bánh răng trong guồng máy, còn ở công ty khởi nghiệp, bạn có thể tạo ảnh hưởng lớn và cảm nhận rõ rệt tác động từ công việc của mình".
Tuy nhiên, cho đến khi chi phí xây dựng mô hình AI giảm xuống, mức lương cao cho nhân tài AI nhiều khả năng vẫn sẽ duy trì.
Ông Voica nói thêm: "Miễn là các công ty phải chi hàng tỷ USD để xây dựng mô hình, họ sẽ chi hàng chục, thậm chí hàng trăm triệu USD để thuê kỹ sư. Nếu ngày mai chi phí xây dựng mô hình giảm 10 lần, tôi kỳ vọng lương cũng sẽ giảm theo".
Mô hình LLM phản hồi sai nếu bị dẫn dắt bằng thủ thuật tâm lý Một nghiên cứu mới cho thấy các mô hình LLM (ngôn ngữ lớn) có thể bị thao túng để vượt qua các rào cản đạo đức bằng kỹ thuật tâm lý. Theo ArsTechnica , một nhóm nhà nghiên cứu vừa công bố kết quả thử nghiệm cho thấy các mô hình ngôn ngữ lớn (LLM), bao gồm những hệ thống như ChatGPT, có...











Tiêu điểm
Tin đang nóng
Tin mới nhất

CTO Meta: Apple không cho gửi iMessage trên kính Ray-Bans Display

Alibaba tái xuất với định hướng AI sau giai đoạn hụt hơi với thương mại điện tử

Google sắp bổ sung Gemini vào trình duyệt Chrome trên thiết bị di động

Trí tuệ nhân tạo: DeepSeek mất chưa đến 300.000 USD để đào tạo mô hình R1

Người dùng Apple Watch đã có thể sử dụng tính năng cảnh báo huyết áp

Cái tên bất ngờ lọt vào top 10 điện thoại bán chạy nhất Quý II/2025

iOS 26 vừa phát hành có gì mới?

Apple nói gì về việc iOS 26 khiến iPhone cạn pin nhanh?

Phát triển AI dự đoán bệnh tật trước nhiều năm

Nghiên cứu mới tiết lộ bí quyết thành công của DeepSeek

Giúp sinh viên hiểu chuyển đổi xanh: Chìa khóa cho đổi mới sáng tạo bền vững

Cách cập nhật iOS 26 nhanh chóng và dễ dàng trên iPhone
Có thể bạn quan tâm

Diễn viên Phương Oanh lập vi bằng
Sao việt
00:22:41 22/09/2025
Phát bực vì Quỳnh Kool
Phim việt
00:07:33 22/09/2025
Vbiz mới có 1 cặp đôi visual chấn động: Nhà gái là Hoa hậu đẹp mê tơi, nhà trai đố tìm nổi góc chết
Hậu trường phim
00:01:20 22/09/2025
'Cậu bé Cá Heo 2' tung trailer: Hé lộ bí mật thân phận và bản đồ phiêu lưu 7 đại dương náo nhiệt nhất tháng 10
Phim âu mỹ
23:52:21 21/09/2025
Giả danh tu sĩ đi bán nhang, kêu gọi quyên góp từ thiện để trục lợi
Pháp luật
23:30:06 21/09/2025
Phái đoàn Hạ viện Mỹ lần đầu thăm Trung Quốc từ năm 2019
Thế giới
23:26:14 21/09/2025
Ngô Kiến Huy bị đàn em "kháy" liên tục, Negav còn thẳng thừng nói 1 câu gây tranh cãi
Tv show
23:19:53 21/09/2025
Nam diễn viên Trần Quang Tiền tử vong tại nhà
Sao châu á
23:13:45 21/09/2025
Bão Ragasa mạnh lên siêu bão, sẽ đổ bộ đất liền Quảng Ninh - Hà Tĩnh
Tin nổi bật
22:03:27 21/09/2025
Messi nới rộng kỷ lục ghi bàn
Sao thể thao
21:52:32 21/09/2025