Trí tuệ nhân tạo giải quyết bài toán hóc búa trong lĩnh vực sinh học
Theo The Guardian , hệ thống trí tuệ nhân tạo (AI) của Google đã giải mã thành công cấu trúc protein – yếu tố cơ bản cấu thành sự sống con người.
Mô hình protein do AlphaFold dự đoán
Chương trình AlphaFold của công ty trí tuệ nhân tạo DeepMind thuộc Google có thể dự đoán cấu trúc protein sau quá trình cuộn xoắn phức tạp. Hơn nửa thế kỷ, các nhà khoa học đã nỗ lực dự đoán cấu trúc protein nhưng thất bại, giờ đây AI đã làm được việc ngỡ như không tưởng.
Cấu trúc cuộn xoắn của protein vốn là một thách thức lớn trong lĩnh vực sinh học suốt 50 năm qua. Protein là các chuỗi axit amin có thể xoắn và uốn cong thành nhiều hình dạng khác nhau. Nhà sinh hóa đoạt giải Nobel Christian Anfinsen từng ước tính số lượng cấu trúc protein là một googol (số 1 có 300 chữ số “0″ theo sau). Hình dạng của protein sẽ xác định chức năng của hầu hết các quá trình sinh học quan trọng. Các nhà nghiên cứu có thể khám phá quy luật đằng sau những quá trình đó một khi đã hiểu cách thức protein hoạt động. Cách insulin kiểm soát lượng đường trong máu, việc kháng thể chống lại corona virus cũng do cấu trúc protein quyết định.
Trước đây, DeepMind tạo ra các phần mềm AI đánh bại con người trong những cuộc đấu cờ lẫn các trò chơi điện tử. Nhưng mục tiêu cuối cùng của DeepMind không phải là chứng tỏ AI đã vượt qua con người. Thay vào đó, những ván đấu với con người là một phương pháp “huấn luyện” cho AI, một khi đã đủ mạnh, AI sẽ được sử dụng để giải quyết các vấn đề thiết thực trong cuộc sống.
Video đang HOT
Thành quả của AlphaFold có thể được sử dụng để tìm ra giải pháp cho dịch Covid-19
Các nhà nghiên cứu ở DeepMind đã đào tạo AlphaFold trên cơ sở dữ liệu công cộng chứa khoảng 170.000 trình tự protein và hình dạng của chúng. Chạy trên 100-200 đơn vị xử lý đồ họa, quá trình đào tạo kéo dài vài tuần.
DeepMind tăng tốc AlphaFold bằng cách đưa phần mềm tham gia vào “thế vận hội protein” hai năm một lần được gọi là CASP (Critical Assessment of Protein Structure Prediction – Đánh giá Quan trọng về Dự đoán cấu trúc Protein). Các thí sinh tham gia sẽ được cung cấp trình tự axit amin cho khoảng 100 protein để dự đoán cấu trúc của chúng. Kết quả của các nhóm sử dụng máy tính được đối chiếu với kết quả của các nhóm làm việc trong phòng thí nghiệm.
AlphaFold không chỉ vượt trội hơn các phần mềm khác mà còn đạt độ chính xác tương đương các phương pháp dùng trong phòng thí nghiệm, vốn đòi hỏi nhiều thời gian và công sức. Khi xếp hạng, AlphaFold có điểm trung bình là 92,5/100. Theo đó, 90 là số điểm của các phương pháp thực nghiệm do con người tiến hành. Đối diện với các protein khó nhằn nhất, điểm số trung bình của AlphaFold giảm xuống nhưng vẫn ở mức 87.
Nhà sáng lập Demis Hassabis
Demis Hassabis – nhà sáng lập và giám đốc điều hành của DeepMind cho biết: “Sự kiện đánh dấu một thời khắc quan trọng trong lĩnh vực này. Các thuật toán giờ đã đủ chín muồi và đủ mạnh để có thể áp dụng cho những vấn đề khoa học đầy thách thức”.
Bước đột phá này sẽ giúp các nhà nghiên cứu tìm hiểu cơ chế gây bệnh, dự đoán mức độ hiệu quả của các loại thuốc, tạo ra các loại cây trồng giàu dinh dưỡng và phát triển “enzyme xanh” có thể giải quyết vấn đề ô nhiễm nhựa. Hiện các nhà khoa học đã bắt đầu sử dụng thành quả của AlphaFold để tìm hiểu bệnh sốt rét, bệnh ngủ châu Phi và bệnh do nhiễm ký sinh trùng leishmaniasis.
Trí tuệ nhân tạo vẫn chưa có khả năng suy luận như con người
Bài kiểm tra đánh giá trình độ ngôn ngữ tại Đại học Nam California cho thấy trí tuệ nhân tạo (AI) chưa thể soạn những câu văn hợp lý và đúng ngữ cảnh, theo Techxplore.
Khả năng vận dụng ngôn ngữ của AI còn nhiều thiếu sót
Xử lý ngôn ngữ tự nhiên (Natural language processing - NLP) là một nhánh quan trọng của ngành trí tuệ nhân tạo, tập trung vào việc nghiên cứu tương tác giữa máy tính và ngôn ngữ tự nhiên của con người, với mục tiêu giúp máy tính có thể thực hiện những nhiệm vụ liên quan đến ngôn ngữ.
Trong bài báo công bố vào ngày 16.11 tại hội nghị Phát hiện Phương pháp Thực nghiệm trong Xử lý Ngôn ngữ Tự nhiên (Findings of Empirical Methods in Natural Language Processing - EMNLP), trợ lý giáo sư Xiang Ren và học trò Yuchen Lin trình bày thử nghiệm mới nhất của họ trong lĩnh vực NLP. Hai thầy trò đưa ra một loạt danh từ và động từ rồi giao cho máy tính soạn những câu mô tả tình huống hằng ngày. Chẳng hạn, với tập hợp từ "chó", "đĩa", "ném", "bắt", máy tính đặt câu: "hai con chó ném đĩa vào nhau". Sau nhiều lần thử nghiệm, Xiang Ren và học trò nhận thấy rằng các câu mà máy tính tạo ra đều đúng ngữ pháp nhưng sai logic.
So sánh kết quả đặt câu giữa con người và máy tính. Những câu máy tính đặt là: "Con chó ném đĩa vào cầu thủ bóng đá", "Hai con chó ném đĩa vào nhau", "Một con chó ném đĩa và một con chó khác bắt đĩa"...
Bài kiểm tra này dựa trên giả định rằng trí tuệ nhân tạo vẫn chưa nắm vững những ý niệm thông thường như người ném đĩa và chó bắt đĩa. Mặt khác, một người có khả năng suy luận bình thường sẽ biết rằng hai con chó không thể ném đĩa vào nhau.
Yuchen Lin nhận định: "Robot cần hiểu các kịch bản tự nhiên trong cuộc sống hằng ngày trước khi thực hiện những hành động tương tác với con người. Con người có được khả năng đặt câu nhờ hiểu và ứng dụng các khái niệm mà họ nhận ra trong môi trường xung quanh. Khi AI đạt được khả năng này thì đây sẽ là một cột mốc quan trọng trong sự phát triển của nhân loại. Nhưng chúng tôi muốn kiểm tra xem máy tính có thể đạt được khả năng suy luận phổ quát hay không".
Hiện giờ AI đã có thể viết báo nhưng Yuchen Lin cho rằng chúng chỉ bắt chước từ những gì đã học. Nói cách khác, khả năng suy luận còn quan trọng hơn kiến thức về ngôn ngữ. Nếu không có khả năng suy luận, rất dễ xảy ra những tình huống như chủ nhân yêu cầu robot lấy sữa nóng nhưng robot không hiểu nên lấy một cốc sữa hay cả hộp sữa.
Những bài báo và kiểm tra trắc nghiệm trước đó chưa phản ánh toàn diện khả năng của AI
Hai thầy trò đã tạo chương trình CommonGen để kiểm tra nhiều mô hình máy tính khác nhau. CommonGen tích hợp một tập dữ liệu gồm 35.141 khái niệm, có thể tạo ra 77.449 câu. Ngay cả mô hình ngôn ngữ hoạt động tốt nhất cũng chỉ đạt tỉ lệ chính xác là 31,6%, trong khi đó tỉ lệ này ở con người lên đến 63,5%. Xiang Ren và Yuchen Lin mong rằng chương trình của họ sẽ hỗ trợ các nghiên cứu liên quan đến NLP trong tương lai.
Bộ đôi cũng cho rằng những bài kiểm tra của các nhà nghiên cứu đi trước chủ yếu là làm trắc nghiệm nên không đủ độ khó đối với máy tính. Ví dụ, khi họ đặt câu hỏi là "Người lớn dùng keo dính ở đâu?" với ba đáp án A: phòng học, B: văn phòng, C: ngăn bàn thì các máy tính đều dễ dàng chọn đúng đáp án B. Còn các bài kiểm tra của CommonGen thì đòi hỏi khả năng suy luận phức tạp hơn.
"Bằng cách giới thiệu khả năng suy luận và kiến thức chuyên sâu cho máy tính, tôi tin rằng một ngày nào đó chúng ta sẽ thấy các AI như Samantha trong bộ phim Her , có thể phản ứng và tương tác với chúng ta một cách tự nhiên", Yuchen Lin chia sẻ.
AI làm mới môn cờ vua cổ điển Kỳ thủ Vladimir Kramnik đang hợp tác cùng DeepMind nghiên cứu các biến thể của cờ vua để tạo ra một phiên bản cờ sáng tạo hơn. Cờ vua được biết đến là một trò chơi có luật chơi khá cứng nhắc, tuy nhiên đối với Vladimir Kramnik, một trong những đại kiện tướng cờ vua số một thế giới, đây là một...