Kinh ngạc con chip AI có thể mô phỏng tương lai còn “nhanh hơn cả các định luật vật lý”
Sức mạnh mô phỏng của con chip AI này một lần nữa lại khiến người ta lại nghi ngờ, liệu thực tại có thật hay chỉ là một hình ảnh mô phỏng của máy tính?
Năm ngoái, chip AI Cerebras CS-1 đã trở nên nổi tiếng thế giới về kích thước kỷ lục và số lượng bóng bán dẫn khổng lồ ở trên nó. Với diện tích 462 cm 2 , chứa 1,2 nghìn tỷ bóng bán dẫn, con chip AI này có kích thước gần như chiếm trọn một đĩa wafer silicon, cũng như lớn gấp hàng chục lần so với các bộ xử lý thông thường. Không chỉ mang kích thước ấn tượng, sức mạnh bộ xử lý này cũng khiến các nhà nghiên cứu kinh ngạc.
Một bài kiểm tra mới đây cho thấy con chip máy tính lớn nhất thế giới này có thể dự đoán những gì xảy ra trong tương lai ” nhanh hơn các định luật vật lý tạo ra cùng kết quả .”
Cụ thể hơn, con chip này nhanh gấp 200 lần siêu máy tính Joule Supercomputer – siêu máy tính đứng thứ 82 trong top 500 máy tính mạnh nhất thế giới – trong khả năng mô phỏng quá trình đốt cháy nhiên liệu trong nhà máy nhiệt điện. Nó nhanh đến mức có thể phân tích hơn 1 triệu biến số khác nhau – từ dao động của nhiệt độ cho đến chuyển động ba chiều của dòng khí – để cho ra kết quả theo thời gian thực trước cả khi điều đó xảy ra.
Con chip AI có thể mô phỏng tương lai
Đây chính là lý do vì sao Cerebras CS-1 được mô tả như ” hệ thống tính toán AI mạnh nhất thế giới ” hiện nay. Nó có số bóng bán dẫn nhiều gấp 22 lần so với chip Nvidia A100 80GB, GPU mạnh mẽ với khoảng 54 tỷ bóng bán dẫn vốn được thiết kế cho các hệ thống siêu máy tính cao cấp nhất hiện nay.
Cerebras cho biết trên blog của mình: ” CS-1 là hệ thống đầu tiên chứng minh có đủ hiệu năng để mô phỏng một triệu tế bào chất lỏng nhanh hơn cả thực tế. Điều này nghĩa là khi sử dụng CS-1 để mô phỏng một nhà máy điện dựa trên dữ liệu về các điều kiện hoạt động hiện tại, con chip có thể cho bạn biết điều gì sẽ xảy ra trong tương lai nhanh hơn cả các định luật vật lý tạo ra cùng kết quả .”
Nó tương tự như việc dựa vào lượng nhiên liệu và luồng khí được đưa vào máy phát, con chip AI này sẽ cho biết chính xác máy phát điện trong nhà máy sẽ tạo ra bao nhiêu điện năng – trước cả khi cỗ máy hoàn thành chu kỳ làm việc của mình. Thông thường các siêu máy tính khác chỉ có thể cho ra kết quả gần đúng so với phản ứng đã diễn ra.
Là thành quả từ việc hợp tác giữa Phòng thí nghiệm Công nghệ Năng lượng Quốc gia thuộc Bộ Năng lượng Mỹ với startup Wafer Scale Engine (WSE), chip AI này đi theo hướng tiếp cận khác với truyền thống.
Video đang HOT
Trong khi các hệ thống siêu điện toán thông thường là các chip được cắt nhỏ từ miếng wafer và ghép lại với nhau, Cerebras chọn cách ” làm ra một con chip khổng lồ, duy nhất ” với ” mỗi phần của con chip, giống như một nhân xử lý, được kết nối với nhau theo một cách tinh vi “, để các nhân có thể hoạt động ở tốc độ cao cùng lúc với nhau.
Tổng cộng, CS-1 có khoảng 400.000 nhân AI, cho khả năng tính toán nhanh hơn gấp 10.000 lần so với một GPU đơn lẻ.
Cỗ máy tính được trang bị con chip AI Cerebras CS-1
Sức mạnh tính toán khổng lồ của con chip này sẽ được sử dụng để huấn luyện các mạng neural nhân tạo và thực hiện những phép tính mô phỏng có độ chính xác cao của thế giới thực, ví dụ, mô phỏng cách thức tối ưu khi trực thăng hạ cánh bằng cách mô hình hóa dòng không khí xung quanh động cơ của nó.
Thế nhưng công ty vẫn chưa có ý định dừng lại ở đây. WSE cho biết, họ đang dự định một con chip thế hệ kế tiếp với khoảng 2,6 nghìn tỷ bóng bán dẫn, nhiều hơn gấp đôi hiện tại, nhằm mở đường cho khả năng mô phỏng được những thế giới thực phức tạp hơn nữa.
Liệu thế giới này có phải một hình ảnh mô phỏng?
Sức mạnh tính toán của con chip này một lần nữa khiến chúng ta lại nghi ngờ về bản chất của thực tại: Liệu những gì chúng ta đang thấy hàng ngày có phải thực tại thật hay là một mô phỏng của máy tính – tương tự như điều xảy ra trong bộ phim Ma Trận?
Năm 2003, nhà triết học Nick Bostrom từng đưa ra Giả thuyết Mô phỏng, với tuyên bố trong tương lai, những sức mạnh điện toán khổng lồ có thể được sử dụng để mô phỏng thực tế vũ trụ.
Giả thuyết này trở nên nổi tiếng nhờ tỷ phú công nghệ Elon Musk, người tuyên bố rằng có đến 99,99% khả năng vũ trụ chúng ta đang sinh sống là giả lập máy tính.
“40 năm trước, chúng ta mới chỉ có Pong. Giờ 40 năm sau, chúng ta có mô phỏng 3D, thực tế ảo với hàng triệu người chơi cùng lúc và nó ngày càng tốt hơn sau mỗi năm … Nếu giả định rằng sự cải thiện này tiếp tục được duy trì, sau này các trò chơi sẽ trở nên không thể phân biệt được với thực tế.”
Rõ ràng việc mô phỏng thực tế trên quy mô vũ trụ vẫn còn một chặng đường dài phía trước và có thể không đến từ việc sử dụng các máy tính truyền thống. Tuy nhiên, các tiến bộ của những máy tính lượng tử siêu mạnh có thể biến điều này thành hiện thực.
Nếu nó chứng minh điều này là có thể – dù chỉ trong một quy mô hạn chế – về lý thuyết, công nghệ hoàn toàn có thể dự báo một cách chính xác tương lai. Nếu một công nghệ nào đó có thể dự báo chính xác tương lai, nó hoàn toàn có thể mô phỏng lại hiện thực đó và hiển thị trước mắt chúng ta – như những gì chúng ta trong các bộ phim viễn tưởng.
Những biến số mới trong cuộc chiến giành quyền thống trị chip siêu máy tính
Trong vòng 5 năm trở lại đây, Big Data và các ứng dụng công nghệ mới lần lượt xuất hiện, do đó, các siêu máy tính mạnh nhất đã bắt đầu tăng cường sử dụng chip chuyên nghiệp.
Tháng 4/2020, Mellanox, công ty công nghệ mạng trung tâm dữ liệu hàng đầu của Israel, cuối cùng đã được Nvidia mua lại với giá gần 7 tỷ USD, mở ra hai sự kiện lớn gây chú ý trong ngành sau hơn nửa năm "im hơi lặng tiếng". Ngay sau đó, Eyal Waldman, Founder/ CEO của công ty này đã tuyên bố từ chức và để lại một tuyên bố: "Khi thỏa thuận này được ký kết, tôi biết mình sẽ ra đi. Tôi đã dùng nhiều năm để thành lập công ty và đưa ra tất cả các quyết định, không phải vì vị trí thứ hai".
Chỉ ít hôm trước, Mellanox đã được NVIDIA tích hợp vào một sản phẩm kiến trúc kết nối mạng mới-NVIDIA Mellanox 400G InfiniBand. Kể từ đó, đây sẽ là đơn vị đầu tiên tham gia lực lượng tinh nhuệ nhất trong thị trường trung tâm dữ liệu - thị trường siêu máy tính với tư cách là "bạn đồng hành GPU".
Nvidia đã triển khai hệ thống DGX, bao gồm A10080GB tại Trung tâm Siêu máy tính ở Cambridge, Vương quốc Anh
Kiến trúc của các sản phẩm NVIDIA Mellanox 400G InfiniBand, nói một cách đơn giản, nó là một thành phần dùng để kết nối các máy chủ khác với hệ sinh thái NVIDIA. Tại Hội nghị Siêu máy tính Toàn cầu vừa qua, NVIDIA một lần nữa lập kỷ lục hiệu suất mới cho dòng sản phẩm GPU mạnh nhất - bộ tăng tốc doanh nghiệp A100.
GPU A100 thế hệ mới sẽ tăng bộ nhớ băng thông cao lên 80GB, gấp đôi so với thế hệ trước. Điều này có nghĩa là hơn 2TB băng thông bộ nhớ mỗi giây sẽ cho phép dữ liệu lưu chuyển nhanh hơn giữa bộ nhớ và GPU, để "chịu đựng" áp lực mà các nhà nghiên cứu mang lại trong việc xây dựng các mô hình và bộ dữ liệu AI lớn hơn. "Để tiếp tục phá vỡ giới hạn trên về kết quả nghiên cứu của AI và máy tính hiệu năng cao (HPC), các nhà khoa học phải xây dựng các mô hình lớn hơn và phức tạp hơn, vì vậy chúng cần dung lượng bộ nhớ tương ứng và băng thông cao hơn trước đây", Bryan Catanzaro, phó chủ tịch NVIDIA đã chỉ ra.
Trên thực tế, ngoài việc thay đổi kiến trúc của các sản phẩm chip và "kết nối" hàng trăm nghìn con chip ở dạng hiệu quả nhất, bộ vi xử lý này còn có thể giải quyết nhu cầu tính toán khổng lồ của các nhà khoa học. Đây chính là mục đích mua lại Mellanox của NVIDIA. Vai trò của NVIDIA Mellanox 400G InfiniBand là "kết nối" hàng chục nghìn CPU, GPU và các loại chip khác trong một siêu máy tính. Trong khi tối đa hóa hiệu suất, hiệu suất truyền dữ liệu của mỗi chip không được có quá nhiều thất thoát.
Thị trường siêu máy tính, "miếng bánh ngon" không thể bỏ qua
Trong danh sách Top500 siêu máy tính toàn cầu được công bố vào tháng 6/2020, siêu máy tính của Phòng thí nghiệm quốc gia Oak Ridge, xếp thứ hai tại Mỹ, được trang bị 2 CPU IBM Power9 và 6 NVIDIA Tesla V100. Có 4356 nút kết nối như vậy với tổng chi phí là 200 triệu USD. Vào tháng 3/2019, Phòng thí nghiệm Argonne của Bộ Năng lượng Mỹ đã công khai thông báo rằng họ sẽ chi 500 triệu USD để xây dựng thế hệ siêu máy tính mới Aurora. Siêu máy tính này, sẽ được giao vào năm 2021, không theo đuổi mục tiêu mù quáng về tốc độ tính toán, mà yêu cầu những ý tưởng thiết kế mới để ứng dụng các công nghệ mới như trí tuệ nhân tạo.
Summit, siêu máy tính mạnh nhất của Mỹ tính đến thời điểm hiện tại, đứng thứ 2 trong danh sách Top500
Vậy ai là người thụ hưởng chính trong hợp đồng khổng lồ này của các chính phủ? Suy đoán bên ngoài là Intel, nhà sản xuất CPU lớn nhất tại Mỹ và Cray, nhà tích hợp hệ thống siêu máy tính nổi tiếng.
Tuy nhiên, không thể bỏ qua việc các hệ thống siêu máy tính được sử dụng ngày càng nhiều trong lĩnh vực nghiên cứu trí tuệ nhân tạo, GPU chip tăng tốc bổ sung đã dần trở thành thứ bắt buộc để xây dựng siêu máy tính. Do đó, NVIDIA cũng đã thu được những lợi ích đáng kể trong nhiều dự án siêu máy tính trên khắp thế giới, bao gồm các phòng thí nghiệm quốc gia mạnh nhất tại Mỹ-Phòng thí nghiệm Oak Ridge và Phòng thí nghiệm Argonne, là những sản phẩm đầu tiên trong số các sản phẩm hiệu suất tốt nhất của NVIDIA.
Trên thực tế, cuộc cạnh tranh về siêu máy tính luôn được coi là nơi phô diễn sức mạnh công nghệ giữa các quốc gia. Mặc dù đây chỉ là một khía cạnh, nhưng các cụm siêu máy tính này thực sự đóng một vai trò cực kỳ quan trọng trong nhiều nhiệm vụ quân sự và khoa học, chẳng hạn như thiết kế vũ khí và giải mã, mô phỏng biến đổi khí hậu, nghiên cứu và chẩn đoán các virus dịch bệnh mới.
Nhiều thí nghiệm vật liệu và hóa học chưa từng có khó có thể được thực hiện trên đám mây, vì vậy việc triển khai các máy chủ hiệu suất cao là đặc biệt quan trọng. Trong cuộc cạnh tranh này, Trung Quốc và Mỹ đương nhiên là những ứng viên mạnh nhất, và họ cũng là hai cường quốc công nghệ sẵn sàng chi tiền cho các hệ thống siêu máy tính nhất.
Vào tháng 6/2020, hệ thống siêu máy tính Fugaku trị giá 1 tỷ USD của Trung tâm Máy tính Kobe Riken ở Nhật Bản bất ngờ vọt lên vị trí hàng đầu trong Top500 siêu máy tính, nhưng trong số này, Trung Quốc vẫn sở hữu 226 máy và Mỹ là 114 máy. Do đó, nếu đơn giá của mỗi siêu máy tính là hàng trăm triệu USD thì đây là một thị trường đáng thèm muốn. Chính phủ các nước đã đặt mua nhiều đơn hàng kỷ lục hết lần này đến lần khác, điều này ngày càng trở nên hấp dẫn hơn đối với các công ty thương mại.
Ngoài ra, không nghi ngờ gì rằng vì siêu máy tính đang thực hiện các nhiệm vụ nghiên cứu và phát triển kỹ thuật khó nhất, sự tồn tại của chúng chính là nguồn sức mạnh cho công nghệ tương lai thâm nhập vào thị trường công nghiệp và tiêu dùng.
Cuộc chiến siêu máy tính giữa các quốc gia đã diễn ra từ nhiều thập kỷ trước. Ban đầu, hầu hết các siêu máy tính đều sử dụng bộ vi xử lý của Intel và AMD phát triển từ thế hệ chip PC mới nhất. Tuy nhiên trong vòng 5 năm trở lại đây, Big Data và các ứng dụng công nghệ mới lần lượt xuất hiện, do đó, các siêu máy tính mạnh nhất đã bắt đầu tăng cường sử dụng chip chuyên nghiệp. Nhưng điều thú vị là Fugaku của Nhật Bản đã đánh bại "sức mạnh nguồn" của những máy tính mạnh nhất ở Trung Quốc và Mỹ. Hóa ra đó là nhờ SoC 48 lõi A64FX của Fujitsu và đây phải là hệ thống siêu máy tính đầu tiên chạy bằng bộ xử lý ARM trong danh sách siêu máy tính toàn cầu.
Một CPU ít tên tuổi của Hàn Quốc đang đe dọa Intel, AMD và Nvidia trên thị trường siêu máy tính Dù vẫn đang trong thời gian tinh chỉnh, CPU mới từ Hàn Quốc đã cho thấy tốc độ xử lý nhanh gấp đôi trong khi tiêu thụ năng lượng bằng một nửa các siêu máy tính thế hệ hiện tại. Cho đến nay, các siêu máy tính chủ yếu vẫn là sân chơi của những hãng chip lớn như Intel, AMD và Nvidia,...