Tưởng siêu máy tính Trung Quốc nhanh gấp hàng triệu lần của Mỹ, hóa ra chỉ là thủ thuật đánh lừa
Trong khi điểm số benchmark của siêu máy tính Trung Quốc không được đăng tải công khai để so sánh, họ lại dùng thủ thuật để đánh lừa một giải thưởng khác khiến mọi người nhầm tưởng rằng, nó có tốc độ nhanh gấp hàng triệu lần siêu máy tính của Mỹ.
Thời gian gần đây, Trung Quốc đang trở thành một cái tên mới nổi trong cộng đồng siêu máy tính, cả về phần cứng và phần mềm. Tính đến tháng 10 năm nay, có ít nhất 2 siêu máy tính Trung Quốc vượt qua giới hạn exascale – nhanh gấp nhiều lần các siêu máy tính mạnh nhất hiện nay.
Đặc biệt mới đây, các nhà nghiên cứu Trung Quốc đăng tải kết quả kiểm tra cho biết, một trong hai siêu máy tính nói trên, Sunway Oceanlite của Trung tâm Nghiên cứu Quốc gia về Công nghệ và Kỹ thuật Điện toán Song Song (NRCPC), đã giành được giải thưởng Gordol Bell, giải thưởng dành cho các hệ thống siêu máy tính với tốc độ nhanh gấp hàng triệu lần so với một siêu máy tính nổi tiếng khác của Mỹ, siêu máy tính Summit.
Cụ thể, để nhận được của Gordon Bell, một hệ thống phải mô phỏng được bản mạch Sycamore 53-qubit – kiến trúc máy tính lượng tử được Google giới thiệu vài năm trước. Siêu máy tính Sunway Oceanlite làm được điều này chỉ trong 304 giây. Trong khi đó, theo ước tính của nhóm nghiên cứu đến từ Phòng Thí nghiệm Quốc gia Oak Ridge (ORNL) của Mỹ, siêu máy tính của Mỹ có thể phải mất đến 10.000 năm mới thực hiện được phép mô phỏng này – chậm hơn hàng triệu lần so với đối thủ đến từ Trung Quốc.
Nhưng hóa ra, tốc độ nhanh hơn không có nghĩa là siêu máy tính của Trung Quốc thực sự mạnh hơn siêu máy tính của Mỹ, sự khác biệt nằm ở độ chính xác khi thực hiện phép tính đó.
Sự thật đằng sau tốc độ nhanh gấp hàng triệu lần đối thủ
Thay vì tốc độ xung nhịp như trên bộ xử lý thông thường, việc đo lường hiệu suất các siêu máy tính được tính bằng số phép tính dấu phẩy động với độ chính xác kép (64-bit) trên mỗi giây (hay FLOPS – viết tắt của floating-point operations per second), hay FP64 FLOPS, theo thước đo của điểm số benchmark LINPACK.
Nếu bộ xử lý có thể thực thi FLOPS với độ chính xác thấp hơn, thời gian tính toán sẽ được rút ngắn đáng kể, do vậy, tiêu chuẩn chung để đo lường hiệu năng siêu máy tính là chỉ số FP64 FLOPS đạt được trong bài benchmark LINPACK.
Video đang HOT
Đó chính là cách mà siêu máy tính Trung Quốc thực hiện được phép tính mô phỏng kia trong thời gian vô cùng ngắn so với đối thủ. Theo trang tin NextPlatforms, các kỹ sư Trung Quốc đã làm giảm độ chính xác của phép tính, từ độ chính xác kép (64-bit) xuống còn độ chính xác đơn (32-bit). Điều này giúp siêu máy tính Trung Quốc thực hiện phép tính trên với thời gian ngắn đến như vậy – điều tương tự như các thủ thuật đánh lừa khi benchmark máy tính PC.
Dmitry Liakh, một nhà phát triển từ ORNL, cho biết: ” Trong công trình giành được chứng nhận từ Gordon Bell, các nhà nghiên cứu Trung Quốc giới thiệu một quy trình thiết kế có hệ thống, bao gồm thuật toán, khả năng tính toán song song và kiến trúc cần thiết cho việc mô phỏng … Hệ thống mô phỏng của họ đạt được hiệu năng 1,2 EFLOPS (mỗi EFLOPS bằng 1 tỷ tỷ phép tính dấu phẩy động mỗi giây) với độ chính xác đơn, hay 4,4 EFLOPS với độ chính xác hỗn hợp, sử dụng 41,9 triệu nhân Sunway.”
Theo ước tính của Chương trình Thông tin Công nghệ Châu Á ATIP (Asian Technology Information Program), hiệu năng ổn định của siêu máy tính Sunway Oceanlite ở khoảng 1050 PFLOPS (1,05 EFLOPS). Với mức hiệu năng này, Sunway Oceanlite đang là hệ thống siêu máy tính mạnh thứ hai Trung Quốc, xếp sau siêu máy tính Tianhe-3, đặt tại Trung tâm Siêu máy tính Quốc gia ở Quảng Châu, Trung Quốc. Theo ước tính của ATIP, hiệu năng ổn định của Tianhe-3 nằm ở mức 1300 PFLOPS (1,3 EFLOPS).
Mức điểm số của 2 siêu máy tính này đều cao hơn nhiều so với siêu máy tính Summit của Mỹ khi chỉ đạt 200 PFLOPS khi benchmark theo LINPACK. Tuy nhiên điều đáng chú ý là các siêu máy tính mới này của Trung Quốc không hề đăng tải điểm số benchmark của mình lên các trang chuyên dụng như Top500.org, mà lại đăng tải kết quả của Gordon Bell – nơi họ làm thủ thuật để có thành tích cao hơn.
Tham vọng của siêu máy tính Trung Quốc
Trong khi đánh lừa khả năng mô phỏng Sycamore là điều đáng trách, nhưng nó cũng cho thấy hệ thống Sunway Oceanlite có khả năng thực hiện đến 1,2 EFLOPS FP32 trong thuật toán cụ thể này. Điều này lại đặt ra một câu hỏi khác về hiệu năng của nó: Tại sao một hệ thống siêu máy tính được cho đạt điểm chuẩn 1,05 EFLOPS FP64 trong một bài benchmark lại chỉ đạt 1,2 EFLOPS FP32 trong một bài benchmark khác.
Những con số không nhất quán về hiệu năng hệ thống của Sunway Oceanlite khiến người ta nghi ngờ rằng liệu điểm chuẩn LINPACK về hiệu năng của Tianhe-3, siêu máy tính hàng đầu Trung Quốc hiện nay, có đúng hay không?
Cho dù các công ty Trung Quốc có thể thiết kế phần cứng cho siêu máy tính với hiệu năng Petascale, nhưng dường như các hệ thống exascale với mức tiêu thụ năng lượng hợp lý lại là điều khó có thể xảy ra. Cho dù vậy, ngay cả khi các bộ xử lý và bộ tăng tốc của Trung Quốc không nhanh như đối thủ, họ vẫn có thể sản xuất với số lượng lớn và tạo ra các hệ thống siêu máy tính với hiệu năng mạnh hơn, cho dù mức tiêu thụ năng lượng thế nào đi nữa.
Thách thức lớn nhất hiện nay đối với tham vọng này là việc các hãng sản xuất bộ xử lý siêu máy tính, Sunway và Phytium đều nằm trong danh sách đen của Mỹ, khiến việc phát triển và xây dựng các bộ xử lý mới trở nên khó khăn hơn nhiều so với trước.
Trung Quốc có thể đang bí mật sở hữu 2 siêu máy tính mạnh nhất thế giới
Cả hai hệ thống siêu máy tính của Trung Quốc đều đã phá vỡ "rào cản exascale" trong các thử nghiệm bí mật, nhưng không hề được công bố thông tin ra cộng đồng.
Theo báo cáo mới từ Next Platform, Trung Quốc đã chế tạo được những cỗ máy có thể phá vỡ "rào cản exascale" trong các quá trình thử nghiệm kín. Nguồn tin được chia sẻ trong báo cáo cho biết một thiết bị tại Trung tâm Siêu máy tính Quốc gia (còn được gọi là Sunway Oceanlite) đặt ở thành phố Vô Tích, tỉnh Giang Tô, đã ghi được số điểm cao nhất là 1,3 exaFLOPS (theo tiêu chuẩn Linpack) vào đầu tháng 3 năm nay.
Một hệ thống khác, Tianhe-3, được cho là đã đạt được số điểm gần như tương tự, nhưng không rõ chính xác thời điểm diễn ra thử nghiệm. Mặc dù có rất ít thông tin về kiến trúc của cỗ máy ở Vô Tích, nhưng Tianhe-3 được biết đến là có thiết kế dựa trên những con chip do công ty Trung Quốc có tên Phytium phát triển, với kiến trúc được thúc đẩy bởi một máy gia tốc ma trận.
"Exascale" là khái niệm để nói về khả năng xử lý ít nhất 1 exaFLOPS của hệ thống máy tính, tức là 1 tỷ tỷ phép tính mỗi giây. Như vậy, nếu thông tin trên là chính xác, cả hai siêu máy tính của Trung Quốc đều đã phá vỡ rào cản này.
Tuy nhiên, cả hai đều không có tên trong danh sách Top 500 siêu máy tính toàn cầu. Lý do được cho là vì các nhà phát triển của chúng không muốn các nhà thầu phụ của đối tác gặp rắc rối với chính phủ Mỹ.
Tianhe-2A, siêu máy tính được công bố gần nhất của Trung Quốc.
Kỉ lục về siêu máy tính nhanh nhất thế giới hiện do một cỗ máy của Nhật Bản, Fugaku, nắm giữ. Nó đã giành được vị trí đứng đầu này vào tháng 6/2020 với số điểm 416 petaFLOP (hoặc 0,416 exaFLOP), gần gấp ba lần hiệu suất cao nhất của thiết bị dẫn đầu trước đó, IBM Summit.
Kể từ đó tới nay, vị trí dẫn đầu của Fugaku đã được củng cố với việc bổ sung thêm 330.000 lõi, nâng hiệu suất lên 442 petaFLOPS. Tuy nhiên, nếu các báo cáo là chính xác, cả Tianhe-3 và cố máy ở Sunway Oceanlite đều vượt xa người dẫn đầu hiện tại gần như gấp ba lần.
Sự xuất hiện của các siêu máy tính exascale dự kiến sẽ mở ra một loạt cơ hội trong nhiều lĩnh vực khác nhau. Ví dụ, mức hiệu suất này sẽ đẩy nhanh thời gian khám phá và nghiên cứu trong các lĩnh vực như y học lâm sàng và gen, vốn đòi hỏi lượng lớn sức mạnh tính toán để tiến hành mô hình phân tử và giải trình tự bộ gen.
Trí tuệ nhân tạo (AI) là một lĩnh vực đa ngành khác cũng sẽ nhận được những bước chuyển đổi với sự xuất hiện của điện toán exascale. Khả năng phân tích bộ dữ liệu ngày càng lớn sẽ cải thiện khả năng của các mô hình AI, cho phép đưa ra các dự báo chính xác để có thể được áp dụng trong hầu hết mọi bối cảnh, từ an ninh mạng đến thương mại điện tử, sản xuất, hậu cần, ngân hàng và hơn thế nữa.
Siêu máy tính Frontier chưa ra mắt, nhưng nó được nhiều công ty lớn của Mỹ hậu thuẫn.
Trong bối cảnh cả Mỹ và Trung Quốc đang tranh giành vị trí tối cao về lĩnh vực AI, sự xuất hiện của hai hệ thống có khả năng vượt rào exascale ở Trung Quốc trước khi Mỹ có thể ra mắt cỗ máy exascale sắp tới của riêng mình (mang tên Frontier), sẽ là một cú hích đối với chính quyền Biden. Càng đặc biệt hơn khi chúng được xây dựng trên nền tảng công nghệ riêng của Trung Quốc.
NextPlatform cho biết họ lấy thông tin từ một nguồn từ Mỹ, người biết những gì đang diễn ra ở Trung Quốc.
Tuy nhiên, có một số yếu tố cần xem xét. Hiệu suất mục tiêu của siêu máy tính Frontier khi ra mắt là khoảng 1,5 TFLOPS, cao hơn gần 50% khi so sánh với hiệu suất bền vững của các siêu máy tính exascale của Trung Quốc. Hơn nữa, Frontier dự kiến tiêu thụ khoảng 30 MW điện, trong khi một trong những đối thủ của nó ở Trung Quốc có mức tiêu thụ điện khoảng 35 MW. Cuối cùng nhưng không kém phần quan trọng, các nhà phát triển Trung Quốc sử dụng các kiến trúc hiện có được phát triển cho các hệ thống và khối lượng công việc quy mô PetaFLOPS, và đây là tiêu chuẩn có thể không tối ưu trong tương lai.
Siêu máy tính Nhật Bản giữ ngôi mạnh nhất thế giới Cỗ máy Fugaku của Nhật Bản lần thứ tư liên tiếp đánh bại đối thủ từ Trung Quốc và Mỹ để trở thành siêu máy tính nhanh nhất thế giới. Danh sách siêu máy tính mạnh nhất thế giới Top500 được công bố hai lần mỗi năm vào tháng 6 và tháng 11. Fugaku đã giữ vị trí số một từ tháng 6/2020....