Trung Quốc đang tự tạo cho mình một GitHub riêng mang tên Gitee
Liệu nền tảng của Gitee có thể thuyết phục được các nhà phát triển Trung Quốc “hồi hương” từ GitHub.
Xung đột Mỹ – Trung đang khiến ngành công nghệ của hai quốc gia này chia rẽ sâu sắc, đồng thời mở ra những cơ hội để các công ty Trung Quốc – từ các nhà sản xuất chip smartphone và xe hơi điện đến phần mềm, vốn là xương sống của hoạt động thường ngày của hàng triệu doanh nghiệp.
Các công ty Trung Quốc hiện đang kiểm soát hầu như toàn bộ các dịch vụ dành cho người tiêu dùng trên internet, nhưng nhiều công nghệ nền tảng chống đỡ các phần cứng và phần mềm doanh nghiệp vẫn nằm trong tay các công ty phương Tây. Khi mà ngành công nghệ ngày càng bị cuốn vào vòng xoáy xung đột địa chính trị trên quy mô lớn, người dùng và các khách hàng của họ chính là những đối tượng chịu ảnh hưởng nhiều nhất. Kế hoạch của Huawei nhằm từ bỏ những con chip nhập khẩu chỉ là một trong rất nhiều ví dụ điển hình cho thấy sự nguy hiểm khi lệ thuộc vào công nghệ nước ngoài của các công ty Trung Quốc.
Một lĩnh vực khác đã và đang khiến cộng đồng công nghệ nước này lo lắng là lưu trữ mã nguồn. Các nhà phát triển Trung Quốc phụ thuộc rất lớn vào GitHub, bằng chứng là khi chính phủ Trung Quốc ban hành lệnh cấm website này hồi năm 2013, cựu giám đốc Google China là Kaifu Lee đã phải lên tiếng. Và nay, Trung Quốc tiếp tục lo sợ rằng xung đột chính trị với Mỹ sẽ gây ảnh hưởng đến GitHub.
Tình huống này không phải chưa từng có tiền lệ. Tháng 7 năm ngoái, GitHub (thuộc sở hữu của Microsoft) đã cắt giảm một số dịch vụ nhất định đối với người dùng tại các quốc gia bị Mỹ cấm vận bao gồm Iran, Syria, và Crimea, gây nên làn sóng phẫn nộ và hoảng loạn trong cộng đồng nhà phát triển toàn cầu.
Gitee, một nền tảng đã 7 năm tuổi, là trung tâm của nỗ lực nhằm đưa mã nguồn của các doanh nghiệp “hồi hương” mà phía Trung Quốc đang thực hiện. Bộ Công nghiệp và Công nghệ Thông tin (MIIT), một trong những cơ quan hoạch định chính sách công nghệ hàng đầu của Trung Quốc, mới đây đã chọn Gitee để đảm nhận việc xây dựng nên một “ nền tảng lưu trữ mã nguồn mở, độc lập dành cho Trung Quốc“.
Dự án này sẽ được tiến hành bởi một liên minh dẫn đầu bởi Open Source China, công ty trụ sở tại Thượng Hải, vốn điều hành cộng đồng mã nguồn mở cùng tên và Gitee. Dịch vụ lưu trữ này sẽ là một dự án do chính phủ đề xuất, với sự hỗ trợ từ các trường đại học nghiên cứu và các tổ chức đến từ khu vực tư nhân – một nhóm 10 tổ chức bao gồm Huawei, công ty đang đứng trước vô vàn khó khăn vì chuỗi cung ứng bị gián đoạn giữa cơn bão chính trị.
“ Nếu Trung Quốc không có cộng đồng mã nguồn mở của chính mình để duy trì và quản lý mã nguồn, ngành công nghiệp phần mềm nội địa của chúng ta sẽ rất dễ bị ảnh hưởng bởi các yếu tố không thể kiểm soát được” – giám đốc Huawei Wang Chenglu nói trong một sự kiện vào tháng 8 năm ngoái, chỉ một thời gian ngắn sau khi GitHub buộc phải tuân thủ các điều luật cấm vận của Mỹ.
Gitee cho biết đến nay đã lưu trư hơn 10 triệu kho mã nguồn mở và cung cấp dịch vụ đến hơn 5 triệu nhà phát triển. Để so sánh, thì GitHub được cho là có 100 triệu kho và khoảng 31 triệu nhà phát triển trên toàn thế giới tính đến tháng 11 năm ngoái.
Câu hỏi đặt ra ở đây là liệu nền tảng của Gitee có thể thuyết phục được các nhà phát triển Trung Quốc “hồi hương” từ GitHub – hay từ đối thủ trong nước là Coding.net của Tencent – hay không, khi mà họ đã nhận được sự chống lưng từ nhiều gã khổng lồ công nghiệp. Ngoài ra, chưa rõ GitHub sẽ phản ứng ra sao nhằm hạn chế hành động “xuất” mã nguồn, bởi một lãnh đạo của họ từng gợi ý về khả năng sẽ mở một công ty con tại Trung Quốc.
Về phía Gitee, họ rõ ràng tự tin rằng có một thị trường đang rộng mở cho một sản phẩm thay thế GitHub thuộc sở hữu của người Trung Quốc.
“ Thế giới là nơi hàng trăm bông hoa có thể nở rộ. Thị trường nước ngoài thì có GitHub và các nền tảng khác. Ở Trung Quốc, cũng có nhiều tổ chức đề cao phần mềm mã nguồn mở, như Gitee” – nhà sáng lập Open Source China với nickname “Hongshu” viết như vậy.
“ Một hệ sinh thái mã nguồn mở không thể qua một đêm đã xây dựng xong. Nó là một quá trình giống như xây một toà tháp từ nền móng. Chúng tôi có niềm tin vào sức mạnh cách tân của các nhà phát triển Trung Quốc. Chúng tôi cũng tin vào lòng kiên nhẫn và sức mạnh của chính mình“.
GitHub chôn mã nguồn dưới băng tuyết Bắc Cực để bảo tồn trong 1.000 năm
Dù vướng nhiều tranh cãi, đặc biệt sau khi bị thâu tóm bởi Microsoft, phần lớn mã nguồn mở (và một số không mở cho lắm) của thế giới vẫn đang được lưu trữ trên GitHub.
Trong bối cảnh một phần rất lớn của thế giới đang hoạt động nhờ các phần mềm mã nguồn mở, dù trực tiếp hay gián tiếp, thì các kho lưu trữ của GitHub có thể nói đang nắm giữ hầu hết lịch sử và cơ sở hạ tầng số của nền văn hoá hiện tại của chúng ta. Đó là lý do tại sao GitHub đặt ra cho chính mình nhiệm vụ bảo tồn lượng dữ liệu đó bằng cách chôn sâu một bản sao (snapshot) của toàn bộ kho lưu trữ của họ dưới một khu vực nào đó ở Bắc Cực để chúng có thể được lưu giữ an toàn trong 1.000 năm.
Tất nhiên, GitHub không đơn thuần đào một hố thật sâu ngay giữa Bắc cực rồi chôn hàng tá đĩa DVD, hay tệ hơn, những chiếc đĩa cứng từ tính, mà vị trí họ chọn cũng khá gần với vùng cực của Trái đất rồi. Cụ thể, để giữ an toàn cho kho mã nguồn mở của thế giới trong hàng trăm năm, GitHub đã chọn một mỏ than đã ngừng hoạt động ở Svalbard, Nauy, nơi họ xây dựng một căn phòng nằm sâu nhiều mét bên dưới lớp băng vĩnh cửu để phục vụ cho mục đích của mình.
GitHub cũng chọn một giải pháp hợp lý hơn để lưu trữ mã nguồn, chứ không phải DVD hay đĩa cứng như đã nói ở trên đâu. Sau khi nén toàn bộ các kho lưu trữ cộng đồng hiện đang hoạt động vào ngày 2/2 năm nay, GitHub đã thu được một khối dữ liệu nặng 21TB, và lưu trữ chúng vào 186 cuộn phim lưu trữ số nhạy sáng piqiFilm của Piql. Những cuộn phim này được đóng gói và chuyển đến Nauy, nơi chúng yên vị trong các container, sẵn sàng để "ngủ" một giấc dài nghìn năm.
GitHub Arctic Code Vault
GitHub hẳn đã muốn đi đến nơi họ chọn để quay lại toàn bộ cuộc hành trình, nhưng thế giới nay đã khác nhiều so với khi họ công bố chương trình lưu trữ vào tháng 11 năm ngoái. Kể cả khi họ tự mình đưa được kho lưu trữ đến Nauy, thì phần còn lại của công việc cũng phải được chuyển giao cho các đối tác địa phương. Vào ngày 8/7/2020, snapshot của GitHub tính đến ngày 2/2/2020 đã được đưa vào Arctic Code Vault (Hầm chứ mã an toàn Bắc cực) bình an vô sự.
Dù cuộc hành trình của số cuộn phim lưu trữ trên đã kết thúc, chương trình GitHub Archive vẫn tiếp diễn. Cụ thể, Internet Archive vẫn đang thực hiện công đoạn sao lưu trọn vẹn các kho lưu trữ cộng đồng tính đến ngày 13/4 năm nay, và lượng dữ liệu hiện đã đạt 55TB. Không như khối dữ liệu lưu trữ đang nằm trong kho lạnh theo đúng nghĩa đen, Internet Archive muốn sao lưu toàn bộ khối dữ liệu lưu trữ lần này vào cuối tháng 7.
Kho lưu trữ GitHub riêng tư của Microsoft bị tấn công Kho lưu trữ GitHub riêng của Microsoft đã trở thành đối tượng của nạn trộm cắp dữ liệu với hơn 500 GB dữ liệu bị tin tặc đánh cắp. Nhiều dữ liệu GitHub riêng tư của Microsoft có thể đã bị đánh cắp Trong cuộc tấn công này, một tin tặc được cho là đã giành được quyền truy cập không hạn chế...