Trận chiến AI: ‘So găng’ những bộ não nhân tạo quyền lực nhất hành tinh
Các “ bộ não nhân tạo” như ChatGPT, Gemini, Claude, Deepseek, Copilot hay Meta AI… đang từng bước trở thành hạ tầng cốt lõi trong nhiều lĩnh vực.
Nhưng trong cuộc chơi tưởng như toàn “siêu nhân” này, mỗi mô hình lại mang những ưu thế và điểm yếu riêng.
Các “ông lớn” đứng sau các mô hình AI đang so kè từng ngày, từng giờ. Ảnh: Asia Times
Trí tuệ nhân tạo đang bước vào giai đoạn cạnh tranh khốc liệt nhất từ trước đến nay. Không còn là những bản demo gây ấn tượng ban đầu, các “bộ não nhân tạo” như ChatGPT của OpenAI, Gemini của Google, Claude của Anthropic, Deepseek, Copilot của Microsoft hay Meta AI… đang từng bước trở thành hạ tầng cốt lõi trong nhiều lĩnh vực – từ giáo dục, truyền thông, đến lập trình và hoạch định chiến lược. Nhưng trong cuộc chơi tưởng như toàn “siêu nhân” này, mỗi mô hình lại mang trong mình những ưu thế riêng và cả những điểm yếu không dễ bỏ qua. Trang Asia Times đã “bóc tách” từng hệ thống, để nhìn rõ ai thực sự đang dẫn đầu và vì sao.
1. ChatGPT của OpenAI
ChatGPT, do OpenAI phát triển, là một trong những mô hình AI dễ nhận biết và được sử dụng rộng rãi nhất trên thế giới. Được xây dựng theo định dạng dựa trên đối thoại, tính linh hoạt đã biến ChatGPT thành một công cụ AI hàng đầu cho cả mục đích sử dụng thông thường và chuyên nghiệp, bao gồm các ngành như dịch vụ khách hàng, sáng tạo nội dung, lập trình và nghiên cứu.
ChatGPT lý tưởng cho nhiều đối tượng người dùng, bao gồm nhà văn, chuyên gia kinh doanh, nhà giáo dục, nhà phát triển và nhà nghiên cứu. Khả năng truy cập miễn phí của nó khiến nó trở thành điểm khởi đầu tuyệt vời cho người dùng thông thường, trong khi các doanh nghiệp, người sáng tạo nội dung và nhà phát triển có thể tận dụng các mô hình tiên tiến của nó để tăng năng suất và tự động hóa.
Nó cũng nằm trong số các mô hình AI thân thiện với người dùng nhất hiện có, có giao diện rõ ràng, phản hồi trực quan và tương tác liền mạch trên nhiều thiết bị. Tuy nhiên, các tổ chức yêu cầu các mô hình AI tùy chỉnh hoặc kiểm soát quyền riêng tư dữ liệu chặt chẽ hơn có thể thấy bản chất nguồn đóng của nó có hạn chế, đặc biệt là khi so sánh với các giải pháp thay thế nguồn mở như LLaMA của Meta.
Đối với các chuyên gia và doanh nghiệp yêu cầu khả năng mạnh mẽ hơn, ChatGPT Pro mở khóa các tính năng lập luận nâng cao thông qua chế độ o1 pro, bao gồm chức năng giọng nói nâng cao và hiệu suất được cải thiện đối với các truy vấn phức tạp.
Một trong những điểm mạnh nhất của ChatGPT là tính linh hoạt và bộ nhớ đàm thoại. Nó có thể xử lý nhiều tác vụ, từ trò chuyện thông thường và viết sáng tạo đến giải quyết vấn đề kỹ thuật, hỗ trợ mã hóa và tự động hóa doanh nghiệp. Khi bộ nhớ được bật, ChatGPT có thể lưu giữ ngữ cảnh trong các tương tác, cho phép trải nghiệm người dùng được cá nhân hóa hơn.
Một lợi thế quan trọng khác là cơ sở người dùng đã được chứng minh của nóvới hàng trăm triệu người dùng trên toàn thế giới, ChatGPT đã trải qua quá trình tinh chỉnh liên tục dựa trên phản hồi trong thế giới thực, cải thiện độ chính xác và khả năng sử dụng của nó. Ngoài ra, khả năng đa phương thức của GPT-4o cho phép nó xử lý văn bản, hình ảnh, âm thanh và video, biến nó thành một công cụ AI toàn diện để tạo nội dung, phân tích và thu hút khách hàng.
Về nhược điểm, thỉnh thoảng ChatGPT có độ trễ trong các bản cập nhật theo thời gian thực. Bên cạnh đó, mô hình độc quyền của nó có nghĩa là người dùng có quyền kiểm soát hạn chế đối với các sửa đổi hoặc tùy chỉnh, vì họ phải tuân thủ các chính sách dữ liệu và hạn chế nội dung của OpenAI.
2. Gemini của Google
Dòng Gemini của Google nổi tiếng với các khả năng đa phương thức và khả năng xử lý ngữ cảnh rộng lớn, khiến nó trở thành một công cụ đa năng cho cả ứng dụng cấp cá nhân và cấp doanh nghiệp.
Người tiêu dùng nói chung và người dùng năng suất được hưởng lợi từ sự tích hợp sâu của Gemini với Google Search, Gmail, Docs và Assistant, khiến nó trở thành một công cụ tuyệt vời để nghiên cứu, soạn thảo email và tự động hóa tác vụ. Người dùng doanh nghiệp và doanh nghiệp thấy giá trị trong việc tích hợp Gemini với Google Workspace, tăng cường khả năng cộng tác trên Drive, Sheets và Meet.
Trụ sở Google tại Mountain View, California, Mỹ. Ảnh: Kyodo/TTXVN
Các nhà phát triển và nhà nghiên cứu AI có thể tận dụng các khả năng của nó thông qua Google Cloud và Vertex AI, khiến nó trở thành lựa chọn mạnh mẽ để xây dựng các ứng dụng AI và mô hình tùy chỉnh. Các chuyên gia sáng tạo có thể tận dụng các khả năng đa phương thức của nó, làm việc với văn bản, hình ảnh và video. Trong khi đó, sinh viên và nhà giáo dục được hưởng lợi từ khả năng tóm tắt, giải thích các khái niệm và hỗ trợ nghiên cứu của Gemini, khiến nó trở thành một công cụ học thuật mạnh mẽ.
Google Gemini rất dễ tiếp cận, đặc biệt là đối với những người đã quen thuộc với các dịch vụ của Google. Sự tích hợp liền mạch của nó trên toàn bộ hệ sinh thái của Google cho phép áp dụng dễ dàng trong cả ứng dụng cá nhân và doanh nghiệp.
Các phiên bản hiện tại, Gemini 1.5 Flash và Pro, đáp ứng các nhu cầu khác nhau, với Flash cung cấp tùy chọn tinh gọn, tiết kiệm chi phí và Pro cung cấp hiệu suất cao hơn. Trong khi đó, dòng Gemini 2.0, được thiết kế chủ yếu cho mục đích sử dụng của doanh nghiệp, bao gồm các mô hình thử nghiệm như Gemini 2.0 Flash với tốc độ được cải thiện và API trực tiếp đa phương thức, cũng như Gemini 2.0 Pro mạnh mẽ hơn.
Tuy nhiên, hiệu suất của Gemini có thể không nhất quán, đặc biệt là với các ngôn ngữ hiếm hoặc các truy vấn chuyên biệt. Một số phiên bản nâng cao có thể bị giới hạn do thử nghiệm an toàn, làm chậm trễ quyền truy cập rộng rãi hơn. Hơn nữa, sự tích hợp sâu sắc với hệ sinh thái của Google có thể là rào cản đối với người dùng bên ngoài môi trường đó, khiến việc áp dụng trở nên khó khăn hơn.
3. Claude của Anthropic
Claude của Anthropic được biết đến với sự nhấn mạnh vào tính an toàn, luồng hội thoại tự nhiên và hiểu biết ngữ cảnh dạng dài. Nó đặc biệt phù hợp với những người dùng ưu tiên sử dụng AI có đạo đức và cộng tác có cấu trúc trong quy trình làm việc của họ.
Video đang HOT
Các nhà nghiên cứu và học giả cần duy trì ngữ cảnh dạng dài và ít ảo giác, cũng như các nhà văn và người sáng tạo nội dung được hưởng lợi từ cách tiếp cận có cấu trúc và độ chính xác của nó, sẽ thấy Claude là một trợ lý AI thiết yếu và có lợi.
Các chuyên gia kinh doanh và nhóm có thể tận dụng tính năng “Dự án” của Claude để quản lý nhiệm vụ và tài liệu, trong khi các nhà giáo dục và sinh viên sẽ thấy các rào cản an toàn và phản hồi rõ ràng của nó là lý tưởng để hỗ trợ học tập.
Vì Claude rất dễ tiếp cận đối với những người tìm kiếm AI có cấu trúc, đạo đức với sự hiểu biết ngữ cảnh mạnh mẽ, nên nó phù hợp ở mức độ vừa phải đối với những người dùng sáng tạo, những người có thể thấy các bộ lọc hạn chế của nó hạn chế và không lý tưởng cho những người cần các công cụ động não nhanh, không hạn chế hoặc nội dung do AI tạo ra với mức độ kiểm duyệt tối thiểu.
Ngược lại, Claude 3.5 Sonnet là mô hình hàng đầu, cung cấp khả năng lập luận, tốc độ và hiểu biết theo ngữ cảnh nâng cao cho cả người dùng cá nhân và doanh nghiệp. Đối với doanh nghiệp và nhóm, Gói Claude Team và Enterprise có giá khởi điểm khoảng 25 đô la cho mỗi người dùng mỗi tháng (thanh toán hàng năm), cung cấp các tính năng cộng tác nâng cao.
Không giống như hầu hết các AI, Claude vượt trội về tính an toàn của AI có đạo đức, bộ nhớ đàm thoại mở rộng và quản lý dự án có cấu trúc, khiến nó trở nên lý tưởng cho những người dùng cần hỗ trợ AI đáng tin cậy và được kiểm duyệt tốt. Giao diện trực quan và các công cụ tổ chức của nó giúp tăng năng suất cho các nhà văn, nhà nghiên cứu, nhà giáo dục và chuyên gia kinh doanh.
Tuy nhiên, các bộ lọc an toàn nghiêm ngặt của Claude, mặc dù ngăn chặn nội dung có hại, nhưng đôi khi lại hạn chế tính linh hoạt sáng tạo, khiến nó không phù hợp với các phiên động não mang tính thử nghiệm cao hoặc không bị hạn chế.
4. DeepSeek AI
DeepSeek, một tên tuổi mới từ Trung Quốc, đã nhanh chóng thu hút sự chú ý vì hiệu quả về chi phí và triết lý truy cập mở. Không giống như nhiều mô hình AI đã được thiết lập, DeepSeek tập trung vào việc cung cấp quyền truy cập AI giá cả phải chăng trong khi vẫn duy trì khả năng suy luận mạnh mẽ, khiến nó trở thành một lựa chọn hấp dẫn cho cả doanh nghiệp và người dùng cá nhân.
Là một lựa chọn tuyệt vời cho các doanh nghiệp có ý thức về chi phí, các nhà phát triển độc lập và các nhà nghiên cứu cần một giải pháp AI mạnh mẽ nhưng giá cả phải chăng, DeepSeek đặc biệt phù hợp với các công ty khởi nghiệp, tổ chức học thuật và doanh nghiệp cần khả năng suy luận và giải quyết vấn đề mạnh mẽ mà không tốn nhiều chi phí vận hành.
Nó rất dễ tiếp cận đối với cá nhân do mô hình dựa trên web miễn phí của nó và ngay cả các nhà phát triển và doanh nghiệp cũng được hưởng lợi từ API chi phí thấp của mô hình này.
Mô hình mới nhất, DeepSeek-R1, được thiết kế cho các tác vụ lý luận nâng cao và có thể truy cập thông qua cả API và giao diện trò chuyện. Phiên bản trước đó, DeepSeek-V3, đóng vai trò là nền tảng kiến trúc cho các bản phát hành hiện tại, cung cấp cửa sổ ngữ cảnh mở rộng lên tới 128.000 mã thông báo trong khi được tối ưu hóa để tăng hiệu quả.
DeepSeek miễn phí cho người dùng cá nhân thông qua giao diện web, khiến nó trở thành một trong những mô hình AI dễ truy cập nhất hiện có. Tuy nhiên, đối với các ứng dụng kinh doanh, việc sử dụng API có chi phí thấp hơn đáng kể so với các đối thủ cạnh tranh ở Mỹ, khiến nó trở thành một lựa chọn hấp dẫn cho các doanh nghiệp muốn giảm chi phí.
Một trong những điểm mạnh lớn nhất của DeepSeek là hiệu quả về chi phí. Nó cho phép các doanh nghiệp và nhà phát triển tiếp cận AI mạnh mẽ mà không phải chịu gánh nặng tài chính liên quan đến các mô hình như GPT-4 của OpenAI hoặc Claude của Anthropic. Phương pháp tiếp cận nguồn mở của nó càng làm tăng thêm sức hấp dẫn của nó, vì nó cung cấp trọng số mô hình và tài liệu kỹ thuật theo giấy phép mở, khuyến khích tính minh bạch và cải tiến do cộng đồng thúc đẩy.
Biểu tượng mô hình trí tuệ nhân tạo Deepseek. Ảnh: REUTERS/TTXVN
Ngoài ra, khả năng lập luận mạnh mẽ của nó đã được đánh giá chuẩn mực so với các mô hình AI hàng đầu, với DeepSeek-R1 cạnh tranh với các mô hình hàng đầu của OpenAI trong các nhiệm vụ giải quyết vấn đề cụ thể.
Nhưng có một vấn đề đáng chú ý với DeepSeek là độ trễ phản hồi của nó, đặc biệt là trong thời gian nhu cầu cao, khiến nó kém lý tưởng hơn cho các ứng dụng thời gian thực, nơi tốc độ là yếu tố quan trọng. Kiểm duyệt và thiên vị cũng là những mối quan ngại tiềm ẩn. DeepSeek tuân thủ các quy định về nội dung tại địa phương, nghĩa là nó có thể khử trùng hoặc tránh các chủ đề nhạy cảm về mặt chính trị, điều này có thể hạn chế sức hấp dẫn của nó trên thị trường toàn cầu.
5. Copilot của Microsoft
Copilot của Microsoft là trợ lý AI tập trung vào năng suất được thiết kế để nâng cao hiệu quả nơi làm việc thông qua tích hợp liền mạch với bộ Microsoft 365. Bằng cách nhúng tự động hóa hỗ trợ AI trực tiếp vào các công cụ như Word, Excel, PowerPoint, Outlook và Teams, Copilot hoạt động như một trợ lý thông minh giúp hợp lý hóa quy trình làm việc, tự động hóa các tác vụ lặp đi lặp lại và nâng cao khả năng tạo tài liệu.
Lý tưởng cho các doanh nghiệp, nhóm doanh nghiệp và chuyên gia phụ thuộc nhiều vào các ứng dụng Microsoft 365 cho các hoạt động hàng ngày của họ, Copilot của Microsoft đặc biệt có lợi cho các chuyên gia doanh nghiệp, nhà phân tích tài chính, quản lý dự án và nhân viên hành chính cần hỗ trợ hỗ trợ AI để nâng cao năng suất và giảm thời gian dành cho các tác vụ thường xuyên.
Tuy nhiên, những tổ chức thích các mô hình AI nguồn mở hoặc yêu cầu khả năng tương thích linh hoạt, đa nền tảng có thể thấy Copilot ít phù hợp hơn, đặc biệt là nếu họ dựa vào hệ sinh thái phần mềm không phải của Microsoft cho quy trình làm việc của mình.
Một trong những lợi thế quan trọng nhất của Copilot là tích hợp hệ sinh thái sâu rộng trong Microsoft 365. Đối với các doanh nghiệp và chuyên gia đã sử dụng Microsoft Office, Copilot cải thiện quy trình làm việc bằng cách nhúng các đề xuất và tự động hóa do AI điều khiển trực tiếp vào các ứng dụng quen thuộc.
Khả năng tự động hóa tác vụ của nó là một lợi ích quan trọng khác, giúp người dùng tạo báo cáo, tóm tắt cuộc họp, soạn thảo email và phân tích dữ liệu hiệu quả hơn.
Ngược lại, một trong những nhược điểm đáng kể của Copilot của Microsoft là sự khóa chặt hệ sinh thái của nó – Copilot được kết hợp chặt chẽ với Microsoft 365, nghĩa là toàn bộ tiềm năng của nó chỉ được các tổ chức đã đầu tư vào hệ sinh thái phần mềm của Microsoft nhận ra. Một mối quan ngại khác là tính linh hoạt hạn chế vì thiếu tích hợp của bên thứ ba mở rộng có trong các nền tảng AI mở hơn, khiến việc tùy chỉnh trở nên khó khăn đối với các doanh nghiệp dựa vào nhiều công cụ hơn.
6. Meta AI
Bộ công cụ AI của Meta, được xây dựng trên các mô hình LLaMA có trọng số mở (open-weight LLaMA models), là một bộ AI linh hoạt và thân thiện với nghiên cứu được thiết kế cho cả mục đích sử dụng chung và các ứng dụng chuyên biệt. Phương pháp tiếp cận của Meta ưu tiên phát triển nguồn mở, khả năng truy cập và tích hợp với các nền tảng truyền thông xã hội của mình, khiến nó trở thành một đối thủ độc đáo trong bối cảnh AI.
Nó lý tưởng cho các nhà phát triển, nhà nghiên cứu và những người đam mê AI muốn có các mô hình nguồn mở miễn phí mà họ có thể tùy chỉnh và tinh chỉnh. Nó cũng rất phù hợp với các doanh nghiệp và thương hiệu tận dụng các nền tảng xã hội của Meta, vì AI của nó có thể tăng cường tương tác với khách hàng và tạo nội dung trong các ứng dụng như Instagram và WhatsApp.
Meta AI rất dễ tiếp cận đối với các nhà phát triển và nhà nghiên cứu do tính khả dụng và tính linh hoạt của nguồn mở. Tuy nhiên, các doanh nghiệp và người dùng thông thường có thể thấy nó kém trực quan hơn so với các mô hình AI có các công cụ hướng đến người dùng tinh vi hơn. Ngoài ra, các công ty cần kiểm duyệt nội dung mạnh mẽ và tuân thủ quy định có thể thích các hệ thống AI được kiểm soát chặt chẽ hơn từ các đối thủ cạnh tranh như Microsoft hoặc Anthropic.
Ưu điểm lớn nhất của Meta AI là bản chất mã nguồn mở và có thể tùy chỉnh, cho phép các nhà phát triển tinh chỉnh các mô hình cho các trường hợp sử dụng cụ thể. Điều này thúc đẩy sự đổi mới, tính linh hoạt và tính minh bạch cao hơn so với các hệ thống AI đóng. Meta AI lại được nhúng trong các nền tảng truyền thông xã hội phổ biến như Facebook, Instagram và WhatsApp, mang lại cho nó phạm vi tiếp cận người tiêu dùng lớn và khả năng tương tác theo thời gian thực.
Mặc dù có công nghệ nền tảng mạnh mẽ, giao diện người dùng và khả năng phản hồi của Meta AI đôi khi có vẻ kém tinh tế hơn so với các đối thủ cạnh tranh như OpenAI và Microsoft. Ngoài ra, Meta đã phải đối mặt với những tranh cãi liên quan đến việc kiểm duyệt nội dung và thiên vị, làm dấy lên mối lo ngại về thông tin sai lệch do AI tạo ra và sự giám sát của cơ quan quản lý.
Sau mô hình AI ban đầu gây chấn động, DeepSeek đẩy nhanh ra mắt mô hình mới
Công ty khởi nghiệp Trung Quốc DeepSeek đang tìm cách tận dụng lợi thế sau khi ra mắt mô hình R1 gây chấn động thế giới.
Logo của DeepSeek. Ảnh: AFP/TTXVN
Theo hãng tin Reuters ngày 26/2, DeepSeek đã gây ra đợt bán tháo hơn 1.000 tỷ USD trên thị trường chứng khoán toàn cầu vào tháng trước với một mô hình AI lý luận giá rẻ vượt trội hơn nhiều đối thủ phương Tây.
Hiện, công ty có trụ sở tại Hàng Châu này đang đẩy nhanh kế hoạch ra mắt phiên bản kế nhiệm của mô hình R1 hồi tháng 1.
Theo hai nguồn tin, DeepSeek ban đầu dự kiến phát hành R2 vào đầu tháng 5 nhưng hiện muốn tung ra sớm nhất có thể.
DeepSeek cho biết họ kỳ vọng mô hình mới sẽ cải thiện khả năng lập trình và có thể suy luận bằng các ngôn ngữ ngoài tiếng Anh. Chi tiết về mốc thời gian đẩy nhanh ra mắt R2 chưa từng được đưa tin trước đó.
Các đối thủ vẫn đang tìm cách đánh giá tác động của R1, mô hình được xây dựng bằng các con chip Nvidia kém mạnh hơn nhưng vẫn có tính cạnh tranh với những sản phẩm do các tập đoàn công nghệ Mỹ phát triển với chi phí hàng trăm tỷ USD.
Ông Vijayasimha Alilughatta, Giám đốc điều hành của công ty dịch vụ công nghệ Ấn Độ Zensar, nhận định: "DeepSeek ra mắt mô hình R2 có thể là một thời khắc mang tính bước ngoặt trong ngành AI". Theo ông, thành công của DeepSeek trong tạo ra các mô hình AI tiết kiệm chi phí có thể thúc đẩy các công ty trên toàn cầu đẩy nhanh nỗ lực, phá vỡ thế độc quyền của một số ít tập đoàn lớn trong ngành.
R2 có khả năng khiến chính phủ Mỹ lo ngại, khi nước này xác định dẫn đầu trong lĩnh vực AI là ưu tiên quốc gia. Trong khi đó, R2 ra mắt có thể khiến chính quyền và doanh nghiệp Trung Quốc thêm quyết tâm, khi hàng chục công ty nước này tuyên bố đã bắt đầu tích hợp các mô hình của DeepSeek vào sản phẩm của mình.
Mô hình quản lý khác biệt tại DeepSeek
Thông tin về DeepSeek vẫn rất ít ỏi. Nhà sáng lập Lương Văn Phong trở thành tỷ phú nhờ quỹ đầu tư định lượng High-Flyer. Ông Lương chưa phát biểu trước truyền thông kể từ tháng 7/2024.
Ông Lương sinh năm 1985 tại một ngôi làng ở tỉnh Quảng Đông, miền Nam Trung Quốc. Sau đó, ông lấy bằng kỹ sư truyền thông tại Đại học Chiết Giang danh tiếng.
Một trong những công việc đầu tiên của ông là điều hành bộ phận nghiên cứu tại một công ty hình ảnh thông minh ở Thượng Hải.
Tại DeepSeek và High-Flyer, ông Lương cũng tránh các phương thức quản lý cứng nhắc của các tập đoàn công nghệ Trung Quốc, vốn nổi tiếng với hệ thống cấp bậc chặt chẽ, trả lương thấp cho nhân viên trẻ và quy tắc "996" - làm việc từ 9 giờ sáng đến 9 giờ tối, sáu ngày một tuần.
Ông Lương mở văn phòng ở Bắc Kinh gần Đại học Thanh Hoa và Đại học Bắc Kinh, hai cơ sở giáo dục danh giá nhất Trung Quốc. Ông thường xuyên tham gia vào các chi tiết kỹ thuật và sẵn sàng làm việc cùng các thực tập sinh thuộc thế hệ trẻ và những sinh viên mới tốt nghiệp, những người chiếm phần lớn lực lượng lao động của công ty. Họ cũng cho biết thường chỉ làm việc 8 tiếng một ngày trong một môi trường hợp tác.
Benjamin Liu, một nhà nghiên cứu 26 tuổi rời công ty hồi tháng 9, kể: "Ông Lương trao cho chúng tôi quyền kiểm soát và coi chúng tôi là chuyên gia. Ông ấy liên tục đặt câu hỏi và học hỏi cùng chúng tôi. DeepSeek cho phép tôi chịu trách nhiệm về những phần quan trọng trong quy trình, điều đó rất thú vị".
Trong khi Baidu và các tập đoàn công nghệ Trung Quốc khác chạy đua phát triển phiên bản AI hướng đến người tiêu dùng vào năm 2023 để tận dụng làn sóng AI toàn cầu, ông Lương nói với hãng truyền thông Trung Quốc Waves năm ngoái rằng ông cố tình tránh chi tiêu mạnh vào phát triển ứng dụng, thay vào đó tập trung vào nâng cao chất lượng mô hình AI.
Cả DeepSeek và High-Flyer đều nổi tiếng vì trả lương cao. Tại High-Flyer, một nhà khoa học dữ liệu cấp cao có thể kiếm 1,5 triệu nhân dân tệ mỗi năm, trong khi các công ty đối thủ hiếm khi trả quá 800.000 nhân dân tệ.
Sự hào phóng này là nhờ High-Flyer, một trong những quỹ đầu tư định lượng thành công nhất Trung Quốc. Dù lĩnh vực này bị chính phủ siết chặt, nhưng quỹ vẫn quản lý hàng chục tỷ nhân dân tệ.
DeepSeek đạt được thành công với mô hình AI giá rẻ nhờ khoản đầu tư lớn vào nghiên cứu và sức mạnh tính toán suốt một thập kỷ của High-Flyer. Năm 2020, một giám đốc cấp cao của quỹ tuyên bố công ty sẽ dồn toàn lực cho AI, tái đầu tư 70% doanh thu, chủ yếu vào nghiên cứu AI.
High-Flyer đã chi 1,2 tỷ nhân dân tệ cho hai cụm siêu máy tính AI vào năm 2020 và 2021. Cụm thứ hai, Fire-Flyer II, bao gồm khoảng 10.000 chip Nvidia A100, được sử dụng để đào tạo mô hình AI.
DeepSeek chưa thành lập vào thời điểm đó, nhưng việc tích lũy sức mạnh tính toán đã thu hút sự chú ý của các cơ quan quản lý chứng khoán Trung Quốc. Họ quyết định không can thiệp, một động thái mang tính quyết định đối với DeepSeek khi Mỹ cấm xuất khẩu chip A100 sang Trung Quốc vào năm 2022.
Giới chức đã yêu cầu ông Lương Văn Phong giữ thái độ kín tiếng vì họ lo ngại rằng xuất hiện trên truyền thông sẽ thu hút sự chú ý không cần thiết.
Là một trong số ít công ty sở hữu cụm A100 quy mô lớn, High-Flyer và DeepSeek đã thu hút được một số nhân tài nghiên cứu hàng đầu của Trung Quốc.
Theo ước tính của các nhà phân tích tại công ty môi giới Bernstein hồi đầu tháng 2, mức giá của DeepSeek rẻ hơn từ 20 đến 40 lần so với chi phí của OpenAI cho các mô hình tương đương.
Hiện tại, các tập đoàn công nghệ phương Tây và Trung Quốc vẫn đang lên kế hoạch chi tiêu mạnh tay cho AI, nhưng thành công của DeepSeek với R1 và mô hình V3 trước đó đã khiến một số công ty phải điều chỉnh chiến lược.
OpenAI đã giảm giá trong tháng này, trong khi Gemini của Google giới thiệu các cấp truy cập giá rẻ hơn. Kể từ khi R1 ra mắt, OpenAI cũng đã tung ra mô hình O3-Mini sử dụng ít tài nguyên tính toán hơn.
Sự hỗ trợ từ Trung Quốc
Ngay trước khi R1 thu hút chú ý toàn cầu, đã có dấu hiệu cho thấy DeepSeek được Bắc Kinh ưu ái. Vào tháng 1, truyền thông nhà nước đưa tin ông Lương Văn Phong đã tham dự một cuộc họp với Thủ tướng Trung Quốc Lý Cường tại Bắc Kinh với tư cách là đại diện của lĩnh vực AI, vượt qua nhiều lãnh đạo của các công ty lớn hơn.
Tính cạnh tranh về chi phí của các mô hình DeepSeek đã củng cố niềm tin của Bắc Kinh rằng họ có thể đổi mới vượt Mỹ. Các công ty và cơ quan chính phủ Trung Quốc đã đón nhận các mô hình DeepSeek với tốc độ chưa từng có.
Ít nhất 13 chính quyền thành phố và 10 công ty năng lượng nhà nước Trung Quốc tuyên bố đã tích hợp DeepSeek vào hệ thống. Các tập đoàn công nghệ như Lenovo, Baidu và Tencent cũng đã tích hợp mô hình DeepSeek vào sản phẩm.
Ông Alfred Wu, chuyên gia về chính sách Trung Quốc tại Trường Chính sách công Lý Quang Diệu của Singapore, nhận định: "Chủ tịch Tập Cận Bình và ông Lý Cường đã phát tín hiệu rằng họ ủng hộ DeepSeek".
Bất chấp DeepSeek, người dùng ChatGPT vẫn tăng
Logo của OpenAI và ChatGPT. Ảnh: AFP/TTXVN
Theo kênh CNBC ngày 20/2, OpenAI tiếp tục mở rộng tầm bao phủ với tốc độ ấn tượng, bất chấp áp lực từ các đối thủ cạnh tranh như DeepSeek. OpenAi đã ghi nhận trong tháng 2 có 400 triệu người dùng hoạt động hằng tuần, tăng 33% so với con số 300 triệu trong tháng 12/2024. Đây là lần đầu tiên dữ liệu này được công bố.
Theo Giám đốc vận hành OpenAI Brad Lightcap, ChatGPT ngày càng phổ biến là do nhiều yếu tố, trong đó có khả năng đáp ứng ngày càng tốt hơn nhu cầu của người dùng. Quá trình này diễn ra tự nhiên khi ngày càng có nhiều người tiếp cận và nhận thấy tiện ích của công cụ. Tốc độ lan truyền của ChatGPT chủ yếu dựa vào yếu tố truyền miệng, khi người dùng giới thiệu cho bạn bè và đồng nghiệp. Theo thời gian, nhiều người dần tìm ra cách tận dụng công cụ này để hỗ trợ công việc và cuộc sống, từ đó thúc đẩy tăng trưởng bền vững.
Không chỉ mảng người dùng cá nhân phát triển mạnh, OpenAI cũng đang mở rộng nhanh chóng phân khúc khách hàng doanh nghiệp. Hiện tại, công ty có khoảng 2 triệu doanh nghiệp trả phí, gấp đôi so với tháng 9 năm ngoái. Ông Lightcap cho biết nhiều nhân viên ban đầu sử dụng ChatGPT cho mục đích cá nhân, sau đó đề xuất doanh nghiệp triển khai công cụ này để tối ưu quy trình làm việc. Ông cho rằng sự quen thuộc của người dùng cá nhân với ChatGPT đã giúp công ty dễ dàng mở rộng sang lĩnh vực doanh nghiệp.
Grok 3 có khả năng gì mà tỷ phú Elon Musk ca ngợi là AI 'thông minh nhất Trái đất'? Mô hình trí tuệ nhân tạo Grok 3 vừa ra mắt có những đặc điểm vượt trội mà tỷ phú Elon Musk tuyên bố là "thông minh nhất Trái đất". Biểu tượng của Grok và ChatGPT. Ảnh: REUTERS/TTXVN Theo trang indiatoday.in ngày 18/2, ông Musk đã công bố phát hành Grok 3, phiên bản mới nhất của chatbot AI do ông phát triển,...











Tiêu điểm
Tin đang nóng
Tin mới nhất

Intel công bố lộ trình chiến lược

Nhiều nước EU muốn 'mở khóa' để tăng chi tiêu quốc phòng

Chuyến tàu cao tốc tê liệt vì một con rắn

Bà Harris công kích 100 ngày đầu nắm quyền của ông Trump

Tesla bác tin tìm người thay thế ông Elon Musk

Quyền Tổng thống Hàn Quốc tuyên bố từ chức

Những ứng cử viên sáng giá để lãnh đạo thành quốc Vatican

Lính thủy đánh bộ Mỹ cần vũ khí cho tiêm kích mới

Trung Quốc bất ngờ tố ngược Mỹ về nguồn gốc Covid-19

Campuchia chuẩn bị giai đoạn 2 dự án kênh đào Phù Nam Techo

Khởi công cầu đường bộ đầu tiên nối liền Triều Tiên và Nga

Hàn Quốc lục soát nhà riêng cựu Tổng thống Yoon Suk Yeol
Có thể bạn quan tâm

Hé lộ về nghĩa địa cổ với nhiều ngôi mộ táng theo tư thế bó gối
Lạ vui
00:00:01 02/05/2025
Vụ 3 người tử vong trong khách sạn: Nạn nhân đến Nha Trang bằng xe máy
Tin nổi bật
23:42:52 01/05/2025
Cặp song sinh chào đời ngày 30/4, được đặt tên Thống Nhất và Hòa Bình
Netizen
23:40:27 01/05/2025
"Thánh nữ lệ rơi" đẹp chấn động MXH khiến netizen không tin vào mắt mình: Trung Quốc lại có một mỹ nhân cổ trang mới
Phim châu á
23:34:47 01/05/2025
Bắt giữ đối tượng thực hiện 7 vụ cướp và hiếp dâm
Pháp luật
23:33:17 01/05/2025
Mỹ nhân cổ trang Việt đẹp nhất hiện tại: 7 tuổi đã cực đắt show, 17 tuổi có ngay bom tấn siêu khủng
Hậu trường phim
23:29:52 01/05/2025
Tùng Dương hát "Một vòng Việt Nam" cùng 10.000 khán giả dưới quốc kỳ khổng lồ
Nhạc việt
23:14:50 01/05/2025
Sao nam là "thiếu gia tài phiệt" từ bỏ quyền thừa kế, để trở thành giảng viên đại học
Sao châu á
22:56:39 01/05/2025
Nguy cơ bùng nổ xung đột Ấn Độ - Pakistan

Cục trưởng Xuân Bắc khoe quà tự thưởng, Nhật Kim Anh 'về thăm cục kim cương'
Sao việt
22:50:15 01/05/2025