Sau mô hình AI ban đầu gây chấn động, DeepSeek đẩy nhanh ra mắt mô hình mới
Công ty khởi nghiệp Trung Quốc DeepSeek đang tìm cách tận dụng lợi thế sau khi ra mắt mô hình R1 gây chấn động thế giới.
Logo của DeepSeek. Ảnh: AFP/TTXVN
Theo hãng tin Reuters ngày 26/2, DeepSeek đã gây ra đợt bán tháo hơn 1.000 tỷ USD trên thị trường chứng khoán toàn cầu vào tháng trước với một mô hình AI lý luận giá rẻ vượt trội hơn nhiều đối thủ phương Tây.
Hiện, công ty có trụ sở tại Hàng Châu này đang đẩy nhanh kế hoạch ra mắt phiên bản kế nhiệm của mô hình R1 hồi tháng 1.
Theo hai nguồn tin, DeepSeek ban đầu dự kiến phát hành R2 vào đầu tháng 5 nhưng hiện muốn tung ra sớm nhất có thể.
DeepSeek cho biết họ kỳ vọng mô hình mới sẽ cải thiện khả năng lập trình và có thể suy luận bằng các ngôn ngữ ngoài tiếng Anh. Chi tiết về mốc thời gian đẩy nhanh ra mắt R2 chưa từng được đưa tin trước đó.
Các đối thủ vẫn đang tìm cách đán.h giá tác động của R1, mô hình được xây dựng bằng các con chip Nvidia kém mạnh hơn nhưng vẫn có tính cạnh tranh với những sản phẩm do các tập đoàn công nghệ Mỹ phát triển với chi phí hàng trăm tỷ USD.
Ông Vijayasimha Alilughatta, Giám đốc điều hành của công ty dịch vụ công nghệ Ấn Độ Zensar, nhận định: “DeepSeek ra mắt mô hình R2 có thể là một thời khắc mang tính bước ngoặt trong ngành AI”. Theo ông, thành công của DeepSeek trong tạo ra các mô hình AI tiết kiệm chi phí có thể thúc đẩy các công ty trên toàn cầu đẩy nhanh nỗ lực, phá vỡ thế độc quyền của một số ít tập đoàn lớn trong ngành.
R2 có khả năng khiến chính phủ Mỹ lo ngại, khi nước này xác định dẫn đầu trong lĩnh vực AI là ưu tiên quốc gia. Trong khi đó, R2 ra mắt có thể khiến chính quyền và doanh nghiệp Trung Quốc thêm quyết tâm, khi hàng chục công ty nước này tuyên bố đã bắt đầu tích hợp các mô hình của DeepSeek vào sản phẩm của mình.
Mô hình quản lý khác biệt tại DeepSeek
Thông tin về DeepSeek vẫn rất ít ỏi. Nhà sáng lập Lương Văn Phong trở thành tỷ phú nhờ quỹ đầu tư định lượng High-Flyer. Ông Lương chưa phát biểu trước truyền thông kể từ tháng 7/2024.
Ông Lương sinh năm 1985 tại một ngôi làng ở tỉnh Quảng Đông, miền Nam Trung Quốc. Sau đó, ông lấy bằng kỹ sư truyền thông tại Đại học Chiết Giang danh tiếng.
Một trong những công việc đầu tiên của ông là điều hành bộ phận nghiên cứu tại một công ty hình ảnh thông minh ở Thượng Hải.
Tại DeepSeek và High-Flyer, ông Lương cũng tránh các phương thức quản lý cứng nhắc của các tập đoàn công nghệ Trung Quốc, vốn nổi tiếng với hệ thống cấp bậc chặt chẽ, trả lương thấp cho nhân viên trẻ và quy tắc “996″ – làm việc từ 9 giờ sáng đến 9 giờ tối, sáu ngày một tuần.
Ông Lương mở văn phòng ở Bắc Kinh gần Đại học Thanh Hoa và Đại học Bắc Kinh, hai cơ sở giáo dục danh giá nhất Trung Quốc. Ông thường xuyên tham gia vào các chi tiết kỹ thuật và sẵn sàng làm việc cùng các thực tập sinh thuộc thế hệ trẻ và những sinh viên mới tốt nghiệp, những người chiếm phần lớn lực lượng lao động của công ty. Họ cũng cho biết thường chỉ làm việc 8 tiếng một ngày trong một môi trường hợp tác.
Benjamin Liu, một nhà nghiên cứu 26 tuổ.i rời công ty hồi tháng 9, kể: “Ông Lương trao cho chúng tôi quyền kiểm soát và coi chúng tôi là chuyên gia. Ông ấy liên tục đặt câu hỏi và học hỏi cùng chúng tôi. DeepSeek cho phép tôi chịu trách nhiệm về những phần quan trọng trong quy trình, điều đó rất thú vị”.
Trong khi Baidu và các tập đoàn công nghệ Trung Quốc khác chạy đua phát triển phiên bản AI hướng đến người tiêu dùng vào năm 2023 để tận dụng làn sóng AI toàn cầu, ông Lương nói với hãng truyền thông Trung Quốc Waves năm ngoái rằng ông cố tình tránh chi tiêu mạnh vào phát triển ứng dụng, thay vào đó tập trung vào nâng cao chất lượng mô hình AI.
Video đang HOT
Cả DeepSeek và High-Flyer đều nổi tiếng vì trả lương cao. Tại High-Flyer, một nhà khoa học dữ liệu cấp cao có thể kiếm 1,5 triệu nhân dân tệ mỗi năm, trong khi các công ty đối thủ hiếm khi trả quá 800.000 nhân dân tệ.
Sự hào phóng này là nhờ High-Flyer, một trong những quỹ đầu tư định lượng thành công nhất Trung Quốc. Dù lĩnh vực này bị chính phủ siết chặt, nhưng quỹ vẫn quản lý hàng chục tỷ nhân dân tệ.
DeepSeek đạt được thành công với mô hình AI giá rẻ nhờ khoản đầu tư lớn vào nghiên cứu và sức mạnh tính toán suốt một thập kỷ của High-Flyer. Năm 2020, một giám đốc cấp cao của quỹ tuyên bố công ty sẽ dồn toàn lực cho AI, tái đầu tư 70% doanh thu, chủ yếu vào nghiên cứu AI.
High-Flyer đã chi 1,2 tỷ nhân dân tệ cho hai cụm siêu máy tính AI vào năm 2020 và 2021. Cụm thứ hai, Fire-Flyer II, bao gồm khoảng 10.000 chip Nvidia A100, được sử dụng để đào tạo mô hình AI.
DeepSeek chưa thành lập vào thời điểm đó, nhưng việc tích lũy sức mạnh tính toán đã thu hút sự chú ý của các cơ quan quản lý chứng khoán Trung Quốc. Họ quyết định không can thiệp, một động thái mang tính quyết định đối với DeepSeek khi Mỹ cấm xuất khẩu chip A100 sang Trung Quốc vào năm 2022.
Giới chức đã yêu cầu ông Lương Văn Phong giữ thái độ kín tiếng vì họ lo ngại rằng xuất hiện trên truyền thông sẽ thu hút sự chú ý không cần thiết.
Là một trong số ít công ty sở hữu cụm A100 quy mô lớn, High-Flyer và DeepSeek đã thu hút được một số nhân tài nghiên cứu hàng đầu của Trung Quốc.
Theo ước tính của các nhà phân tích tại công ty môi giới Bernstein hồi đầu tháng 2, mức giá của DeepSeek rẻ hơn từ 20 đến 40 lần so với chi phí của OpenAI cho các mô hình tương đương.
Hiện tại, các tập đoàn công nghệ phương Tây và Trung Quốc vẫn đang lên kế hoạch chi tiêu mạnh tay cho AI, nhưng thành công của DeepSeek với R1 và mô hình V3 trước đó đã khiến một số công ty phải điều chỉnh chiến lược.
OpenAI đã giảm giá trong tháng này, trong khi Gemini của Google giới thiệu các cấp truy cập giá rẻ hơn. Kể từ khi R1 ra mắt, OpenAI cũng đã tung ra mô hình O3-Mini sử dụng ít tài nguyên tính toán hơn.
Sự hỗ trợ từ Trung Quốc
Ngay trước khi R1 thu hút chú ý toàn cầu, đã có dấu hiệu cho thấy DeepSeek được Bắc Kinh ưu ái. Vào tháng 1, truyền thông nhà nước đưa tin ông Lương Văn Phong đã tham dự một cuộc họp với Thủ tướng Trung Quốc Lý Cường tại Bắc Kinh với tư cách là đại diện của lĩnh vực AI, vượt qua nhiều lãnh đạo của các công ty lớn hơn.
Tính cạnh tranh về chi phí của các mô hình DeepSeek đã củng cố niềm tin của Bắc Kinh rằng họ có thể đổi mới vượt Mỹ. Các công ty và cơ quan chính phủ Trung Quốc đã đón nhận các mô hình DeepSeek với tốc độ chưa từng có.
Ít nhất 13 chính quyền thành phố và 10 công ty năng lượng nhà nước Trung Quốc tuyên bố đã tích hợp DeepSeek vào hệ thống. Các tập đoàn công nghệ như Lenovo, Baidu và Tencent cũng đã tích hợp mô hình DeepSeek vào sản phẩm.
Ông Alfred Wu, chuyên gia về chính sách Trung Quốc tại Trường Chính sách công Lý Quang Diệu của Singapore, nhận định: “Chủ tịch Tập Cận Bình và ông Lý Cường đã phát tín hiệu rằng họ ủng hộ DeepSeek”.
Bất chấp DeepSeek, người dùng ChatGPT vẫn tăng
Logo của OpenAI và ChatGPT. Ảnh: AFP/TTXVN
Theo kênh CNBC ngày 20/2, OpenAI tiếp tục mở rộng tầm bao phủ với tốc độ ấn tượng, bất chấp áp lực từ các đối thủ cạnh tranh như DeepSeek. OpenAi đã ghi nhận trong tháng 2 có 400 triệu người dùng hoạt động hằng tuần, tăng 33% so với con số 300 triệu trong tháng 12/2024. Đây là lần đầu tiên dữ liệu này được công bố.
Theo Giám đốc vận hành OpenAI Brad Lightcap, ChatGPT ngày càng phổ biến là do nhiều yếu tố, trong đó có khả năng đáp ứng ngày càng tốt hơn nhu cầu của người dùng. Quá trình này diễn ra tự nhiên khi ngày càng có nhiều người tiếp cận và nhận thấy tiện ích của công cụ. Tốc độ lan truyền của ChatGPT chủ yếu dựa vào yếu tố truyền miệng, khi người dùng giới thiệu cho bạn bè và đồng nghiệp. Theo thời gian, nhiều người dần tìm ra cách tận dụng công cụ này để hỗ trợ công việc và cuộc sống, từ đó thúc đẩy tăng trưởng bền vững.
Không chỉ mảng người dùng cá nhân phát triển mạnh, OpenAI cũng đang mở rộng nhanh chóng phân khúc khách hàng doanh nghiệp. Hiện tại, công ty có khoảng 2 triệu doanh nghiệp trả phí, gấp đôi so với tháng 9 năm ngoái. Ông Lightcap cho biết nhiều nhân viên ban đầu sử dụng ChatGPT cho mục đích cá nhân, sau đó đề xuất doanh nghiệp triển khai công cụ này để tối ưu quy trình làm việc. Ông cho rằng sự quen thuộc của người dùng cá nhân với ChatGPT đã giúp công ty dễ dàng mở rộng sang lĩnh vực doanh nghiệp.
Grok 3 có khả năng gì mà tỷ phú Elon Musk ca ngợi là AI 'thông minh nhất Trái đất'?
Mô hình trí tuệ nhân tạo Grok 3 vừa ra mắt có những đặc điểm vượt trội mà tỷ phú Elon Musk tuyên bố là "thông minh nhất Trái đất".
Biểu tượng của Grok và ChatGPT. Ảnh: REUTERS/TTXVN
Theo trang indiatoday.in ngày 18/2, ông Musk đã công bố phát hành Grok 3, phiên bản mới nhất của chatbot AI do ông phát triển, sẽ bắt đầu triển khai cho người dùng X Premium . Mô hình mới này có trí tuệ nâng cao, khả năng lập luận tốt hơn và tương tác tự nhiên hơn với người dùng.
Grok là một phần trong mảng kinh doanh AI của ông Musk, công ty xAI và được thiết kế để cạnh tranh với các chatbot phổ biến như ChatGPT hay Gemini. Grok 3 hứa hẹn mang lại phản hồi tốt hơn và khả năng nâng cao, giúp các cuộc trò chuyện trở nên hấp dẫn, hữu ích hơn.
Mô hình AI này được tích hợp vào mạng xã hội X, cho phép các thành viên Premium truy cập sớm. Tỷ phú Musk đã khẳng định rõ ràng về tham vọng AI của mình và động thái ra mắt Grok 3 là một bước tiến nữa trong mục tiêu tạo ra các công cụ AI mã nguồn mở mạnh mẽ trong tương lai.
Grok là gì?
Tên gọi này có một nguồn gốc thú vị. Grok xuất phát từ loạt truyện nổi tiếng "The Hitchhiker's Guide to the Galaxy" (Cuộc phiêu lưu vào dải Ngân Hà). Từ Grok ám chỉ khả năng lĩnh hội mọi thứ một cách trực giác và đầy thấu cảm.
Hầu hết chatbot AI không có thấu cảm trong cách giao tiếp và đây chính là thế mạnh của Grok. Grok được cung cấp thông tin theo thời gian thực thông qua mạng xã hội X. Mô hình này phân tích cách con người giao tiếp, chia sẻ suy nghĩ và theo dõi các sự kiện toàn cầu mới nhất. Grok có tính trực quan hơn nhiều chatbot hiện có trên thị trường.
Grok có thể trở thành đối tác trò chuyện của người dùng, thậm chí có thể tham gia các cuộc thảo luận gây tranh cãi. Điểm nổi bật nhất là Grok cung cấp thông tin cập nhật, vì nguồn dữ liệu chính là X, nơi khởi nguồn của mọi tin tức.
Theo nhóm phát triển, vào tháng 4/2024, ông Musk đã quyết định rằng xAI cần xây dựng trung tâm dữ liệu riêng để phát triển AI tiên tiến nhất. Nhóm nghiên cứu phải làm việc trong một khoảng thời gian rất gấp rút, chỉ có khoảng 4 tháng để hoàn thành dự án nhằm ra mắt Grok 3 sớm nhất có thể.
Nhóm nghiên cứu cho biết: "Hành trình này là một thử thách lớn, mất 122 ngày để đưa 100.000 GPU đầu tiên vào hoạt động. Theo chúng tôi, đây là cụm H100 lớn nhất thuộc loại này với hệ thống mạng hoàn chỉnh. Tuy nhiên, chúng tôi chưa dừng lại ở đó. Chúng tôi nhanh chóng nhận ra rằng cần phải tăng gấp đôi quy mô cụm máy chủ để xây dựng AI theo đúng tầm nhìn. Chúng tôi bắt đầu một giai đoạn mới để tăng gấp đôi công suất chỉ trong 92 ngày và đây là lần đầu tiên công khai thông tin này".
Nhóm nghiên cứu cũng liên tục cải thiện sản phẩm trong suốt quá trình bằng cách tận dụng sức mạnh tính toán này. Theo các nhà phát triển, Grok 3 hoạt động theo ba cách: Think, Big Brain và DeepSearch.
Think (chế độ tư duy)
Nhiệm vụ đầu tiên của buổi trình diễn về Grok 3 là giải một bài toán vật lý. Nhóm nghiên cứu yêu cầu Grok 3 lập một lộ trình khả thi để di chuyển từ Trái đất đến sao Hỏa và quay trở lại Trái đất. Họ giải thích: "Bài toán này đòi hỏi Grok phải hiểu một số nguyên lý vật lý phức tạp".
AI này đã mất 114 giây để suy nghĩ trước khi đưa ra câu trả lời. Trong quá trình này, Grok 3 phân tích và hiển thị từng bước tính toán để giải quyết vấn đề.
Nhóm nghiên cứu cũng lưu ý rằng mô hình có thể mắc lỗi hoặc đưa ra kết luận sai vì hoạt động không theo kịch bản có sẵn. Tuy nhiên, trong buổi trình diễn, không có sai sót nào xảy ra.
Big Brain (chế độ trí tuệ lớn)
Chế độ "Big Brain" của Grok 3 sử dụng khả năng sáng tạo để thực hiện một nhiệm vụ. Trong buổi trình diễn, nhóm nghiên cứu yêu cầu AI kết hợp hai trò chơi phổ biến là Tetris và Bejeweled để tạo ra một trò chơi mới.
Khi Grok 3 bắt đầu suy nghĩ và xử lý yêu cầu, tỷ phú Musk nhận xét: "Grok là khởi đầu của sáng tạo".
Sau khi Grok 3 tạo ra trò chơi mới thành công, ông tiếp tục thông báo: "Chúng tôi đang ra mắt một công ty trò chơi điện tử AI tại xAI. Nếu bạn muốn tham gia phát triển trò chơi điện tử sử dụng AI, hãy gia nhập cùng chúng tôi. Chúng tôi sẽ công bố thông tin chi tiết".
DeepSearch (chế độ tìm kiếm sâu)
Grok 3 đã được huấn luyện để giải quyết các vấn đề phức tạp trong khoa học, toán học và lập trình. Theo nhóm xAI, người dùng có thể yêu cầu Grok thực hiện nghiên cứu chuyên sâu bằng cách sử dụng tùy chọn "DeepSearch".
Mặc dù nhiều mô hình AI như DeepSeek R1 và Gemini 2.0 Flash Thinking cũng có khả năng này, nhưng nhóm nghiên cứu khuyến nghị người dùng yêu cầu Grok 3 suy nghĩ trước khi trả lời. Điều này giúp AI phân tích sâu hơn và tạo ra kết quả tốt hơn.
Khi thị trường AI ngày càng cạnh tranh, sự kiện ra mắt Grok 3 đán.h dấu một bước ngoặt đối với xAI. Công ty này không chỉ cạnh tranh với OpenAI và Google mà còn chịu áp lực ngày càng lớn từ các công ty công nghệ Trung Quốc như DeepSeek.
Tốc độ phát triển của DeepSeek buộc các đối thủ phải điều chỉnh chiến lược. Chẳng hạn, OpenAI gần đây đã phát hành miễn phí mô hình lập luận đầu tiên và ngay sau đó ra mắt Deep Research AI.
Các tính năng của Grok 3
Tỷ phú Elon Musk. Ảnh: PAP/TTXVN
So với phiên bản trước, Grok 3 có nhiều cải tiến đáng chú ý.
Khả năng lập luận nâng cao: Theo ông Musk, Grok 3 có thể tìm ra giải pháp sáng tạo cho các vấn đề phức tạp, mở ra tiềm năng thay đổi cách ra quyết định trong các lĩnh vực như y tế và tài chính.
Chuyển đổi văn bản thành video: Grok 3 có khả năng biến mô tả văn bản thành cảnh quay video thực tế. Tính năng này có thể thay đổi cách sản xuất nội dung và quảng cáo.
Cơ chế tự sửa lỗi: Grok 3 có hệ thống kiểm tra tính hợp lý của các câu trả lời để học hỏi từ lỗi sai, giúp giảm thiểu hiện tượng "ảo giác AI" - khi AI tạo ra thông tin sai lệch hoặc vô nghĩa.
Huấn luyện trên dữ liệu tổng hợp: Grok 3 được đào tạo bằng các tập dữ liệu tổng hợp, giúp tăng độ chính xác và hiệu suất học tập theo thời gian.
Mỹ đối mặt thách thức mới trong cuộc đua AI Thành công của DeepSeek đang làm lung lay chiến lược kiểm soát công nghệ của Mỹ với Trung Quốc. Với chi phí phát triển thấp nhưng hiệu suất ngang hàng các đối thủ Mỹ, ứng dụng trí tuệ nhân tạo (AI) này buộc Washington phải xem xét lại cách duy trì vị thế dẫn đầu trong cuộc đua. Biểu tượng của Tập đoàn...











Tiêu điểm
Tin đang nóng
Tin mới nhất

Bài toán về tháp kiểm soát không lưu tại Mỹ

Tổng thống Trump tuyên bố ngừng viện trợ quân sự cho Kiev

Lý do 250.000 người ký đơn đòi tịch thu hộ chiếu Canada của tỷ phú Elon Musk

Tổng thống Trump yêu cầu cải tổ Lầu Năm Góc sau nhiều năm quản lý tài chính yếu kém

Giải cứu 7.000 người nước ngoài bị lừa lao động ở Myanmar

Israel đẩy mạnh không kích miền Nam Syria

Phát hiện khảo cổ có niên đại hơn 29.000 năm ở Thái Lan

Australia khẳng định vị thế Đối tác Chiến lược Toàn diện của ASEAN

Kinh hoàng 'hố tử thần' bất ngờ xuất hiện nuốt chửng xe ô tô

Ecuador ban bố tình trạng khẩn cấp do mưa lũ

Tòa án Mỹ chặn sắc lệnh của Tổng thống Trump về đình chỉ chương trình tiếp nhận người tị nạn

Bitcoin rời ngưỡng 90.000 USD, thị trường tiề.n số chao đảo
Có thể bạn quan tâm

Choáng ngợp trước loại gia vị đắt hơn cả rượu vang hảo hạng, ủ 20 năm từ 7 loại gỗ quý!
Lạ vui
19:33:21 26/02/2025
Nhan sắc sao nhí Bố Ơi Mình Đi Đâu Thế sau 11 năm gâ.y số.c
Sao châu á
19:32:15 26/02/2025
Mẹ Bắp có bao nhiêu tài khoản nhận tiề.n từ thiện?
Netizen
18:47:16 26/02/2025
Sao nữ Vbiz bị đ.e dọ.a khi l.y hô.n hé lộ tình tiết mới: Chồng đòi chia 50% tài sản, yêu cầu cuối gâ.y số.c
Sao việt
18:07:17 26/02/2025
Bích Ngọc lên tiếng về nghi vấn "phim giả tình thật" với Thuận Nguyễn
Hậu trường phim
18:00:18 26/02/2025
Bỏ phố về quê, cô gái 9x đầu tư hơn 1 tỷ đồng để cải tạo lại căn nhà cũ đẹp như khu nghỉ dưỡng
Sáng tạo
17:29:04 26/02/2025
Quảng Ngãi huy động hàng trăm bộ đội, người dân gia cố khẩn cấp bờ biển Mỹ Khê
Tin nổi bật
17:24:55 26/02/2025
3 nhóm người nên tránh ăn hạt
Sức khỏe
17:24:38 26/02/2025
Cha tôi, người ở lại - Tập 6: An ghen với em gái mới của Nguyên
Phim việt
17:23:44 26/02/2025
Xuân Son chống nạng đến dự Gala Quả bóng Vàng, nhan sắc nàng WAG người Brazil chiếm luôn "spotlight"
Sao thể thao
16:59:07 26/02/2025