Mô hình AI mới đạt đột phá về mô phỏng hành vi con người
Một hệ thống trí tuệ nhân tạo (AI) tiên tiến vừa được phát triển có khả năng dự đoán lựa chọn của con người trong hàng loạt tình huống, thậm chí chính xác hơn nhiều lý thuyết kinh điển của ngành tâm lý học.
Công cụ này mang tên Centaur , được công bố trên tạp chí Nature, có tiềm năng mở ra hướng nghiên cứu mới về cách con người ra quyết định.
Centaur được xây dựng bằng cách tinh chỉnh một mô hình ngôn ngữ lớn (LLM) – cụ thể là Llama của Meta – dựa trên dữ liệu khổng lồ từ 160 nghiên cứu tâm lý học, ghi nhận hơn 10 triệu lựa chọn của 60.000 người tham gia nhiều nhiệm vụ khác nhau, từ đánh bạc, trò chơi trí nhớ đến giải quyết vấn đề.
Khác với phần lớn mô hình trước đây chỉ chuyên về một tác vụ (như AlphaGo chỉ chơi cờ vây hoặc lý thuyết triển vọng chỉ dự đoán lựa chọn giữa mất mát và lợi ích), Centaur có thể mô phỏng hành vi con người trên nhiều dạng nhiệm vụ. Thậm chí, khi thử nghiệm với những tác vụ mà nó chưa từng được huấn luyện, Centaur vẫn dự đoán chính xác đáng kể lựa chọn của con người.
Nhóm nghiên cứu, dẫn đầu bởi Marcel Binz tại Viện Helmholtz về AI hướng con người (Munich, Đức), tin rằng Centaur có thể trở thành công cụ hỗ trợ đắc lực cho khoa học nhận thức. Ông Binz chia sẻ: “Bạn có thể tiến hành các thí nghiệm ảo thay vì phải mời người thật tham gia, nhất là khi việc tuyển người quá chậm hoặc khó khăn, ví dụ với trẻ nhỏ hay người mắc bệnh tâm thần”.
Trong quá trình đánh giá, Centaur được so sánh với Llama gốc và 14 mô hình nhận thức và thống kê khác. Kết quả cho thấy Centaur vượt trội ở 31 trong tổng số 32 nhiệm vụ – ngoại lệ duy nhất là bài kiểm tra phán đoán ngữ pháp câu. Ngoài ra, Centaur cũng hoạt động tốt khi gặp các phiên bản biến đổi của nhiệm vụ đã huấn luyện và những nhiệm vụ logic chưa từng thấy trước đó.
Theo Giáo sư Russell Poldrack, nhà thần kinh học nhận thức tại Đại học Stanford (Mỹ), thành công này chứng minh “hành vi con người có cấu trúc rất chặt chẽ” và “đặt ra tiêu chuẩn cao hơn cho các mô hình mà ngành tâm lý học cần hướng tới”.
Video đang HOT
Dù vậy, Centaur vẫn còn hạn chế. Hiện hệ thống này chủ yếu dựa trên các nhiệm vụ ngôn ngữ nên chưa thể dự đoán thời gian một người mất để đưa ra quyết định. Bên cạnh đó, phần lớn dữ liệu huấn luyện xuất phát từ các nhóm dân cư phương Tây, có thể làm giảm độ chính xác khi áp dụng cho cộng đồng đa dạng hơn.
Nhóm nghiên cứu đang mở rộng cơ sở dữ liệu lên gấp bốn lần hiện tại để khắc phục hạn chế này. Centaur đã được công bố miễn phí cho cộng đồng học thuật. Ông Binz nhấn mạnh: “Đây có lẽ là phiên bản kém nhất của Centaur mà chúng tôi từng có – và nó sẽ ngày càng tiến bộ hơn”.
Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Mô hình ngôn ngữ lớn (LLM) do người Việt phát triển triển khai loạt ứng dụng hữu ích phục vụ nhu cầu tra cứu thông tin, giao tiếp của người dùng, ghi nhận hàng triệu lượt truy cập.
Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Được phát triển bởi đội ngũ kỹ sư người Việt của Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đang mang tới loạt ứng dụng thực tế thu hút đông đảo người dùng truy cập và sử dụng hàng tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên Zalo, cung cấp bộ 3 tính năng gồm Hỏi đáp các chủ đề khác nhau như khoa học, lịch sử, luật giao thông...; Sáng tạo nội dung như viết văn, soạn email, tin đăng mạng xã hội...; và Giải trí bằng cách đưa ra các gợi ý về địa điểm du lịch, âm nhạc, sách...
Thống kê của đội ngũ phát triển cho thấy trợ lý này đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong gần 2 tháng.
Kiki Info tích hợp trên nền tảng nhắn tin Zalo.
Một ứng dụng khác cũng do mô hình ngôn ngữ lớn của Zalo phát triển là thiệp AI, hiện đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Đây là số liệu được tổng hợp trong vòng 2 tháng, người dùng sử dụng thiệp AI để trao gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.
Các ứng dụng đều đang được người dùng đánh giá cao bởi trải nghiệm thông minh, giúp rút ngắn thời gian tìm kiếm và đưa ra quyết định trong cuộc sống. Đồng thời giúp việc kết nối với các mối quan hệ trở nên thú vị và gắn kết hơn.
Mô hình LLM của Zalo được phát triển bằng kỹ thuật huấn luyện từ đầu - triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định, giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình.
Kết thúc năm 2024 vừa qua, mô hình LLM của Zalo cán đích ở vị trí Top 2 trên bảng xếp hạng VMLU - Nền tảng đánh giá và xếp hạng năng lực tiếng Việt của các LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). Cụ thể, mô hình ngôn ngữ lớn của Zalo vươn lên vị trí số 2 trên bảng xếp hạng các mô hình được huấn luyện từ đầu, chỉ xếp sau Llama-3-70B của Meta, chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).
Bảng xếp hạng năm 2024 các LLM xây dựng từ đầu với mô hình LLM của Zalo vào Top 2.
Đây là thành công lớn với một mô hình ngôn ngữ lớn do người Việt phát triển, nhất là khi gặp phải không ít hạn chế trong những ngày đầu phát triển. Trong khi các công ty lớn trên thế giới sở hữu hàng nghìn GPU mới nhất từ Nvidia thì tại Việt Nam, thời điểm đó các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.
Đồng thời, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Bên cạnh đó, Việt Nam cũng còn những hạn chế về nguồn lực con người và kinh nghiệm huấn luyện LLM khi so sánh với các quốc gia phát triển trên thế giới.
Zalo đã có chiến lược phát triển để khắc phục những hạn chế về môi trường huấn luyện so với thế giới. Bằng việc trang bị hạ tầng tính toán với 8 máy chủ DGX H100, mô hình LLM đã được phát triển trực tiếp bằng dòng GPU mới và khan hiếm nhất của Nvidia lúc đó với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second - một petaFLOP tương đương với 10 triệu tỷ phép tính/giây).
Hệ thống máy chủ của Zalo có năng lực xử lý ưu việt.
Đồng thời dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt. Thông qua hàng loạt nghiên cứu thực hiện trên các GPU dân dụng nhỏ, các kỹ sư của Zalo cũng đã tranh thủ trang bị kiến thức và năng lực huấn luyện LLM để tạo dựng nền tảng sẵn sàng ngay khi sở hữu hạ tầng tính toán lớn.
Định hướng phát triển đúng đắn đã giúp Zalo phát triển thành công mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt chỉ sau 6 tháng huấn luyện vào năm 2023, đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn VMLU. Và hiện tại là vượt qua hàng loạt tên tuổi toàn cầu trên bảng xếp hạng VMLU 2024, đồng thời đưa mô hình nghiên cứu vào triển khai trên thực tế cho cộng đồng.
Mô hình LLM của Zalo thi đấu với loạt mô hình trên thế giới như ChatGPT 3.5, ChatGPT 4.0, Llama, PhởGPT và một người chơi thật trong lần đầu ra mắt năm 2023.
Theo Zalo, mô hình LLM sẽ tiếp tục được đầu tư huấn luyện để mang tới nhiều hơn các ứng dụng AI đẳng cấp thế giới cho người dùng. Qua đó, làm chủ công nghệ AI tiên tiến, hướng tới kỷ nguyên phát triển công nghệ của đất nước với định hướng đột phá về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta? Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình. Mỗi mô hình AI có phong cách ngôn ngữ khác nhau. Liệu văn bản do AI tạo ra có nghèo nàn về...
Tiêu điểm
Tin đang nóng
Tin mới nhất

Cơ hội cho Đông Nam Á trong cuộc đua công nghệ AI

Ngành ô tô đang khai thác sức mạnh của AI như thế nào?

AI khiến nông nghiệp phát triển như đi xa lộ 6 làn

Windows 11 chính thức vượt Windows 10 về độ phổ quát

5 cách đầu tư tiền điện tử hiệu quả cho người mới

Cường quốc công nghệ triển khai sáng kiến AI y tế mang tính đột phá

Cách khắc phục sự cố Wi-Fi trên Windows 11 dễ dàng, tiện lợi

Robot nấu ăn của Trung Quốc lập kỳ tích mới

Bên trong phòng thử nghiệm độ bền iPhone của Apple

Google gỡ bỏ 352 ứng dụng Android độc hại khỏi Play Store

Cách AI sẽ định hình lại tương lai việc làm

X cho phép bot AI kiểm chứng thông tin: Cách mạng hay rủi ro tiềm ẩn?
Có thể bạn quan tâm

Phản ứng của Jo Yu Ri khi bị chê cảnh sinh con phi lý trong "Squid Game 3"
Hậu trường phim
13:19:46 09/07/2025
Dịu dàng màu nắng - Tập 27: Lan Anh bị xúc phạm ngay tại spa, Xuân bàng hoàng vì em gái giấu chuyện làm thêm
Phim việt
13:15:00 09/07/2025
Áo blazer giúp nàng khoác lên mình hình ảnh quý cô hiện đại
Thời trang
13:03:18 09/07/2025
8 món ăn đơn giản từ trứng hỗ trợ giảm cân hiệu quả
Làm đẹp
13:01:29 09/07/2025
Mít kho rau răm thơm ngon, đậm đà cho bữa cơm gia đình
Ẩm thực
12:57:19 09/07/2025
Tài vận lên hương ngày 10/7: 3 chòm sao vươn lên mạnh mẽ, tiền tài - sự nghiệp - tình cảm đều bừng sáng
Trắc nghiệm
12:36:55 09/07/2025
Oppo tái hiện đại dương kỳ ảo tại sự kiện trải nghiệm Reno14 Series
Đồ 2-tek
12:34:34 09/07/2025
Khởi tố vụ án sản xuất, tiêu thụ gần 1 tấn pháo hoa nổ liên tỉnh
Pháp luật
12:17:25 09/07/2025
Điều đáng sợ ẩn giấu trong căn phòng của Hồng Tỷ: Đã nhiều vụ tương tự, vẫn tiếp tục "sập bẫy"!
Netizen
11:58:31 09/07/2025
Không cần sống tối giản cực đoan, nhưng 10 thứ này bạn nên vứt bỏ càng sớm càng tốt
Sáng tạo
11:45:25 09/07/2025