Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Mô hình ngôn ngữ lớn (LLM) do người Việt phát triển triển khai loạt ứng dụng hữu ích phục vụ nhu cầu tra cứu thông tin, giao tiếp của người dùng, ghi nhận hàng triệu lượt truy cập.
Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Được phát triển bởi đội ngũ kỹ sư người Việt của Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đang mang tới loạt ứng dụng thực tế thu hút đông đảo người dùng truy cập và sử dụng hàng tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA – Official Account (Tài khoản chính thức) trên Zalo, cung cấp bộ 3 tính năng gồm Hỏi đáp các chủ đề khác nhau như khoa học, lịch sử, luật giao thông…; Sáng tạo nội dung như viết văn, soạn email, tin đăng mạng xã hội …; và Giải trí bằng cách đưa ra các gợi ý về địa điểm du lịch , âm nhạc , sách…
Thống kê của đội ngũ phát triển cho thấy trợ lý này đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong gần 2 tháng.
Kiki Info tích hợp trên nền tảng nhắn tin Zalo.
Một ứng dụng khác cũng do mô hình ngôn ngữ lớn của Zalo phát triển là thiệp AI, hiện đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Đây là số liệu được tổng hợp trong vòng 2 tháng, người dùng sử dụng thiệp AI để trao gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.
Các ứng dụng đều đang được người dùng đánh giá cao bởi trải nghiệm thông minh, giúp rút ngắn thời gian tìm kiếm và đưa ra quyết định trong cuộc sống. Đồng thời giúp việc kết nối với các mối quan hệ trở nên thú vị và gắn kết hơn.
Mô hình LLM của Zalo được phát triển bằng kỹ thuật huấn luyện từ đầu – triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định, giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình.
Kết thúc năm 2024 vừa qua, mô hình LLM của Zalo cán đích ở vị trí Top 2 trên bảng xếp hạng VMLU – Nền tảng đánh giá và xếp hạng năng lực tiếng Việt của các LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). Cụ thể, mô hình ngôn ngữ lớn của Zalo vươn lên vị trí số 2 trên bảng xếp hạng các mô hình được huấn luyện từ đầu, chỉ xếp sau Llama-3-70B của Meta, chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).
Bảng xếp hạng năm 2024 các LLM xây dựng từ đầu với mô hình LLM của Zalo vào Top 2.
Đây là thành công lớn với một mô hình ngôn ngữ lớn do người Việt phát triển, nhất là khi gặp phải không ít hạn chế trong những ngày đầu phát triển. Trong khi các công ty lớn trên thế giới sở hữu hàng nghìn GPU mới nhất từ Nvidia thì tại Việt Nam, thời điểm đó các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.
Video đang HOT
Đồng thời, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Bên cạnh đó, Việt Nam cũng còn những hạn chế về nguồn lực con người và kinh nghiệm huấn luyện LLM khi so sánh với các quốc gia phát triển trên thế giới.
Zalo đã có chiến lược phát triển để khắc phục những hạn chế về môi trường huấn luyện so với thế giới. Bằng việc trang bị hạ tầng tính toán với 8 máy chủ DGX H100, mô hình LLM đã được phát triển trực tiếp bằng dòng GPU mới và khan hiếm nhất của Nvidia lúc đó với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second – một petaFLOP tương đương với 10 triệu tỷ phép tính/giây).
Hệ thống máy chủ của Zalo có năng lực xử lý ưu việt.
Đồng thời dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt. Thông qua hàng loạt nghiên cứu thực hiện trên các GPU dân dụng nhỏ, các kỹ sư của Zalo cũng đã tranh thủ trang bị kiến thức và năng lực huấn luyện LLM để tạo dựng nền tảng sẵn sàng ngay khi sở hữu hạ tầng tính toán lớn.
Định hướng phát triển đúng đắn đã giúp Zalo phát triển thành công mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt chỉ sau 6 tháng huấn luyện vào năm 2023, đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn VMLU. Và hiện tại là vượt qua hàng loạt tên tuổi toàn cầu trên bảng xếp hạng VMLU 2024, đồng thời đưa mô hình nghiên cứu vào triển khai trên thực tế cho cộng đồng.
Mô hình LLM của Zalo thi đấu với loạt mô hình trên thế giới như ChatGPT 3.5, ChatGPT 4.0, Llama, PhởGPT và một người chơi thật trong lần đầu ra mắt năm 2023.
Theo Zalo, mô hình LLM sẽ tiếp tục được đầu tư huấn luyện để mang tới nhiều hơn các ứng dụng AI đẳng cấp thế giới cho người dùng. Qua đó, làm chủ công nghệ AI tiên tiến, hướng tới kỷ nguyên phát triển công nghệ của đất nước với định hướng đột phá về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta?
Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình.
Mỗi mô hình AI có phong cách ngôn ngữ khác nhau
Liệu văn bản do AI tạo ra có nghèo nàn về mặt ngôn ngữ?
Không hẳn, theo chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer. Vấn đề nằm ở việc sử dụng sai mục đích trí tuệ nhân tạo để tạo nội dung. Tuy nhiên, nếu tuân thủ một vài nguyên tắc, người dùng hoàn toàn có thể cải thiện kỹ năng viết nhờ vào AI.
Theo Gerstlauer, điều quan trọng là phải hình thành hiểu biết cơ bản về ngôn ngữ đúng. Bà cũng đưa ra những mẹo mà người dùng có thể áp dụng để viết ra những văn bản tốt hơn với sự hỗ trợ của AI.
Bản thân bà Gerstlauer cũng sử dụng Claude. Bà dùng phần mềm AI này, trong số các mục đích khác, để soạn bản tin điện tử. Tác giả cuốn Texthacks đã huấn luyện chatbot bằng một loạt bản tin mà bà cho là thành công.
Làm gì để viết tốt với AI
Lời khuyên đầu tiên của bà để viết tốt với AI là: tải lên bốn đến năm ví dụ văn bản đã viết thành công. Bà cũng khuyến nghị nên thiết lập những quy tắc ngôn ngữ cơ bản như sau: Viết câu ngắn; Lược bỏ các từ đệm; Viết ở thể chủ động; Tránh lối viết danh từ hóa
Lựa chọn công cụ cũng có ảnh hưởng. Theo bà, Microsoft Copilot không phù hợp để sáng tạo nội dung văn bản - phần mềm này phù hợp hơn cho việc thuyết trình. Trong trải nghiệm cá nhân, Claude viết tự nhiên và gần gũi hơn ChatGPT.
Công cụ phổ biến này đôi khi lại có xu hướng dùng ngôn ngữ quá chuyên nghiệp. Điều đó dễ dẫn đến tình trạng lạm dụng các từ thông dụng sáo rỗng, khiến văn bản trở nên hời hợt - điều mà người dùng có thể dễ dàng nhận ra. Nữ nhà báo này cũng khuyên nên dùng AI như một công cụ phản hồi.
Phong cách viết một số mô hình phổ biến
ChatGPT của OpenAI, đặc biệt là các phiên bản như GPT-3.5 và GPT-4, thường được biết đến với phong cách:
Lưu loát và tự nhiên: ChatGPT tạo ra văn bản rất trôi chảy, có ngữ pháp và cú pháp chuẩn mực, đọc khá tự nhiên và giống con người. Đây là điểm mạnh lớn nhất của nó.
Chi tiết và đầy đủ: Nó có xu hướng cung cấp thông tin khá chi tiết và toàn diện về một chủ đề, thường đưa ra các điểm chính, ví dụ và giải thích.
Hơi trang trọng và an toàn: Đôi khi, văn phong có thể hơi trang trọng hoặc quá "chuẩn mực", thiếu đi sự dí dỏm, cá tính hoặc giọng điệu riêng biệt. Nó cũng có xu hướng trả lời an toàn, tránh đưa ra các ý kiến gây tranh cãi hoặc có tính chủ quan cao.
Khả năng thích ứng (Prompt-dependent): Phong cách của ChatGPT có thể thay đổi đáng kể tùy thuộc vào cách bạn ra lệnh (prompt). Nếu bạn yêu cầu một văn phong sáng tạo, hài hước, hoặc chuyên nghiệp, nó có thể điều chỉnh tương đối tốt.
Thỉnh thoảng lặp lại: Trong một số trường hợp, đặc biệt với các văn bản dài, có thể xuất hiện sự lặp lại về cấu trúc câu hoặc ý tưởng.
Grok được phát triển bởi xAI của Elon Musk, được thiết kế với một phong cách khác biệt nhằm nổi bật trên thị trường:
Thông minh và hài hước: Điểm đặc trưng nhất của Grok là khả năng kết hợp sự thông minh với một chút hài hước, châm biếm, thậm chí là "cà khịa". Điều này phản ánh rõ ràng tính cách của Elon Musk và sự tương tác với dữ liệu từ nền tảng X (trước đây là Twitter).
Trực tiếp và thẳng thắn: Grok có xu hướng đưa ra câu trả lời trực tiếp, không vòng vo. Nó ít khi né tránh các câu hỏi nhạy cảm và đôi khi còn đưa ra những quan điểm táo bạo.
Giọng điệu "thông thái nhưng không quá nghiêm túc": Nó có thể cung cấp thông tin chính xác nhưng không mang vẻ quá học thuật hay khô khan, thay vào đó là một giọng điệu tự tin, pha chút ngạo nghễ.
Tương tác "kiểu X": Phong cách này rất phù hợp với môi trường của X, nơi sự dí dỏm và phản biện nhanh nhạy được đánh giá cao.
Gemini được thiết kế để trở nên đa năng và tích hợp sâu với hệ sinh thái của Google:
Thông tin toàn diện và có cấu trúc: Gemini thường cung cấp thông tin rất đầy đủ, có cấu trúc rõ ràng với các gạch đầu dòng, tiêu đề phụ. Nó giỏi trong việc tổng hợp thông tin từ nhiều nguồn.
Dễ đọc và dễ hiểu: Văn phong thường rõ ràng, dễ hiểu, phù hợp với nhiều đối tượng người dùng.
Tích hợp tốt với dữ liệu thực tế: Nhờ được Google hậu thuẫn, Gemini có khả năng truy cập và xử lý thông tin cập nhật từ thế giới thực (ví dụ: Google Search, Google Workspace), giúp các câu trả lời mang tính thời sự và chính xác hơn về mặt dữ liệu.
Ít cá tính hơn (so với Grok): Mặc dù hiệu quả và thông tin, phong cách của Gemini thường không mang nhiều cá tính hoặc sự dí dỏm như Grok. Nó trung tính và hướng đến việc cung cấp thông tin đáng tin cậy.
Thích ứng với các chế độ (modes): Với các phiên bản khác nhau (Nano, Pro, Ultra) và các chế độ như "Creative", "Balanced", "Concise", Gemini có khả năng điều chỉnh phong cách để phù hợp với yêu cầu cụ thể hơn.
Copilot (Microsoft)thường được tích hợp vào các ứng dụng của Microsoft (như Microsoft 365, Windows, Edge) và kế thừa từ các mô hình của OpenAI (ví dụ GPT-4). Phong cách của nó thường phản ánh mục đích chính là hỗ trợ năng suất:
Thực dụng và hướng đến tác vụ: Copilot được tối ưu hóa để giúp người dùng hoàn thành công việc cụ thể (viết email, tạo báo cáo, tóm tắt tài liệu, tạo bản trình bày). Do đó, phong cách của nó thường trực tiếp, tập trung vào kết quả.
Chuyên nghiệp và phù hợp với ngữ cảnh công việc: Văn phong thường mang tính chất chuyên nghiệp, phù hợp với môi trường doanh nghiệp. Nó có thể tạo ra các văn bản thương mại, email, hoặc tài liệu kỹ thuật một cách hiệu quả.
Hiệu quả trong việc tóm tắt và mở rộng: Copilot rất giỏi trong việc tóm tắt các tài liệu dài hoặc mở rộng các ý tưởng ngắn gọn thành văn bản chi tiết hơn.
Ít sáng tạo hoặc quá "chất" (so với các mô hình khác): Khi được dùng cho các tác vụ sáng tạo độc lập hoặc yêu cầu cá tính mạnh, phong cách của Copilot có thể không nổi bật bằng các mô hình được thiết kế chuyên biệt cho mục đích đó. Như Anne-Kathrin Gerstlauer đã đề cập, nó có thể phù hợp hơn cho các bài thuyết trình hơn là sáng tạo văn bản tự do.
Công cụ gây kinh ngạc của Google Khả năng tạo hình ảnh chất lượng cao của Gemini thực sự khiến người dùng phải kinh ngạc. Google gần đây đã công bố mô hình AI mới mang tên Imagen 4 tại sự kiện I/O 2025. Mô hình này được cho là nhanh hơn và tốt hơn so với phiên bản trước đó, Imagen 3, vốn đã được đánh giá cao. Google...
Tiêu điểm
Tin đang nóng
Tin mới nhất

Windows 11 chính thức vượt Windows 10 về độ phổ quát

Phát hiện điểm mù trong AI thị giác có thể bị tin tặc tấn công

5 cách đầu tư tiền điện tử hiệu quả cho người mới

Cường quốc công nghệ triển khai sáng kiến AI y tế mang tính đột phá

Lý do khiến Apple loại bỏ Face ID trên iPhone gập

Cần làm gì khi dung lượng iCloud liên tục báo đầy?

Cách khắc phục sự cố Wi-Fi trên Windows 11 dễ dàng, tiện lợi

Bên trong phòng thử nghiệm độ bền iPhone của Apple

X cho phép bot AI kiểm chứng thông tin: Cách mạng hay rủi ro tiềm ẩn?

Microsoft ra mắt vùng dịch vụ điện toán đám mây mới tại Áo

Google đối mặt 'bão' pháp lý tại EU

Cách thức khai thác AI hiệu quả trong nghiên cứu và viết học thuật
Có thể bạn quan tâm

Con gái duy nhất của Hoa hậu Thu Hoài: Nói 3 thứ tiếng, 25 tuổi làm Phó giám đốc
Sao việt
06:26:57 09/07/2025
Những thực phẩm giàu nước giúp bạn luôn sảng khoái trong mùa hè
Sức khỏe
06:19:03 09/07/2025
Hành trình chưa kể của đội tuyển ZingSpeed Mobile Việt Nam trước thềm Asian Cup 2025
Mọt game
06:17:54 09/07/2025
Rixos ra mắt tại Đông Nam Á với khu nghỉ dưỡng đầu tiên tại đảo ngọc Phú Quốc
Du lịch
06:16:21 09/07/2025
Ra giữa đường ray khi gác chắn đã hạ, người đàn ông bị tàu tông tử vong tại chỗ
Tin nổi bật
06:10:52 09/07/2025
Đạo diễn Khương Ngọc: 'Cục vàng của ngoại' sẽ bày biện tất cả những gì quý giá nhất trong ký ức của tôi
Hậu trường phim
06:05:38 09/07/2025
Nga triển khai radar hiếm ở Crimea
Thế giới
23:43:00 08/07/2025
Anne Hathaway hé lộ người bạn thân nhất ở Hollywood
Sao âu mỹ
22:54:17 08/07/2025
Con dâu NSƯT Kim Phương: Chồng bị lây tính nói nhiều từ tôi
Tv show
22:52:02 08/07/2025
Ca sĩ bolero Thu Hường từng được nhận xét là 'bản sao' Như Quỳnh giờ ra sao?
Nhạc việt
22:46:31 08/07/2025