Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập

Vân Nguyễn - Trân Minh15:03 30/06/2025

Mô hình ngôn ngữ lớn (LLM) do người Việt phát triển triển khai loạt ứng dụng hữu ích phục vụ nhu cầu tra cứu thông tin, giao tiếp của người dùng, ghi nhận hàng triệu lượt truy cập.

Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập

Được phát triển bởi đội ngũ kỹ sư người Việt của Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đang mang tới loạt ứng dụng thực tế thu hút đông đảo người dùng truy cập và sử dụng hàng tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA – Official Account (Tài khoản chính thức) trên Zalo, cung cấp bộ 3 tính năng gồm Hỏi đáp các chủ đề khác nhau như khoa học, lịch sử, luật giao thông…; Sáng tạo nội dung như viết văn, soạn email, tin đăng mạng xã hội …; và Giải trí bằng cách đưa ra các gợi ý về địa điểm du lịch , âm nhạc , sách…

Thống kê của đội ngũ phát triển cho thấy trợ lý này đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong gần 2 tháng.

Kiki Info tích hợp trên nền tảng nhắn tin Zalo.

Một ứng dụng khác cũng do mô hình ngôn ngữ lớn của Zalo phát triển là thiệp AI, hiện đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Đây là số liệu được tổng hợp trong vòng 2 tháng, người dùng sử dụng thiệp AI để trao gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.

Các ứng dụng đều đang được người dùng đánh giá cao bởi trải nghiệm thông minh, giúp rút ngắn thời gian tìm kiếm và đưa ra quyết định trong cuộc sống. Đồng thời giúp việc kết nối với các mối quan hệ trở nên thú vị và gắn kết hơn.

Mô hình LLM của Zalo được phát triển bằng kỹ thuật huấn luyện từ đầu – triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định, giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình.

Kết thúc năm 2024 vừa qua, mô hình LLM của Zalo cán đích ở vị trí Top 2 trên bảng xếp hạng VMLU – Nền tảng đánh giá và xếp hạng năng lực tiếng Việt của các LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). Cụ thể, mô hình ngôn ngữ lớn của Zalo vươn lên vị trí số 2 trên bảng xếp hạng các mô hình được huấn luyện từ đầu, chỉ xếp sau Llama-3-70B của Meta, chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).

Bảng xếp hạng năm 2024 các LLM xây dựng từ đầu với mô hình LLM của Zalo vào Top 2.

Đây là thành công lớn với một mô hình ngôn ngữ lớn do người Việt phát triển, nhất là khi gặp phải không ít hạn chế trong những ngày đầu phát triển. Trong khi các công ty lớn trên thế giới sở hữu hàng nghìn GPU mới nhất từ Nvidia thì tại Việt Nam, thời điểm đó các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.

Video đang HOT

Đồng thời, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Bên cạnh đó, Việt Nam cũng còn những hạn chế về nguồn lực con người và kinh nghiệm huấn luyện LLM khi so sánh với các quốc gia phát triển trên thế giới.

Zalo đã có chiến lược phát triển để khắc phục những hạn chế về môi trường huấn luyện so với thế giới. Bằng việc trang bị hạ tầng tính toán với 8 máy chủ DGX H100, mô hình LLM đã được phát triển trực tiếp bằng dòng GPU mới và khan hiếm nhất của Nvidia lúc đó với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second – một petaFLOP tương đương với 10 triệu tỷ phép tính/giây).

Hệ thống máy chủ của Zalo có năng lực xử lý ưu việt.

Đồng thời dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt. Thông qua hàng loạt nghiên cứu thực hiện trên các GPU dân dụng nhỏ, các kỹ sư của Zalo cũng đã tranh thủ trang bị kiến thức và năng lực huấn luyện LLM để tạo dựng nền tảng sẵn sàng ngay khi sở hữu hạ tầng tính toán lớn.

Định hướng phát triển đúng đắn đã giúp Zalo phát triển thành công mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt chỉ sau 6 tháng huấn luyện vào năm 2023, đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn VMLU. Và hiện tại là vượt qua hàng loạt tên tuổi toàn cầu trên bảng xếp hạng VMLU 2024, đồng thời đưa mô hình nghiên cứu vào triển khai trên thực tế cho cộng đồng.

Mô hình LLM của Zalo thi đấu với loạt mô hình trên thế giới như ChatGPT 3.5, ChatGPT 4.0, Llama, PhởGPT và một người chơi thật trong lần đầu ra mắt năm 2023.

Theo Zalo, mô hình LLM sẽ tiếp tục được đầu tư huấn luyện để mang tới nhiều hơn các ứng dụng AI đẳng cấp thế giới cho người dùng. Qua đó, làm chủ công nghệ AI tiên tiến, hướng tới kỷ nguyên phát triển công nghệ của đất nước với định hướng đột phá về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.

AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta?

Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình.

Mỗi mô hình AI có phong cách ngôn ngữ khác nhau

Liệu văn bản do AI tạo ra có nghèo nàn về mặt ngôn ngữ?

Không hẳn, theo chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer. Vấn đề nằm ở việc sử dụng sai mục đích trí tuệ nhân tạo để tạo nội dung. Tuy nhiên, nếu tuân thủ một vài nguyên tắc, người dùng hoàn toàn có thể cải thiện kỹ năng viết nhờ vào AI.

Theo Gerstlauer, điều quan trọng là phải hình thành hiểu biết cơ bản về ngôn ngữ đúng. Bà cũng đưa ra những mẹo mà người dùng có thể áp dụng để viết ra những văn bản tốt hơn với sự hỗ trợ của AI.

Bản thân bà Gerstlauer cũng sử dụng Claude. Bà dùng phần mềm AI này, trong số các mục đích khác, để soạn bản tin điện tử. Tác giả cuốn Texthacks đã huấn luyện chatbot bằng một loạt bản tin mà bà cho là thành công.

Làm gì để viết tốt với AI

Lời khuyên đầu tiên của bà để viết tốt với AI là: tải lên bốn đến năm ví dụ văn bản đã viết thành công. Bà cũng khuyến nghị nên thiết lập những quy tắc ngôn ngữ cơ bản như sau: Viết câu ngắn; Lược bỏ các từ đệm; Viết ở thể chủ động; Tránh lối viết danh từ hóa

Lựa chọn công cụ cũng có ảnh hưởng. Theo bà, Microsoft Copilot không phù hợp để sáng tạo nội dung văn bản - phần mềm này phù hợp hơn cho việc thuyết trình. Trong trải nghiệm cá nhân, Claude viết tự nhiên và gần gũi hơn ChatGPT.

Công cụ phổ biến này đôi khi lại có xu hướng dùng ngôn ngữ quá chuyên nghiệp. Điều đó dễ dẫn đến tình trạng lạm dụng các từ thông dụng sáo rỗng, khiến văn bản trở nên hời hợt - điều mà người dùng có thể dễ dàng nhận ra. Nữ nhà báo này cũng khuyên nên dùng AI như một công cụ phản hồi.

Phong cách viết một số mô hình phổ biến

ChatGPT của OpenAI, đặc biệt là các phiên bản như GPT-3.5 và GPT-4, thường được biết đến với phong cách:

Lưu loát và tự nhiên: ChatGPT tạo ra văn bản rất trôi chảy, có ngữ pháp và cú pháp chuẩn mực, đọc khá tự nhiên và giống con người. Đây là điểm mạnh lớn nhất của nó.

Chi tiết và đầy đủ: Nó có xu hướng cung cấp thông tin khá chi tiết và toàn diện về một chủ đề, thường đưa ra các điểm chính, ví dụ và giải thích.

Hơi trang trọng và an toàn: Đôi khi, văn phong có thể hơi trang trọng hoặc quá "chuẩn mực", thiếu đi sự dí dỏm, cá tính hoặc giọng điệu riêng biệt. Nó cũng có xu hướng trả lời an toàn, tránh đưa ra các ý kiến gây tranh cãi hoặc có tính chủ quan cao.

Khả năng thích ứng (Prompt-dependent): Phong cách của ChatGPT có thể thay đổi đáng kể tùy thuộc vào cách bạn ra lệnh (prompt). Nếu bạn yêu cầu một văn phong sáng tạo, hài hước, hoặc chuyên nghiệp, nó có thể điều chỉnh tương đối tốt.

Thỉnh thoảng lặp lại: Trong một số trường hợp, đặc biệt với các văn bản dài, có thể xuất hiện sự lặp lại về cấu trúc câu hoặc ý tưởng.

Grok được phát triển bởi xAI của Elon Musk, được thiết kế với một phong cách khác biệt nhằm nổi bật trên thị trường:

Thông minh và hài hước: Điểm đặc trưng nhất của Grok là khả năng kết hợp sự thông minh với một chút hài hước, châm biếm, thậm chí là "cà khịa". Điều này phản ánh rõ ràng tính cách của Elon Musk và sự tương tác với dữ liệu từ nền tảng X (trước đây là Twitter).

Trực tiếp và thẳng thắn: Grok có xu hướng đưa ra câu trả lời trực tiếp, không vòng vo. Nó ít khi né tránh các câu hỏi nhạy cảm và đôi khi còn đưa ra những quan điểm táo bạo.

Giọng điệu "thông thái nhưng không quá nghiêm túc": Nó có thể cung cấp thông tin chính xác nhưng không mang vẻ quá học thuật hay khô khan, thay vào đó là một giọng điệu tự tin, pha chút ngạo nghễ.

Tương tác "kiểu X": Phong cách này rất phù hợp với môi trường của X, nơi sự dí dỏm và phản biện nhanh nhạy được đánh giá cao.

Gemini được thiết kế để trở nên đa năng và tích hợp sâu với hệ sinh thái của Google:

Thông tin toàn diện và có cấu trúc: Gemini thường cung cấp thông tin rất đầy đủ, có cấu trúc rõ ràng với các gạch đầu dòng, tiêu đề phụ. Nó giỏi trong việc tổng hợp thông tin từ nhiều nguồn.

Dễ đọc và dễ hiểu: Văn phong thường rõ ràng, dễ hiểu, phù hợp với nhiều đối tượng người dùng.

Tích hợp tốt với dữ liệu thực tế: Nhờ được Google hậu thuẫn, Gemini có khả năng truy cập và xử lý thông tin cập nhật từ thế giới thực (ví dụ: Google Search, Google Workspace), giúp các câu trả lời mang tính thời sự và chính xác hơn về mặt dữ liệu.

Ít cá tính hơn (so với Grok): Mặc dù hiệu quả và thông tin, phong cách của Gemini thường không mang nhiều cá tính hoặc sự dí dỏm như Grok. Nó trung tính và hướng đến việc cung cấp thông tin đáng tin cậy.

Thích ứng với các chế độ (modes): Với các phiên bản khác nhau (Nano, Pro, Ultra) và các chế độ như "Creative", "Balanced", "Concise", Gemini có khả năng điều chỉnh phong cách để phù hợp với yêu cầu cụ thể hơn.

Copilot (Microsoft)thường được tích hợp vào các ứng dụng của Microsoft (như Microsoft 365, Windows, Edge) và kế thừa từ các mô hình của OpenAI (ví dụ GPT-4). Phong cách của nó thường phản ánh mục đích chính là hỗ trợ năng suất:

Thực dụng và hướng đến tác vụ: Copilot được tối ưu hóa để giúp người dùng hoàn thành công việc cụ thể (viết email, tạo báo cáo, tóm tắt tài liệu, tạo bản trình bày). Do đó, phong cách của nó thường trực tiếp, tập trung vào kết quả.

Chuyên nghiệp và phù hợp với ngữ cảnh công việc: Văn phong thường mang tính chất chuyên nghiệp, phù hợp với môi trường doanh nghiệp. Nó có thể tạo ra các văn bản thương mại, email, hoặc tài liệu kỹ thuật một cách hiệu quả.

Hiệu quả trong việc tóm tắt và mở rộng: Copilot rất giỏi trong việc tóm tắt các tài liệu dài hoặc mở rộng các ý tưởng ngắn gọn thành văn bản chi tiết hơn.

Ít sáng tạo hoặc quá "chất" (so với các mô hình khác): Khi được dùng cho các tác vụ sáng tạo độc lập hoặc yêu cầu cá tính mạnh, phong cách của Copilot có thể không nổi bật bằng các mô hình được thiết kế chuyên biệt cho mục đích đó. Như Anne-Kathrin Gerstlauer đã đề cập, nó có thể phù hợp hơn cho các bài thuyết trình hơn là sáng tạo văn bản tự do.

Công cụ gây kinh ngạc của Google Khả năng tạo hình ảnh chất lượng cao của Gemini thực sự khiến người dùng phải kinh ngạc. Google gần đây đã công bố mô hình AI mới mang tên Imagen 4 tại sự kiện I/O 2025. Mô hình này được cho là nhanh hơn và tốt hơn so với phiên bản trước đó, Imagen 3, vốn đã được đánh giá cao. Google...

Bạn thấy bài viết này có hữu ích không?

Có

Không

Tin liên quan

Xem thêm Share

Xem nhiều

Sao nghĩ ra câu hát "hết kháng chiến con còn chưa về, mẹ ơi vui lên, mẹ có đứa con anh hùng" hay thế nhỉ?14:09

Phụ huynh rơi nước mắt khi con gái hát cùng Mỹ Tâm ngày Đại lễ 2/9, niềm tự hào gia đình kể sao cho hết!02:15

Nam chính Mưa Đỏ bị đồng đội bỏ lại ngay tại sân vận động Mỹ Đình vì có 1 hành động "quá mắc cỡ"00:33

Đây rồi màn đồng diễn được mong chờ nhất Đại lễ 2/9: Dàn nghệ sĩ hát liên khúc Khí Phách Việt Nam, Mỹ Tâm làm rung động triệu trái tim!13:13

Mỹ Tâm cất giọng đầy nội lực, cùng Double2T "rực cháy" ở concert quốc gia04:39

Vợ sinh con 1 tháng, bắt quả tang chồng quạt cho tiểu tam ngủ ngoài đường: Trước đây cũng suýt là... tiểu tam00:18

Khối Quân nhân Trung Quốc hát vang "Như có Bác trong ngày đại thắng"00:55

Mỹ Tâm gây sốt13:13

Tang lễ diễn viên Ngọc Trinh: NS Thành Lộc - Việt Hương đến tiễn biệt, dàn sao gửi hoa chia buồn00:35

Hai nghệ sĩ trẻ vinh dự trình diễn từ Đại lễ A50 tới A80: Đây chính là "trai tài gái giỏi" được Tổ quốc tin tưởng!16:29

Đám tang diễn viên Ngọc Trinh: NS Công Ninh khóc nghẹn, Quách Ngọc Tuyên ngồi thất thần, Nam Thư cùng dàn sao đến viếng00:38

Tiêu điểm

Tin đang nóng

Tin mới nhất

Google Maps trên Android sắp có thể chỉ đường không cần mở ứng dụng

12:44:17 04/09/2025

Theo PhoneArena, một trong những tính năng được người dùng Android mong chờ nhất cuối cùng bắt đầu xuất hiện, đó là khả năng xem chỉ đường Google Maps ngay trên màn hình khóa và thanh trạng thái.

Thấy gì từ cuộc 'đột kích' của Nhà Trắng vào ngành chip?

11:54:48 04/09/2025

Chính phủ Mỹ trở thành cổ đông lớn nhất của Intel nhưng nỗ lực vực dậy một công ty đang thua lỗ có thể là cuộc đột kích thất bại vào ngành chip.

Những phần mềm diệt virus bị xem là tệ hơn chương trình độc hại

11:24:11 04/09/2025

Phần mềm diệt virus được thiết kế để bảo vệ người dùng khỏi các mối đe dọa và chương trình độc hại tấn công máy tính.

Samsung lên kế hoạch sản xuất 50.000 điện thoại gập ba

11:09:25 04/09/2025

Sớm nhất trong tháng này, Samsung có thể giới thiệu smartphone gập ba khi nhiều thông tin cho biết hãng đã lên kế hoạch sản xuất 50.000 thiết bị đầu tiên.

Năm ngành nghề sẽ bị AI hoàn toàn 'chiếm lĩnh' vào năm 2026

09:17:10 03/09/2025

AI không còn là một khái niệm tương lai nữa; nó đã và đang thay đổi cách con người sống và làm việc! Một số tổ chức uy tín dự đoán AI có thể thay thế 300 triệu việc làm trong vài năm tới và 5 ngành sẽ bị AI hoàn toàn chiếm lĩnh vào năm ...

Microsoft nói gì về cáo buộc bản cập nhật Windows 11 làm hư ổ SSD

09:06:51 03/09/2025

Trong thời gian này, người dùng Windows 11 nên tránh để ổ SSD vượt quá 60% dung lượng nếu thường xuyên xử lý tệp lớn, sử dụng thêm tản nhiệt để giảm nguy cơ quá nhiệt, đồng thời bật xác thực hai yếu tố và sao lưu dữ liệu định kỳ.

Tận thấy robot hình người của Vingroup đi lại, chào cờ

12:46:33 02/09/2025

Biết đi bộ, bắt tay, vẫy chào và trò chuyện cùng khách tham quan, robot của Vingroup trở thành tâm điểm tại Triển lãm Thành tựu Đất nước khi thu hút hàng nghìn lượt trải nghiệm.

Apple tìm cách bắt kịp Samsung, Google

11:33:33 02/09/2025

Tin đồn cho biết Apple vẫn lưỡng lự trong quyết định thực hiện thương vụ, có thể tiêu tốn hàng tỷ USD. Bài viết nhấn mạnh Táo khuyết không ủng hộ việc trả nhiều tiền cho các thương vụ thâu tóm.

TPHCM: Hiện thực hóa tầm nhìn trở thành trung tâm công nghệ hàng đầu khu vực

11:31:53 02/09/2025

Thành phố hiện có mạng lưới giao thông tương đối phát triển cùng với các khu công nghệ cao đã được thiết lập, bao gồm Khu Công nghệ cao TPHCM, đã thu hút đầu tư nước ngoài đáng kể.

Thêm nhiều nước không còn được sử dụng khay SIM vật lý trên iPhone 17

11:20:14 02/09/2025

Apple lại vừa đưa ra một dấu hiệu cho thấy hãng đang chuẩn bị loại bỏ khe cắm thẻ SIM vật lý trên iPhone 17 tại nhiều quốc gia hơn trong năm nay.

iPhone của Apple đang tụt hậu nhưng không phải do AI

11:20:05 02/09/2025

Những tính năng của DeX khá hữu ích với các sinh viên và những chuyên gia. Hiện tại, khi dùng kèm phụ kiện, màn hình, bàn phím và touch pad đều được thiết kế để ghép nối với điện thoại Samsung DeX. Lợi ích là gì? Kết nối có thể rẻ và nh...

Lý do công nghệ này được ưu tiên khi mua pin lưu trữ điện mặt trời

11:12:05 02/09/2025

Trong khi hầu hết các loại pin lithium-ion không thích được sạc đầy và thường hoạt động tốt nhất ở mức 80% dung lượng, pin LiFePO4 có thể duy trì hiệu suất tối ưu khi được sạc đầy nhờ vào cấu trúc hóa học khác biệt của chúng.