Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Mô hình ngôn ngữ lớn (LLM) do người Việt phát triển triển khai loạt ứng dụng hữu ích phục vụ nhu cầu tra cứu thông tin, giao tiếp của người dùng, ghi nhận hàng triệu lượt truy cập.
Ứng dụng của mô hình AI Việt đang thu hút hàng triệu lượt truy cập
Được phát triển bởi đội ngũ kỹ sư người Việt của Zalo, mô hình ngôn ngữ lớn với 13 tỷ tham số đang mang tới loạt ứng dụng thực tế thu hút đông đảo người dùng truy cập và sử dụng hàng tháng. Nổi bật là Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA – Official Account (Tài khoản chính thức) trên Zalo, cung cấp bộ 3 tính năng gồm Hỏi đáp các chủ đề khác nhau như khoa học, lịch sử, luật giao thông…; Sáng tạo nội dung như viết văn, soạn email, tin đăng mạng xã hội …; và Giải trí bằng cách đưa ra các gợi ý về địa điểm du lịch , âm nhạc , sách…
Thống kê của đội ngũ phát triển cho thấy trợ lý này đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong gần 2 tháng.
Kiki Info tích hợp trên nền tảng nhắn tin Zalo.
Một ứng dụng khác cũng do mô hình ngôn ngữ lớn của Zalo phát triển là thiệp AI, hiện đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Đây là số liệu được tổng hợp trong vòng 2 tháng, người dùng sử dụng thiệp AI để trao gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.
Các ứng dụng đều đang được người dùng đánh giá cao bởi trải nghiệm thông minh, giúp rút ngắn thời gian tìm kiếm và đưa ra quyết định trong cuộc sống. Đồng thời giúp việc kết nối với các mối quan hệ trở nên thú vị và gắn kết hơn.
Mô hình LLM của Zalo được phát triển bằng kỹ thuật huấn luyện từ đầu – triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định, giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình.
Kết thúc năm 2024 vừa qua, mô hình LLM của Zalo cán đích ở vị trí Top 2 trên bảng xếp hạng VMLU – Nền tảng đánh giá và xếp hạng năng lực tiếng Việt của các LLM (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models). Cụ thể, mô hình ngôn ngữ lớn của Zalo vươn lên vị trí số 2 trên bảng xếp hạng các mô hình được huấn luyện từ đầu, chỉ xếp sau Llama-3-70B của Meta, chính thức vượt qua các tên tuổi lớn như GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).
Bảng xếp hạng năm 2024 các LLM xây dựng từ đầu với mô hình LLM của Zalo vào Top 2.
Đây là thành công lớn với một mô hình ngôn ngữ lớn do người Việt phát triển, nhất là khi gặp phải không ít hạn chế trong những ngày đầu phát triển. Trong khi các công ty lớn trên thế giới sở hữu hàng nghìn GPU mới nhất từ Nvidia thì tại Việt Nam, thời điểm đó các kỹ sư vẫn chưa được trang bị đầy đủ hạ tầng máy chủ cần thiết.
Video đang HOT
Đồng thời, tiếng Việt cũng được xếp vào nhóm có tài nguyên dữ liệu nghèo nàn hơn hàng chục lần so với tiếng Anh hay tiếng Trung. Bên cạnh đó, Việt Nam cũng còn những hạn chế về nguồn lực con người và kinh nghiệm huấn luyện LLM khi so sánh với các quốc gia phát triển trên thế giới.
Zalo đã có chiến lược phát triển để khắc phục những hạn chế về môi trường huấn luyện so với thế giới. Bằng việc trang bị hạ tầng tính toán với 8 máy chủ DGX H100, mô hình LLM đã được phát triển trực tiếp bằng dòng GPU mới và khan hiếm nhất của Nvidia lúc đó với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second – một petaFLOP tương đương với 10 triệu tỷ phép tính/giây).
Hệ thống máy chủ của Zalo có năng lực xử lý ưu việt.
Đồng thời dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt. Thông qua hàng loạt nghiên cứu thực hiện trên các GPU dân dụng nhỏ, các kỹ sư của Zalo cũng đã tranh thủ trang bị kiến thức và năng lực huấn luyện LLM để tạo dựng nền tảng sẵn sàng ngay khi sở hữu hạ tầng tính toán lớn.
Định hướng phát triển đúng đắn đã giúp Zalo phát triển thành công mô hình ngôn ngữ lớn với 7 tỷ tham số tập trung vào tiếng Việt chỉ sau 6 tháng huấn luyện vào năm 2023, đạt 150% năng lực so với GPT3.5 của OpenAI trên Bộ tiêu chuẩn VMLU. Và hiện tại là vượt qua hàng loạt tên tuổi toàn cầu trên bảng xếp hạng VMLU 2024, đồng thời đưa mô hình nghiên cứu vào triển khai trên thực tế cho cộng đồng.
Mô hình LLM của Zalo thi đấu với loạt mô hình trên thế giới như ChatGPT 3.5, ChatGPT 4.0, Llama, PhởGPT và một người chơi thật trong lần đầu ra mắt năm 2023.
Theo Zalo, mô hình LLM sẽ tiếp tục được đầu tư huấn luyện để mang tới nhiều hơn các ứng dụng AI đẳng cấp thế giới cho người dùng. Qua đó, làm chủ công nghệ AI tiên tiến, hướng tới kỷ nguyên phát triển công nghệ của đất nước với định hướng đột phá về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia.
AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta?
Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình.
Mỗi mô hình AI có phong cách ngôn ngữ khác nhau
Liệu văn bản do AI tạo ra có nghèo nàn về mặt ngôn ngữ?
Không hẳn, theo chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer. Vấn đề nằm ở việc sử dụng sai mục đích trí tuệ nhân tạo để tạo nội dung. Tuy nhiên, nếu tuân thủ một vài nguyên tắc, người dùng hoàn toàn có thể cải thiện kỹ năng viết nhờ vào AI.
Theo Gerstlauer, điều quan trọng là phải hình thành hiểu biết cơ bản về ngôn ngữ đúng. Bà cũng đưa ra những mẹo mà người dùng có thể áp dụng để viết ra những văn bản tốt hơn với sự hỗ trợ của AI.
Bản thân bà Gerstlauer cũng sử dụng Claude. Bà dùng phần mềm AI này, trong số các mục đích khác, để soạn bản tin điện tử. Tác giả cuốn Texthacks đã huấn luyện chatbot bằng một loạt bản tin mà bà cho là thành công.
Làm gì để viết tốt với AI
Lời khuyên đầu tiên của bà để viết tốt với AI là: tải lên bốn đến năm ví dụ văn bản đã viết thành công. Bà cũng khuyến nghị nên thiết lập những quy tắc ngôn ngữ cơ bản như sau: Viết câu ngắn; Lược bỏ các từ đệm; Viết ở thể chủ động; Tránh lối viết danh từ hóa
Lựa chọn công cụ cũng có ảnh hưởng. Theo bà, Microsoft Copilot không phù hợp để sáng tạo nội dung văn bản - phần mềm này phù hợp hơn cho việc thuyết trình. Trong trải nghiệm cá nhân, Claude viết tự nhiên và gần gũi hơn ChatGPT.
Công cụ phổ biến này đôi khi lại có xu hướng dùng ngôn ngữ quá chuyên nghiệp. Điều đó dễ dẫn đến tình trạng lạm dụng các từ thông dụng sáo rỗng, khiến văn bản trở nên hời hợt - điều mà người dùng có thể dễ dàng nhận ra. Nữ nhà báo này cũng khuyên nên dùng AI như một công cụ phản hồi.
Phong cách viết một số mô hình phổ biến
ChatGPT của OpenAI, đặc biệt là các phiên bản như GPT-3.5 và GPT-4, thường được biết đến với phong cách:
Lưu loát và tự nhiên: ChatGPT tạo ra văn bản rất trôi chảy, có ngữ pháp và cú pháp chuẩn mực, đọc khá tự nhiên và giống con người. Đây là điểm mạnh lớn nhất của nó.
Chi tiết và đầy đủ: Nó có xu hướng cung cấp thông tin khá chi tiết và toàn diện về một chủ đề, thường đưa ra các điểm chính, ví dụ và giải thích.
Hơi trang trọng và an toàn: Đôi khi, văn phong có thể hơi trang trọng hoặc quá "chuẩn mực", thiếu đi sự dí dỏm, cá tính hoặc giọng điệu riêng biệt. Nó cũng có xu hướng trả lời an toàn, tránh đưa ra các ý kiến gây tranh cãi hoặc có tính chủ quan cao.
Khả năng thích ứng (Prompt-dependent): Phong cách của ChatGPT có thể thay đổi đáng kể tùy thuộc vào cách bạn ra lệnh (prompt). Nếu bạn yêu cầu một văn phong sáng tạo, hài hước, hoặc chuyên nghiệp, nó có thể điều chỉnh tương đối tốt.
Thỉnh thoảng lặp lại: Trong một số trường hợp, đặc biệt với các văn bản dài, có thể xuất hiện sự lặp lại về cấu trúc câu hoặc ý tưởng.
Grok được phát triển bởi xAI của Elon Musk, được thiết kế với một phong cách khác biệt nhằm nổi bật trên thị trường:
Thông minh và hài hước: Điểm đặc trưng nhất của Grok là khả năng kết hợp sự thông minh với một chút hài hước, châm biếm, thậm chí là "cà khịa". Điều này phản ánh rõ ràng tính cách của Elon Musk và sự tương tác với dữ liệu từ nền tảng X (trước đây là Twitter).
Trực tiếp và thẳng thắn: Grok có xu hướng đưa ra câu trả lời trực tiếp, không vòng vo. Nó ít khi né tránh các câu hỏi nhạy cảm và đôi khi còn đưa ra những quan điểm táo bạo.
Giọng điệu "thông thái nhưng không quá nghiêm túc": Nó có thể cung cấp thông tin chính xác nhưng không mang vẻ quá học thuật hay khô khan, thay vào đó là một giọng điệu tự tin, pha chút ngạo nghễ.
Tương tác "kiểu X": Phong cách này rất phù hợp với môi trường của X, nơi sự dí dỏm và phản biện nhanh nhạy được đánh giá cao.
Gemini được thiết kế để trở nên đa năng và tích hợp sâu với hệ sinh thái của Google:
Thông tin toàn diện và có cấu trúc: Gemini thường cung cấp thông tin rất đầy đủ, có cấu trúc rõ ràng với các gạch đầu dòng, tiêu đề phụ. Nó giỏi trong việc tổng hợp thông tin từ nhiều nguồn.
Dễ đọc và dễ hiểu: Văn phong thường rõ ràng, dễ hiểu, phù hợp với nhiều đối tượng người dùng.
Tích hợp tốt với dữ liệu thực tế: Nhờ được Google hậu thuẫn, Gemini có khả năng truy cập và xử lý thông tin cập nhật từ thế giới thực (ví dụ: Google Search, Google Workspace), giúp các câu trả lời mang tính thời sự và chính xác hơn về mặt dữ liệu.
Ít cá tính hơn (so với Grok): Mặc dù hiệu quả và thông tin, phong cách của Gemini thường không mang nhiều cá tính hoặc sự dí dỏm như Grok. Nó trung tính và hướng đến việc cung cấp thông tin đáng tin cậy.
Thích ứng với các chế độ (modes): Với các phiên bản khác nhau (Nano, Pro, Ultra) và các chế độ như "Creative", "Balanced", "Concise", Gemini có khả năng điều chỉnh phong cách để phù hợp với yêu cầu cụ thể hơn.
Copilot (Microsoft)thường được tích hợp vào các ứng dụng của Microsoft (như Microsoft 365, Windows, Edge) và kế thừa từ các mô hình của OpenAI (ví dụ GPT-4). Phong cách của nó thường phản ánh mục đích chính là hỗ trợ năng suất:
Thực dụng và hướng đến tác vụ: Copilot được tối ưu hóa để giúp người dùng hoàn thành công việc cụ thể (viết email, tạo báo cáo, tóm tắt tài liệu, tạo bản trình bày). Do đó, phong cách của nó thường trực tiếp, tập trung vào kết quả.
Chuyên nghiệp và phù hợp với ngữ cảnh công việc: Văn phong thường mang tính chất chuyên nghiệp, phù hợp với môi trường doanh nghiệp. Nó có thể tạo ra các văn bản thương mại, email, hoặc tài liệu kỹ thuật một cách hiệu quả.
Hiệu quả trong việc tóm tắt và mở rộng: Copilot rất giỏi trong việc tóm tắt các tài liệu dài hoặc mở rộng các ý tưởng ngắn gọn thành văn bản chi tiết hơn.
Ít sáng tạo hoặc quá "chất" (so với các mô hình khác): Khi được dùng cho các tác vụ sáng tạo độc lập hoặc yêu cầu cá tính mạnh, phong cách của Copilot có thể không nổi bật bằng các mô hình được thiết kế chuyên biệt cho mục đích đó. Như Anne-Kathrin Gerstlauer đã đề cập, nó có thể phù hợp hơn cho các bài thuyết trình hơn là sáng tạo văn bản tự do.
Công cụ gây kinh ngạc của Google Khả năng tạo hình ảnh chất lượng cao của Gemini thực sự khiến người dùng phải kinh ngạc. Google gần đây đã công bố mô hình AI mới mang tên Imagen 4 tại sự kiện I/O 2025. Mô hình này được cho là nhanh hơn và tốt hơn so với phiên bản trước đó, Imagen 3, vốn đã được đánh giá cao. Google...











Tiêu điểm
Tin đang nóng
Tin mới nhất

Google Maps trên Android sắp có thể chỉ đường không cần mở ứng dụng

Thấy gì từ cuộc 'đột kích' của Nhà Trắng vào ngành chip?

Những phần mềm diệt virus bị xem là tệ hơn chương trình độc hại

Samsung lên kế hoạch sản xuất 50.000 điện thoại gập ba

Năm ngành nghề sẽ bị AI hoàn toàn 'chiếm lĩnh' vào năm 2026

Microsoft nói gì về cáo buộc bản cập nhật Windows 11 làm hư ổ SSD

Tận thấy robot hình người của Vingroup đi lại, chào cờ

Apple tìm cách bắt kịp Samsung, Google

TPHCM: Hiện thực hóa tầm nhìn trở thành trung tâm công nghệ hàng đầu khu vực

Thêm nhiều nước không còn được sử dụng khay SIM vật lý trên iPhone 17

iPhone của Apple đang tụt hậu nhưng không phải do AI

Lý do công nghệ này được ưu tiên khi mua pin lưu trữ điện mặt trời
Có thể bạn quan tâm

Tổng thống Trump nói Mỹ có thể tăng cường hiện diện quân sự tại Ba Lan
Thế giới
22:11:37 04/09/2025
Bất ngờ trước mặt mộc của Lưu Diệc Phi
Sao châu á
22:09:35 04/09/2025
Hình ảnh mới nhất của NSND Công Lý sau cấp cứu, Mỹ Tâm nói cần cố gắng hơn nữa
Sao việt
22:06:12 04/09/2025
Thiếu tá công an Trúc Mai sốc trước sự bức xúc cực độ của khán giả VTV
Hậu trường phim
22:03:01 04/09/2025
Phạt tài xế "liều mạng" lái ô tô đi ngược chiều cao tốc Hà Nội - Bắc Giang
Pháp luật
22:01:08 04/09/2025
Trang Pháp ngất xỉu ở Sao nhập ngũ
Tv show
21:59:36 04/09/2025
Mỗi lần được chồng khen ngợi, tôi chỉ muốn quỳ xuống xin anh ly hôn
Góc tâm tình
21:54:52 04/09/2025
Phạm Anh Khoa sau biến cố: 'Tôi biết đâu là điểm dừng'
Nhạc việt
21:53:18 04/09/2025
Khách chê mẹt cơm 1,5 triệu đồng tại quán ăn ở Tuyên Quang, chủ nói gì?
Netizen
21:50:10 04/09/2025
Carlo Ancelotti giải thích lý do không triệu tập Neymar
Sao thể thao
21:27:44 04/09/2025