Cách kỹ sư trẻ tạo khác biệt trong đấu trường AI hàng đầu Việt Nam
Mỗi đề bài trong cuộc thi Zalo AI Challenge 2021 đều có những điểm thú vị và mức độ thử thách riêng.
Zalo xem AI là làn sóng công nghệ mới, tất yếu và phải bắt kịp để phát triển. Vì thế, các dự án AI tại Zalo đều được đầu tư nghiêm túc. Điều này được chứng minh ở cuộc thi Zalo AI Challenge – sân chơi góp phần thu hẹp khoảng cách giữa AI với đời sống thực tiễn. Để khích lệ tinh thần các đội thi, ngoài tổng giá trị giải thưởng lên đến 300 triệu đồng, ban tổ chức Zalo AI Challenge 2021 còn nâng từ 120.000 USD lên 240.000 AWS Credits.
Năm nay, cuộc thi trở lại với 3 đề bài “5K compliance”, “Hum to song” và “Legal text retrieval”, dựa trên 3 loại dữ liệu mà Zalo tập trung xử lý là hình ảnh, âm thanh và ký tự tiếng Việt. Mỗi đề có thước đo riêng, “5K Compliance” đo bằng chỉ số F1, “Hum to song” đo bằng MRR và “Legal Text Retrieval” sử dụng số đo F2.
Tập trung định nghĩa và chú trọng tiền xử lý
Gắn bó với cuộc thi Zalo AI Challenge từ những ngày đầu, anh Chương Nguyễn cho biết định hướng của cuộc thi là không quá hàn lâm và phải gần gũi với đời sống văn hóa người Việt. Theo dõi Leaderboard, anh nhận định các đội thi tham gia cuộc thi năm nay có chất lượng tốt, trong 3-4 ngày đầu cuộc thi đã nhận những kết quả đáng nể.
Anh Chương Nguyễn chia sẻ bí quyết đạt hạng cao với đề “5K Compliance” và “Hum to song”.
Là “cha đẻ” của 2 đề bài là “5K Compliance” và “Hum to song”, anh Chương cho rằng bài toán 5K sẽ phù hợp với xã hội Việt Nam hiện tại khi dịch bệnh diễn biến phức tạp. Kết quả bài toán giúp các nhà quản lý, công ty, nơi tổ chức sự kiện… giảm thiểu rủi ro lây bệnh khi tổ chức các hoạt động đông người.
Trong khi đó, “Hum to Song” là đề thi thực dụng, vui vẻ và gần gũi trong đời sống hàng ngày. Mọi người có thể ngân nga theo nhịp điệu để tìm được ca khúc yêu thích của mình mà không cần nhớ tên hay thuộc lời bài hát.
Theo đánh giá của anh Chương, mỗi đề có điểm khó, điểm thú vị và hướng giải quyết riêng. “Đề ‘5K Compliance’ khó ở việc định nghĩa yếu tố khoảng cách. Với các góc máy, tiêu cự hay hoàn cảnh chụp khác nhau, khoảng cách 2 m nhìn trên ảnh sẽ khác nhau. Đề bài có những trường dữ liệu bị thiếu nên đó là thử thách và cũng là cơ hội cho các đội biết cách xử lý tình huống này. Kết quả bài toán sẽ khả quan khi ứng dụng vào các hệ thống quản lý tòa nhà, nơi công cộng…”, anh Chương phân tích.
Video đang HOT
Cũng theo anh Chương, bài toán “Hum to song” có 2 tín hiệu là “hum” và bài hát hơi xa nhau về độ liên quan. Vì thế, các giải pháp làm tốt sẽ là các giải pháp tiền xử lý để đưa 2 tín hiệu gần nhau hơn trước khi tiến hành huấn luyện mô hình. Kết quả bài toán này làm tiền đề cho các sản phẩm sau này tốt hơn.
Kết hợp linh hoạt các kỹ thuật
Cũng là người gắn bó với cuộc thi từ những ngày đầu, anh Trường Sơn cho biết ban ra đề luôn chọn đề bài gắn với thực tiễn vì mục đích cuối cùng của cuộc thi là mang AI phục vụ cuộc sống người Việt, cung cấp các bộ dữ liệu chuẩn để bất cứ ai muốn nghiên cứu về AI đều có dữ liệu để thực nghiệm.
Anh Trường Sơn chia sẻ bí quyết đạt thứ hạng cao với đề “Legal text retrieval”.
Những năm gần đây, anh Trường Sơn nghiên cứu các bài toán AI liên quan pháp luật. Anh nhận thấy nhu cầu tìm kiếm văn bản pháp luật thường trực trong cuộc sống người Việt. Đây là lý do đề bài “Legal text retrieval” ra đời, nhằm xây dựng hệ thống giúp người dân tìm kiếm văn bản pháp luật dễ dàng hơn. Các chuyên gia về pháp lý cũng rút ngắn thời gian tìm kiếm tài liệu.
“Đề bài ‘Legal text retrieval’ vừa dễ vừa khó. Dễ vì đôi khi các câu hỏi pháp luật sử dụng những thuật ngữ chuyên ngành nên dễ tìm thấy điều luật liên quan. Tuy nhiên, nhiều câu hỏi cần sự suy luận tổng hợp nên khó tìm được bằng phương pháp so sánh từ khoá thông thường”, anh Sơn cho biết.
Bí quyết chung cho 3 đề bài Zalo AI Challenge 2021.
Vì thế với đề bài này, các đội thi phải kết hợp linh hoạt các kỹ thuật khác nhau, ngoài việc so khớp từ khoá còn phải khớp về ngữ nghĩa và cần vận dụng các kỹ thuật tiên tiến trong xử lý ngôn ngữ tự nhiên, khai thác văn bản mới đạt hiệu quả cao.
Lý do Zalo AI Challenge thu hút gần 400 đội thi chỉ sau 24h mở đăng ký?
Bên cạnh giải thưởng hấp dẫn, mô hình thi đấu thú vị thì đề thi Zalo AI Challenge luôn là lý do khiến cuộc thi được đánh giá cao.
Tính thực tiễn của đề bài giúp các đội thi rèn luyện và tiến bộ nhanh chóng. Các bài thi thắng giải được khuyến khích công bố mã nguồn ra cộng đồng.
Không chỉ tập trung vào các đề bài ứng dụng và tận dụng tốt nguồn dữ liệu phong phú của Zalo như hình ảnh, âm nhạc, ký tự tiếng Việt..., đề thi Zalo AI Challenge còn chú trọng yếu tố thời sự, phù hợp với bối cảnh và nhu cầu thực tiễn xã hội.
Cách đây vài năm, Zalo AI Challenge từng gây sốt khi đưa vào đề bài nhận diện và khoanh vùng "đường lưỡi bò phi pháp". Năm nay, cuộc thi thu hút sự quan tâm với đề tài liên quan đến phòng chống Covid.
"5K Compliance", "Hum to song" và "Legal Text Retrieval" là 3 đề bài của Zalo AI Challenge 2021
"5K Compliance" - Xác định nhóm người trong ảnh có tuân thủ quy tắc 5K hay không là 1 trong 3 thử thách ở Zalo AI Challenge. Trong thời gian dịch Covid-19 bùng phát, Chính phủ Việt Nam đã đẩy mạnh thông điệp an toàn sức khỏe cộng đồng "5K": Khẩu trang - Khử khuẩn - Khoảng cách - Không tập trung - Khai báo y tế. Trong đó khẩu trang và khoảng cách là 2/5 yếu tố đã được chứng minh là cực kỳ thành công trong việc ngăn chặn việc lây lan virus.
Tính tới thời điểm hiện tại, đề bài "5K Compliance" đang được nhiều đội thi lựa chọn nhất trong 3 đề thi. Nguyễn Thanh Sơn, 28 tuổi và hiện đang là kỹ sư AI tại TP.HCM cho biết bạn chọn đề bài này vì đề phù hợp với chuyên ngành thị giác máy tính của bạn cũng như phù hợp với yêu cầu thực tiễn trong bối cảnh đại dịch.
"Mình thấy đề bài "5K Compliance" vô cùng thú vị, dữ liệu được gán nhãn không hoàn chỉnh, chứa nhiều dữ liệu bị nhiễu, rất giống với tính chất của các bộ dữ liệu trong thực tế. Đề đòi hỏi các thí sinh phải vận dụng nhiều kỹ thuật và am hiểu về xử lý dữ liệu mới tìm ra được giải pháp có kết quả tốt", Thanh Sơn chia sẻ.
Zalo AI Challenge thu hút nhiều thí sinh bởi đề thi luôn mang tính tính ứng dụng thực tiễn cao
Bên cạnh bài toán mang tính thời sự, các đề bài khác của Zalo AI Challenge 2021 cũng được đánh giá cao bởi sự thú vị và tính ứng dụng của nó. Đơn cử như "Hum to song" - đáp án của bài toán này sẽ hữu ích trong những trường hợp chỉ nhớ giai điệu mà không nhớ rõ lời và tên bài hát. Trong thử thách này, đội thi sẽ tạo ra thuật toán để xác định tên bài hát thông qua một đoạn ngân nga hoặc huýt sáo.
"Legal Text Retrieval" - đáp án của bài toán này sẽ hỗ trợ nhiều người dân không chuyên về luật khi gặp vấn đề pháp lý hoặc ngay cả các chuyên gia pháp lý cũng có thể nhanh chóng tìm được tài liệu tham khảo cho công việc của họ.
Tham gia thử thách này, các đội thi sẽ được cung cấp tập huấn luyện với khoảng 2.000 câu hỏi trong lĩnh vực pháp lý và bộ bài kiểm tra công khai với khoảng 500 câu hỏi để tạo ra một mô hình tìm kiếm trong các văn bản pháp luật các điều luật liên quan đến vấn đề đang được đề cập.
Zalo AI Challenge 2021 mở rộng cơ hội tham gia cho tất cả bạn trẻ có niềm đam mê AI trên toàn quốc
Bạn Thân Cao Cường, quán quân bảng Nhận diện biển báo giao thông năm 2020 cho biết năm nay đội Phoenix của bạn tiếp tục tham gia cuộc thi. "Đội mình đã xem các đề bài năm nay và thấy mỗi đề đều có một sức hút riêng. Cả đội đang phân vân giữa đề "Hum to song" và "Legal Text Retrieval". Mình đánh giá tính ứng dụng cực kỳ cao của đề "Legal Text Retrieval", còn đề "Hum to song" lại rất mới mẻ", Cường chia sẻ.
Zalo AI Challenge 2021 được tổ chức online và mở rộng cơ hội tham gia cho tất cả các bạn trẻ có niềm đam mê AI trên toàn quốc. Các thí sinh có thể đăng ký thi cá nhân hoặc theo nhóm bằng tài khoản Zalo.
Zalo AI Challenge là cuộc thi do Zalo AI tổ chức hàng năm với mục tiêu khuyến khích hoạt động nghiên cứu và ứng dụng trí tuệ nhân tạo vào cuộc sống tại Việt Nam. Năm nay, cuộc thi trở lại với tổng giải thưởng lên đến 300 triệu đồng và 120.000 USD Credits của Amazon Web Services.
Tuân thủ 5K chống Covid được đưa vào đề thi Zalo AI Challenge Zalo AI Challenge 2021 đã sẵn sàng quay trở lại. Các "cao thủ" AI chuẩn bị được hội ngộ tại đấu trường AI hấp dẫn và kịch tính nhất trong năm. Bật mí 3 đề bài hóc búa của năm nay là: "5K Compliance", "Hum to song" và "Legal Text Retrieval". Một điểm đáng lưu tâm nữa là tổng giải thưởng cuộc thi...