Mất 4 tháng và 1.000 người hỗ trợ xây dựng đề thi Zalo AI Challenge
3 đề bài và bộ dữ liệu huấn luyện với sự tham gia đóng góp của hơn 1.000 người, được kỳ vọng tạo ra cơ hội nghiên cứu và thực hành cho cộng đồng AI Việt Nam.
Sau hơn 4 tháng làm việc liên tục, cuối cùng 7 thành viên ban cố vấn và hơn 20 kỹ sư thuộc ban tổ chức chương trình cũng đã kỳ công hoàn thành 3 đề bài và bộ dữ liệu huấn luyện cho Zalo AI Challenge.
Ngày 4/11, Zalo AI Challenge 2022 chính thức công bố bộ 3 đề thi và mở cổng cho các đội đăng ký tham gia thi đấu tại đây. Mỗi đề bài tương ứng với một mảng đang là xu hướng trong lĩnh vực AI.
Cụ thể, đề bài thuộc lĩnh vực xử lý ảnh số/ video là Liveness Detection – xác định khuôn mặt người trong video là thật hay giả mạo. Mảng xử lý ngôn ngữ tự nhiên có đề E2E Question Answering – tìm câu trả lời chính xác nhất từ Wikipedia cho một câu hỏi. Đề bài Lyric Alignment – tìm giải pháp để cân chỉnh trùng khớp lời bài hát và nhạc – thuộc mảng xử lý âm thanh.
3 đề bài giải quyết nhu cầu thực tế của người Việt.
Theo ông Châu Thành Đức – Data Science Manager tại Zalo AI, đồng thời là phó trưởng ban tổ chức chương trình, các đề bài 2022 dựa trên các vấn đề “ nóng hổi” của xã hội Việt Nam và cũng là nhu cầu thiết thực trong cuộc sống thường ngày. “Xác định hình ảnh/video giả mạo, tìm kiếm thông tin trực tuyến, karaoke giải trí là những nhu cầu rất lớn mỗi ngày”, ông bổ sung.
Điểm nổi bật nhất ở Zalo AI Challenge 2022 là yếu tố thời sự của đề bài. Hiện nay, các hoạt động chuyển đổi số định danh bằng khuôn mặt diễn ra ở nhiều lĩnh vực quan trọng như ngân hàng, y tế, giáo dục… Thông qua xác minh khuôn mặt trên điện thoại, người dân không cần trực tiếp đến các cơ sở để giải quyết một số thủ tục, từ đó có thể tiết kiệm thời gian và công sức. Tuy nhiên, việc làm giả khuôn mặt trong hình ảnh, video đang trở nên ngày càng tinh vi.
Zalo AI Challenge giúp sinh viên, kỹ sư trẻ có cơ hội chứng thực năng lực.
Với đề bài Liveness Detection, các đội tham gia phải vượt qua thử thách xây dựng mô hình AI có khả năng phân loại video chứa khuôn mặt thu trực tiếp từ người thật, video giả mạo từ khuôn mặt giả hay video giả đã thu từ trước. Với thí sinh, đây là đề bài thách thức nhất, còn với ban tổ chức, Liveness Detection chính là bài toán cần chuẩn bị cầu kỳ nhất bởi dữ liệu được thu thập từ người thật.
Để tăng kịch tính, ban tổ chức nâng độ khó của đề thi bằng cách cho các tình nguyện viên mang khẩu trang. Sau đó, nguồn dữ liệu giả được tạo ra tương ứng. Nhiệm vụ của các đội là phân loại các dữ liệu giống hệt nhau về mặt hiển thị.
Ban tổ chức tâm huyết với các đề bài mang tính thời sự của Zalo AI Challenge 2022.
Một thử thách gay cấn khác cho các đội thi năm nay là tìm được giải pháp cho đề bài E2E Question Answering. Khi nhập câu hỏi trên internet, mọi người thường sẽ nhận về hàng triệu kết quả, trong đó nhiều kết quả không như mong muốn. Trong thử thách này, các đội tham gia phải xây dựng hệ thống có thể đưa ra câu trả lời chính xác cho một câu hỏi cụ thể từ nguồn dữ liệu Wikipedia, giúp người hỏi có được đúng thông tin đang cần.
Video đang HOT
Về đề bài E2E Question Answering, ông Nguyễn Trường Sơn – Research Science Manager tại Zalo AI, thành viên ban tổ chức – cho biết, vẫn là dạng xử lý ngôn ngữ tự nhiên nhưng đề bài năm nay thách thức hơn các năm trước. Ông Sơn giải thích: “Kho dữ liệu của Wikipedia tương đối lớn, các đội phải xây dựng hệ thống gồm nhiều thành phần một cách khéo léo, mỗi thành phần phải hoạt động cho hiệu quả cao thì mới có thể tìm được câu trả lời chính xác trong thời gian cho phép”.
Ông cũng chia sẻ, bài toán này rất thực tế bởi hệ thống hỏi đáp là một phần quan trọng của các sản phẩm AI hiện nay như giao tiếp người-máy, các trợ lý giọng nói hoạt động trong các sản phẩm như loa thông minh, nhà thông minh…
Đây là lần thứ 4 ông Nguyễn Trường Sơn tham gia vào ban cố vấn chương trình Zalo AI Challenge.
Lyric Alignment là bài toán đáp ứng được hình thức giải trí karaoke rất phổ biến của người dân Việt Nam. Điểm khó là làm sao căn chỉnh phần lời hiển thị (lyric) trùng khớp với phần giai điệu (audio). Trong thử thách này, các đội thi sẽ xây dựng mô hình AI có khả năng căn chỉnh trùng khớp lời bài hát chạy trên nền âm nhạc.
Thành viên ban cố vấn – PGS.TS Quản Thành Thơ – Phó trưởng khoa Khoa học và Kỹ thuật Máy tính, trường ĐH Bách Khoa, Đại học Quốc gia TP.HCM – nhận định: “Bài toán Lyric Alignment có tính học thuật ở cả xử lý âm thanh và xử lý ngôn ngữ tự nhiên. Tính thực tế cũng khá cao khi có thể ứng dụng nhiều hoàn cảnh thực tế, chẳng hạn hỗ trợ sách nói, học phát âm…”. Theo ban tổ chức, bài toán này còn có thể mở rộng ra áp dụng tạo phụ đề (subtitle) cho các bộ phim, chương trình truyền hình…
Ngoài 4 thành viên ban cố vấn Zalo, chương trình còn có sự góp mặt của 3 chuyên gia hàng đầu trong lĩnh vực AI.
Dù trở ngại về mặt địa lý, những nhân sự “nòng cốt” của chương trình cũng cố gắng sắp xếp lịch trình để đảm bảo quá trình thảo luận ý tưởng thuận tiện và phối hợp nhịp nhàng, đạt hiệu quả cao nhất, từ đó tạo nên cuộc thi chất lượng. Ban tổ chức kỳ vọng, khi vượt qua các đề bài mang tính thử thách cao của Zalo AI Challenge 2022, các sinh viên, kỹ sư trẻ sẽ có thêm kinh nghiệm làm AI thực tiễn, góp nhặt hành trang để tự tin theo đuổi lĩnh vực AI chuyên nghiệp.
Kết quả thi đấu của các đội tham gia trong Zalo AI Challenge 2022 sẽ được chấm điểm tự động và được xếp hạng trên leaderboard real-time tương tự thể thức thi đấu của các nền tảng uy tín trên thế giới. Thời gian thi đấu diễn ra liên tục từ 4/11 đến 6/12.
Chương trình năm nay nâng tổng giá trị giải thưởng lên 15.000 USD. Trong đó, 3 đội quán quân tương ứng với 3 bảng thi đấu sẽ nhận được phần thưởng 3.500 USD/giải, 3 đội á quân sẽ giành về 1.500 USD/giải.
Thi HGS: 1 thầy cô 'đóng' 2-3 vai, lại nặng thành tích, khó tránh GV sân si
Sẽ bất công vô cùng nếu sự việc không được phát hiện, cô giáo P. sẽ có nhiều học sinh đạt giải, sở giáo dục, nhà trường sẽ tôn vinh cá nhân cô.
Những ngày qua, sự việc cô giáo V.T.M.P., giáo viên môn Tin học Trường trung học phổ thông chuyên Lê Thánh Tông (Quảng Nam) ra đề thi học sinh giỏi có một số chi tiết giống với nội dung mà cô này đã ôn tập, bồi dưỡng cho học sinh của trường mình trước khi diễn ra kỳ thi đang nhận được sự quan tâm của dư luận, nhất là những thầy cô đã và đang ôn thi học sinh giỏi ở các nhà trường.
Cô V.T.M.P. - một trong hai người ra đề thi đã thừa nhận sai và giải thích đề thi không phải lấy nguyên đề ôn tập tại trường mà có thay đổi.
Vì thế, khi chia sẻ với báo chí, ông Thái Viết Tường - Giám đốc Sở Giáo dục và Đào tạo tỉnh Quảng Nam - xác nhận có xảy ra vụ việc này trong kỳ thi học sinh giỏi Trung học phổ thông cấp tỉnh năm 2022 vừa qua và nói rằng sẽ xử lý nghiêm cá nhân sai phạm.
Tuy nhiên, sự việc này có lẽ không mới đối với những giáo viên đã từng ôn thi học sinh giỏi các cấp. Một số giáo viên các trường lớn trong huyện, trong tỉnh là những người ôn thi, ra đề và chấm thi nên về cơ bản những giải cao đều thuộc về trường những người ra đề.
Sẽ bất công vô cùng nếu sự việc không được phát hiện, cô giáo này có nhiều học sinh đạt giải, sở giáo dục, nhà trường sẽ tôn vinh cá nhân cô P. nhưng hàng chục giáo viên và học sinh khác sẽ phải ngậm ngùi vì lợi ích cá nhân người ra đề.
Hình ảnh chỉ mang tính chất minh họa, nguồn: giaoduc.net.vn
Những dấu hỏi lớn trong một số kỳ thi học sinh giỏi các cấp hiện nay
Phải nói thẳng ra rằng, sự việc cô giáo V.T.M.P thừa nhận sai trong công tác ra đề thi học sinh giỏi Trung học phổ thông cấp tỉnh năm 2022 ở Quảng Nam không khiến người trong ngành như chúng tôi bất ngờ.
Có điều, những sự việc tương tự thường chỉ dừng lại ở nghi vấn và thị phi sau mỗi kỳ thi nhưng có lẽ trong lòng nhiều giáo viên đã và đang ôn thi học sinh giỏi thường rất ấm ức vì học trò mình rớt.
Việc thi học sinh giỏi, học sinh rớt là chuyện rất bình thường vì cấp huyện (cấp trung học cơ sở), hay cấp tỉnh tổ chức (trung học cơ sở, trung học phổ thông) thường lấy số lượng ít, dao động khoảng 20-35% tổng số thí sinh tham dự kỳ thi.
Nhưng, rớt mà kỳ thi được các cấp tổ chức công bằng, minh bạch, đúng với mục đích, tiêu chí của việc lựa chọn học sinh giỏi thì những giáo viên có học sinh thi rớt sẽ không có gì đáng buồn. Tuy nhiên, học trò của họ rớt vì những góc khuất của kỳ thi học sinh giỏi mà một số địa phương đang làm sẽ khiến họ không thể nào nguôi ngoai được.
Theo cách làm của một số địa phương hiện nay đối với kỳ thi học sinh giỏi là điều động một vài giáo viên cốt cán của địa phương ra đề thi học sinh giỏi trong khi họ cũng đang ôn thi học sinh giỏi cho trường mình. Khi chấm thi, những giáo viên này lại được huyện, tỉnh lựa chọn làm giám khảo kỳ thi.
Một người mà đóng 2 vai, thậm chí cả 3 vai trong một kỳ thi học sinh giỏi thì còn đâu là sự công bằng cho kỳ thi? Cũng bởi vì thế, những giải cao nhất thường rơi vào những trường có giáo viên ra đề, giáo viên đi chấm thi.
Thực ra, đề thi học sinh giỏi hiện nay cấp nào tổ chức cũng vậy, nó không có khuôn mẫu cụ thể nào nên về cơ bản giáo viên các trường rất khó đoán đề nhưng đó lại là lợi thế đối với người ra đề khi họ đã "định hướng" trước cho học của mình.
Theo quan điểm người viết, môn thi mà có nhiều khả năng tiêu cực trong kỳ thi học sinh giỏi các cấp hiện nay nhất, chính là môn Ngữ văn. Vì mỗi đề thi thường có 2 câu nên cho dù bài làm của thí sinh đã được rọc phách thì giáo viên chấm bài không khó để tìm ra bài của học sinh mình.
Thực tế, trong quá trình dạy, quá trình ôn thi thì thầy trò đã quá quen thuộc với nét chữ, cách viết của học trò. Nhất là khi những đề thi đó đã được ôn tập trước, định hướng trước.
Hơn nữa, việc chấm môn Ngữ văn thì việc cộng, trừ 1-2 điểm/ thang điểm 20 có gì khó khăn vì đây là môn học định tính, rất khó bắt bẻ cho dù bài được chấm thẩm định lại. Nhưng, kỳ thi học sinh giỏi có bao giờ phải phúc khảo và chấm thẩm định lại đâu.
Vậy nên, những trường lớn, những trường có giáo viên ra đề bao giờ cũng "thắng lớn", giáo viên họ vui lắm và họ tự hào lắm vì có nhiều học sinh giỏi. Khi "uy tín" giáo viên như vậy thì đương nhiên năm sau họ lại được chọn ra đề thi, chấm thi để cầm cân nảy mực cho kỳ thi.
Mỗi lần huyện, tỉnh công bố kết quả kỳ thi học sinh giỏi, các trường bàn luận râm ran và nói thật là nhiều nơi giáo viên họ không hào hứng với kỳ thi vì nó tồn tại quá nhiều bất cập, thậm chí tiêu cực.
Bao nhiêu tiền bạc của địa phương, bao nhiêu công sức của thầy và trò trên địa bàn đổ sông, đổ biển để làm đẹp bản thành tích cho những giáo viên vừa ôn thi, vừa ra đề, vừa đi chấm thi học sinh giỏi.
Hàng chục năm nay, báo chí nói rất nhiều về việc này nhưng có lẽ một số nơi họ vẫn trung thành với cách làm cũ nên câu chuyện cô giáo cô giáo V.T.M.P., giáo viên môn Tin học Trường trung học phổ thông chuyên Lê Thánh Tông (Quảng Nam) đang gây ra những lùm xùm ở địa phương này cũng chỉ là phần nổi của tảng băng chìm mà thôi.
Thay đổi cách tổ chức kỳ thi học sinh giỏi cấp huyện, cấp tỉnh hiện nay có khó không?
Chúng tôi cho rằng có muốn thay đổi hay không thôi, chứ muốn thay đổi, muốn kỳ thi công bằng thì không khó, không có gì phức tạp. Thông thường, kỳ thi học sinh giỏi cấp huyện hay cấp tỉnh tổ chức cũng chỉ có gần chục đề thi và gần như không phải ra đề dự bị vì thí sinh không tham gia thi cũng đồng nghĩa là bỏ thi- kỳ thi chỉ diễn ra một lần trong năm.
Vì thế, đầu năm học các địa phương ban hành kế hoạch thi học sinh giỏi để các trường có kế hoạch bồi dưỡng học sinh giỏi. Đến cận kỳ thi, cấp tổ chức điều động một vài giáo viên ra đề, phản biện đề thi học sinh giỏi.
Người ra đề là những giáo viên không tham gia bồi dưỡng học sinh giỏi ở các nhà trường, không có con, cháu tham gia kỳ thi học sinh giỏi môn đó. Việc này, rất dễ vì đầu năm học các trường đều đã gửi bảng phân công giáo viên giảng dạy cho cấp quản lý.
Ví dụ, đối với kỳ thi học sinh giỏi lớp 9 phòng giáo dục sẽ điều động một giáo viên đang dạy 9 (nhưng không bồi dưỡng học sinh giỏi) ra đề. Người ra đề được đảm bảo quyền lợi nhưng phải gắn với trách nhiệm nếu để xảy ra tình trạng lộ đề.
Kỳ thi học sinh giỏi lớp 12 thì sở giáo dục điều động một giáo viên đang dạy lớp 12 ra đề, không nhất thiết phải là giáo viên trường chuyên vì đề thi chung. Sở cũng gắn quyền lợi, trách nhiệm đối với người ra đề. Thậm chí, bộ phận chuyên môn có thể đặt hàng với một giáo viên ở địa bàn khác ra đề thi học sinh giỏi cũng được miễn sao đảm bảo được tính bí mật, khoa học, và phù hợp với năng lực của học trò.
Nếu làm như vậy, chúng tôi tin không bao giờ lộ đề vì chẳng có giáo viên nào lại đi tiết lộ đề thi học sinh giỏi cho đồng nghiệp của mình biết trước.
Khi điều động giám khảo, cấp tổ chức không điều động những giáo viên đang ôn thi cho học trò đi chấm thi. Thực tế, chấm thi học sinh giỏi cũng đâu có gì khó khăn khi đề thi đã có đáp án sẵn. Giáo viên khối 9 và khối 12 trên địa bàn thì thiếu gì, điều động ai mà chẳng được.
Chỉ khi khâu bồi dưỡng - ra đề- chấm thi hoàn toàn độc lập, không có sự nhập nhằng vào nhau thì kỳ thi mới thực sự công bằng, minh bạch và trong sạch. Uy tín của kỳ thi sẽ tăng lên, những học sinh được chọn cũng đều là những em có năng lực, năng khiếu môn học thực sự.
Nếu vẫn làm như một số địa phương đang làm hiện nay thì tương lai ngành giáo dục sẽ còn chứng kiến nhiều sự cố như Quảng Nam vừa qua.
Lấy học liệu ngoài SGK chưa đủ, GV phải thay đổi tư duy khi kiểm tra, đánh giá Đề kiểm tra Ngữ văn được ra theo hướng cho học sinh bộc lộ hết năng lực ngôn ngữ, năng lực văn học, khuyến khích sáng tạo, đồng thời loại bỏ kiểu văn mẫu. Chỉ còn vài tuần nữa là học sinh lớp 10 bậc trung học phổ thông ở Đà Nẵng bước vào kỳ kiểm tra giữa học kỳ 1 năm học...