Tại sao mã Captcha ngày càng khó giải

Đăng Thiên09:21 21/09/2020

Việc chứng minh bản thân không phải là một robot trên môi trường Internet ngày nay không còn là một nhiệm vụ dễ dàng.

Người dùng Internet chắc hẳn từng bị quấy rầy bởi những hộp xác thực Captcha với câu “I’m not a robot” và yêu cầu tìm ra vạch kẻ đường, biển hiệu hay đèn tín hiệu giao thông… Tuy nhiên, độ khó của hệ thống này ngày càng được nâng lên. Giờ đây đèn giao thông bắt đầu ẩn hiện sau tán cây, sương sớm che khuất ngôi nhà đằng xa, biển hiệu không được viết tiếng Anh mà là bất cứ thứ ngôn ngữ gì trông có vẻ phức tạp.

“Tôi không phải người máy” (I’m not a robot) là một phiên bản của reCAPTCHA.

Captcha là gì

Những dòng chữ lộn xộn này là một trong nhiều phương pháp kiểm tra khác nhau của bài thử Captcha, viết tắt của “Completely Automated Public Turing test to tell Computers and Humans Apart” (Bài kiểm tra Turing công khai hoàn toàn tự động nhằm phân biệt máy tính và người), được phát triển bởi các nhà khoa học tại Đại học Carnegie Mellon (CMU) và IBM năm 2000.

Lúc đó, một hình ảnh chứa ký tự không rõ ràng cũng đủ để hạ gục hầu hết các spambot. Có giai đoạn, phương thức Captcha này được sử dụng bởi 200 triệu người dùng mỗi ngày, tương đương với việc bỏ ra xấp xỉ 500.000 giờ giải mã các đoạn văn bản bị xáo trộn. Tới năm 2009, Google quyết định mua lại Captcha nhằm tận dụng lượng người dùng Internet khổng lồ để số hóa kho sách Google Books của mình. Chữ lúc này cũng phải uốn éo hơn, khó đọc hơn, để chống lại những phần mềm nhận diện ký tự viết đang phát triển.

Chính những nhà phát triển Captcha cũng thừa nhận hệ thống này là một công cụ tuyệt vời để đào tạo AI, bất kỳ hình thức kiểm tra truy cập nào đều chỉ là tạm thời. Đối với các nhà nghiên cứu của Google, khả năng giải hàng tỷ câu đố Captcha chỉ là khởi đầu cho tương lai máy móc sẽ vượt qua con người. Năm 2014, Google đã đưa ra một thuật toán máy học thi đấu với con người trong cuộc thi đọc mã Captcha. Trong khi máy tính đọc đúng 99,8% số lần thử, ngồi trước dòng chữ bị biến tướng méo xẹo, con người chỉ đúng được 33%.

Video đang HOT

Để giải quyết vấn đề này, Google đã chuyển sang sử dụng NoCaptcha ReCaptcha, đọc dữ liệu và quan sát hành vi người dùng để chỉ cần một cú click chuột vào ô trống “Tôi không phải robot”, hệ thống sẽ biết ngay đây là người. Tuy nhiên, nếu bạn vẫn không thể khiến công cụ này tin mình là người, lại một lần nữa ReCaptcha sẽ sử dụng các hình ảnh để xác định.

Jason Polakis, Giáo sư ngành khoa học máy tính tại Đại học Illinois nhận định, khi xét tới việc nhận dạng ký tự cơ bản, hình ảnh đơn giản và nhận dạng giọng nói, machine learning đã giỏi ngang tầm con người. Nếu con người tạo ra bài kiểm tra làm khó được hệ thống máy tính, khả năng cao đa số người dùng sẽ không giải nổi.

Con người cần những cách tiếp cận mới, nhưng chưa tìm ra được kế hoạch cụ thể nào cả. Năm 2016, Polakis xuất bản một nghiên cứu sử dụng công cụ nhận dạng hình ảnh sẵn có trên Internet (bao gồm chức năng tìm kiếm nguồn hình ảnh của Google) để giải mã các bài thử Captcha của Google. Hệ thống của Polakis đạt độ chính xác 70%. Một số nhà nghiên cứu khác cũng đạt thành tựu tương tự, vượt qua bài thử Captcha âm thanh của Google bằng chính phần mềm nhận dạng âm thanh của hãng này.

Chặng đường phát triển Captcha chứa đầy những thử nghiệm thất bại, những nỗ lực nhằm tìm ra thứ con người rất giỏi nhưng máy móc phải khó khăn để vượt được qua. Các nhà nghiên cứu thậm chí đã cân nhắc tới chuyện sử dụng nhận dạng khuôn mặt, giới tính hay sắc tộc. Hay cũng có những đề xuất sử dụng các bài kiểm tra dạng câu đố hoặc các giai điệu các bài hát phổ biến để làm Captcha.

Người ta cũng thử sử dụng hình ảnh đã được biến tấu để làm Captcha, như yêu cầu tìm hình ảnh những con lợn nhưng đáp án lại xuất hiện một con lợn hoạt hình và đeo kính. Hay những hình khắc trên vách hang cổ đại – máy tính rất kém trong việc xác định hình ảnh vẽ trên tường là thứ gì bởi chúng không có trí tưởng tượng. Có những nỗ lực mới mẻ hơn, như lồng ghép trò chơi vào Captcha, yêu cầu người dùng phải chọn đúng giá trị, hay tham gia một trò chơi ghép hình mà không có chỉ dẫn gì – chỉ một hình lớn và vài mảnh ghép còn thiếu, yêu cầu người dùng phải tự nhận ra mình đang phải giải đố.

Vấn đề với hầu hết những bài kiểm tra này không nằm ở việc AI quá thông minh, mà là con người giải Captcha quá kém. Điều này không có nghĩa là con người thiếu thông minh. Con người nói nhiều ngôn ngữ, ảnh hưởng bởi vô số nền văn hóa và từng cá nhân lại có một trải nghiệm khác nhau. Làm sao để một bài thử có thể thỏa mãn vài tỷ biến số?

“Bài thử vẫn bị giới hạn bởi khả năng của con người”, Polakis nói. “Không chỉ ở khả năng tư duy, ta cần cái gì đó cho mọi người ở mọi nền văn hóa, nói mọi thứ ngôn ngữ có thể hiểu được. Nó cần loại bỏ được các rào cản văn hóa và ngôn ngữ. Cần thứ gì đó đơn giản cho một người bình thường cũng có thể giải nhưng phải đủ khó để máy tính không giải được. Đó phải là một bài kiểm tra đủ đơn giản để một người có thể thực hiện nhanh chóng “.

Captcha đang bị máy móc hoá giải

Theo lời Shuman Ghosemajumder, Giám đốc công nghệ của Shape Security, bất kỳ loại Captcha nào rồi cùng sẽ bị máy móc hóa giải. Ông không coi trọng các bài thử, mà thích thú với ý tưởng “xác thực liên tục” – continuous authentication – nhằm quan sát mọi hành động của người dụng Internet với mục đích xác định danh tính của lượt truy cập.

“Con người không thể di chuyển chuột thực hiện nhiều thao tác cùng một lúc, ngay cả khi cố gắng thế nào đi nữa”, nhà nghiên cứu bảo mật Ghosemajumder nói. Một con bot có thể tương tác với trang web mà không cần động đến chuột. Nó cũng có thể sử dụng chuột cực kỳ chính xác. Con người thì có những cử động hỗn loạn rất khó làm giả.

Đội ngũ nghiên cứu Captcha của Google cũng có suy nghĩ tương tự. Phiên bản mới nhất của họ, reCaptcha v3 ra mắt cuối năm ngoái hoạt động dựa trên phân tích hành vi duyệt web, từ đó xác định là người hay máy.

Đầu tiên họ sẽ phải xác nhận xem đâu là những hành động bình thường, từ đó suy ra những hành động được cho là bất thường. Một trong những cách Google sử dụng là dựa vào Google cookie được cài trên trình duyệt. Tuy nhiên, hệ thống xác thực dựa trên điểm rủi ro này lại đi cùng với một nhược điểm lớn là sự riêng tư của người dùng. Điểm trừ nữa của phương pháp này là nếu người dùng sử dụng trình duyệt bảo mật riêng tư, như Tor Browser hay thông qua VPN, họ sẽ bị hệ thống nghi ngờ là một con bot.

Aaron Malenfant, kỹ sư trưởng nhóm nghiên cứu Captcha tại Google nói, việc không áp dụng bài thử Turing là một bước dừng trên cuộc đua mà con người đã bị bỏ lại sau. “Khi người ta đầu tư càng nhiều vào machine learning, những thử thách chứng minh mình không phải robot sẽ càng khó hơn với con người”, Malenfant nói. Trong thời gian tới, mã Captcha sẽ bị “tuyệt chủng” và thay vào đó sẽ là những bài kiểm tra Turing liên tục chạy ngầm trong các trang web.

Trong cuốn sách The Most Human Human, tác giả Brian Christian đã mô tả lần tham gia cuộc thi Bài thử Turing với tư cách con người và nhận thấy việc chứng minh mình là con người qua việc trò chuyện không hề đơn giản. Mặt khác, những lập trình viên làm bot lại thấy việc vượt bài thử Turing khá dễ dàng, không phải bằng việc tạo ra một con bot nói chuyện cực kỳ linh hoạt, mà một con bot biết cách tránh né câu hỏi bằng một câu chuyện đùa đánh lạc hướng hay bằng việc cố tình lồng những từ sai chính tả, sai ngữ pháp vào câu trả lời.

Trong tương lai, rất có thể Captcha sẽ phải thay đổi bản thân, thay vì chọn ra đúng hình ảnh hay dòng chữ nữa, mà phải dựa trên những lỗi lầm người dùng hay mắc phải khi duyệt web. Năm 2017, Amazon công bố bằng sáng chế về bài thử liên quan tới ảo giác quang học và các câu đố logic, thứ con người thường gặp nhiều khó khăn mới giải ra được. Với tên gọi bài thử Turing nhằm vào khía cạnh thất bại, cách duy nhất để vượt qua chúng là lựa chọn đáp án sai.

Biển báo có như không, nút giao 4 tầng "lụt" trong giờ cao điểm

Nhiều người bức xúc khi làn đường dành cho các xe quay đầu luôn bị các phương tiện đi hướng thẳng lấn làn...

Tình trạng phớt lờ biển báo, gây ùn tắc giao thông diễn ra thường xuyên tại nút giao Nguyễn Trãi - Khuất Duy Tiến - Nguyễn Xiển

Khoảng đầu tháng 7/2020, tại nút giao 4 tầng Nguyễn Trãi - Nguyễn Xiển - Khuất Duy Tiến, Sở GTVT Hà Nội đã chỉ đạo đơn vị chức năng lắp đặt biển chỉ dẫn "Làn đường dành cho các phương tiện quay đầu" nhằm tạo điều kiện cho các xe di chuyển trên đường Nguyễn Trãi muốn chuyển hướng về Ngã Tư Sở hoặc hướng Hà Đông được thông thoát trong giờ cao điểm.

Tuy nhiên, một tháng qua, nhiều người lưu thông qua nút giao này vẫn không tránh khỏi sự bức xúc khi làn đường dành cho các xe quay đầu luôn bị các phương tiện đi hướng thẳng lấn làn.

"Mục sở thị" tình trạng này, 7h30 sáng 14/9, có mặt tại ngã tư Nguyễn Trãi - Khuất Duy Tiến, hình ảnh PV Báo Giao thông chứng kiến là cả trăm ô tô, xe máy chen chúc nhau chờ hết nhịp đèn tiến thẳng về Ngã Tư Sở và rẽ trái sang đường Khuất Duy Tiến bất chấp những chiếc xe phía sau liên tục bấm còi, ra hiệu bằng xi-nhan xin quay đầu chuyển hướng.

Tình trạng tương tự cũng diễn ra tại nút giao hướng Nguyễn Trãi - Hà Đông. Không ít xe máy từ đường Nguyễn Tuân đi ra đã chọn phương án đi ngược chiều đường, rẽ tắt qua điểm mở đối diện số 336 Nguyễn Trãi để tránh cảnh "chôn chân" chờ nhiều nhịp đèn để di chuyển đến điểm quay đầu tại nút giao.

Trao đổi với Báo Giao thông, một lãnh đạo Đội CSGT số 7 (Phòng CSGT, Công an TP Hà Nội) cho biết, biển báo dành cho các phương tiện tại nút giao Nguyễn Trãi - Khuất Duy Tiến hiện nay chỉ là biển chỉ dẫn. Loại biển này và vạch kẻ sơn trên mặt đường không đủ căn cứ cho lực lượng chức năng xử phạt, tạo sự răn đe, lập lại trật tự giao thông.

Khắc phục tình trạng này, Đội CSGT số 7 đã phối hợp với các đơn vị chức năng rà soát, đề xuất thí điểm cấm toàn bộ các phương tiện trên đường Nguyễn Xiển và Khuất Duy Tiến rẽ trái đi Nguyễn Trãi (di chuyển đến điểm mở gần nhất để quay đầu); Thay đổi chu kỳ đèn tìn hiệu từ bốn pha về ba pha; Bổ sung biển cấm đỗ, dừng tại các lối rẽ phải trước nút giao Nguyễn Trãi - Khuất Duy Tiến.

Cùng đó, Đội Chỉ huy giao thông và điều khiển đèn tín hiệu giao thông sẽ chủ động khảo sát và bổ sung camera giao thông trên đường Nguyễn Xiển, Khuất Duy Tiến và xung quanh nút giao để giúp lực lượng CSGT nâng cao hiệu quả điều tiết, phân luồng, giải tỏa áp lực giao thông qua nút giao.

Xe lôi mất lái tông chết bé gái 4 tuổi đang ngồi cùng cha mẹ Khoảng 17h30 ngày 14-8, trên quốc lộ 1A đoạn qua khu phố Vân Hội 1, thị trấn Diêu Trì, huyện Tuy Phước, Bình Định xảy ra vụ tai nạn giao thông làm bé gái 4 tuổi tử vong. Hiện trường vụ tai nạn - Ảnh: XUÂN VINH Theo người dân, thời điểm trên, một chiếc xe lôi (chưa rõ danh danh tính tài...

Bạn thấy bài viết này có hữu ích không?

Có;

Không

Tin liên quan

Xem thêm Share

Xem nhiều

Vụ ngoại tình có 1-0-2 ở Cà Mau: Chồng bắt quả tang vợ, kiểm tra điện thoại mới ngã ngửa với số "tiểu tam"05:41

Cát-sê của Xuân Hinh khi đóng 'Bắc Bling' của Hòa Minzy 'không phải mức thường'04:19

Vén màn "chiêu trò" của Xuân Hinh00:51

1 nhân vật tự ý tung bảng điểm cấp 3 của HIEUTHUHAI và HURRYKNG, bị chất vấn thì có màn giải thích càng "hết cứu"00:32

Kinh hoàng clip bình gas mini trên bàn lẩu bất ngờ phát nổ, cảnh tượng sau đó khiến nhiều người bủn rủn chân tay00:12

Xôn xao câu chuyện "lòng tham" của người đàn ông đi xe con và 2 con cá bị rơi01:12

Bé gái bất ngờ rơi xuống sông khi đang đi học về, diễn biến sau đó khiến dân mạng bủn rủn chân tay00:35

ViruSs gây tranh cãi với phát ngôn: "Bài này phải đổi thành Xuân Hinh kết hợp với Hòa Minzy, Masew, Tuấn Cry"17:01

Cặp phim giả tình thật Vbiz rục rịch kết hôn, đàng gái có hành động trốn tránh khi bị dí trên sóng trực tiếp00:39

Đến mức này mà Quốc Anh - Tiểu Vy vẫn chỉ là bạn?00:57

Câu trách móc "chết thì phải bảo người ta chứ" khiến ai nghe xong cũng chực trào nước mắt00:35

Tin đang nóng

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024

Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022

Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022

Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022

Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022

Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022

Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022

Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022

Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022

Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022

Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022

Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022

Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Có thể bạn quan tâm

Phim Việt mới chiếu đã lập kỷ lục chưa từng có, nam chính là cái tên ai nghe cũng sởn da gà

Phim việt

23:18:14 06/03/2025

Bộ phim Quỷ Nhập Tràng phải tới ngày 7/3 mới khởi chiếu chính thức nhưng đã có những suất chiếu sớm đầu tiên từ tối ngày 5/3 và hiện đang tạo ra cơn sốt ngoài phòng vé.

Xót xa hình ảnh hiếm hoi của Quý Bình bên con trai 3 tuổi

Sao việt

23:15:15 06/03/2025

Lật lại các bài đăng trên trang cá nhân, người hâm mộ không khỏi xót xa khi nhìn những khoảnh khắc ấm áp bên con trai nhỏ của Quý Bình.

Gây sốt với 'Bắc Bling', Hoà Minzy sẽ soán ngôi Hoàng Thuỳ Linh?

Nhạc việt

23:00:40 06/03/2025

Hòa Minzy với cơn sốt Bắc Bling liệu có vượt qua tên tuổi Hoàng Thùy Linh - ca sĩ rất thành công khi sử dụng chất liệu văn hóa như nguồn cảm hứng cho các ca khúc đình đám của mình?...

Nam diễn viên giảm 14kg, uống nước mắm khi quay 'Quỷ nhập tràng' là ai?

Hậu trường phim

22:57:55 06/03/2025

Diễn viên Quang Tuấn bày tỏ bất ngờ trước danh xưng Ông hoàng phim kinh dị . Khả Như kể trải nghiệm ám ảnh khi phải ăn bộ đồ lòng sống của con vịt trong phim mới.