Почему использование CAPTCHA лишено смысла

Все уже оценили новый мысльный пузырь, названный маркетологами глубинным машинным обучением. Не болтает о нейросетях только ленивый. Но действительно важных и полезных приложений так и не создано: нет нормальных переводчиков, нельзя надиктовать текст с приемлемым количеством ошибок и так далее. Единственная область, где действительно пригодились нейросетки — рассылка спама.

Распознавание CAPTCHA на нейросетях TensorFlow и Keras

Энтузиаст-любитель запилил на Медиуме интереснейшую статью. Он использовал книжку Deep Learning for Computer Vision with Python и фреймворки TensorFlow и Keras, чтобы за 15 минут написать систему, которая играючи обходит проверку классической КАПТЧИ с точностью около 100%.

Схема нейронной сети для распознавания CAPTCHA

Рис. 1. Схема нейронной сети для распознавания CAPTCHA.

Единственная трудность, возникшая на пути изобретателя — обучение. Ему надо было сгенерировать несколько десятков тысяч картинок с кодом и вручную подписать правильные ответы. На такую генерацию могли уйти месяцы. Но хитроумный изобретатель решил использовать силу оупенсорса. Он скачал код популярного плагина Really Simple CAPTCHA для Wordpress. Этот плагин используется на миллионе сайтов. И заставил генерировать капчи, модифицировав плагин таким образом, чтобы сохранялись правильные ответы. Затем экспериментатор скормил полученные данные с разметкой нейронной сети. Вуаля — 100% распознаваний, Really Simple CAPTCHA на коленях, минимум миллион сайтов можно заспамить на автомате.

field_vote: 
Ваша оценка: Нет Средняя: 5 (10 оценки)
Программное обеспечение: 
Пользовательские теги: 

Комментарии

У вас тоже капча. Ждите скоро в комментариях будет спам.

Оценка: 
Средняя: 5 (4 оценки)

Он уже давно идет. Помимо каптчи работает еще несколько защит. Без них все давно уделали бы.

Кстати, на top.liberatum.ru я сделал простенькую защиту на JS. Каптчи нет, но и ни одного спамного сообщения за многие месяцы. Идея проста: после показа страницы запускается таймер и через 5 секунд в форму добавляется скрытое поле. На стороне сервера наличие этого поля проверятся. Защита основана на двух предположениях: 1) у юзера выполнится JS, а бот его проигнорирует; 2) бот "напишет" камент быстрее, чем за 5 секунд, а юзер вряд ли.

Оценка: 
Средняя: 5 (7 оценки)

А, то-то я там комментировать не могу с noscript-ом.

Оценка: 
Средняя: 5 (2 оценки)

А смысл резать весь JS на всех сайтах, если есть Ghostery?

Оценка: 
Средняя: 5 (3 оценки)

а он весь JS-код режет, параноидный режим, детектед!

Оценка: 
Средняя: 5 (2 оценки)

Не будет. Эту капчу даже с естественным интеллектом хрен с первого раза введёшь! :)
Кстати, а вот интересно даже, наверняка же есть статистика удачного и неудачного ввода капч от более-менее похожих на живых пользователей, — каково соотношение успешных и неуспешных попыток? Почему-то есть ощущение, что сейчас оно вполне может быть около половины (как вариант, 60/40 % успеха/неуспеха).

Оценка: 
Средняя: 2 (1 оценка)

Будешь, удивлен — стата, не в пользу человеков!:) Иначе продавали бы хомячков, а не ботов. Даже при сложной капчи человек работает хуже, чем бот на нейросетке...

Оценка: 
Пока без оценки

Ну, глубинное и глубокое машинное обучение, это конечно в большей мере IT-маркетинг в 2016-2017 гг., но есть и множество областей, где нейроморфные алгоритмы рулят и успешно: системы "промышленного зрения", банковские сервисы, обработка высококонтрастных изображений спутниковых снимков, радионавигация, метеорологические данные, радионаблюдения и т.д.

Оценка: 
Средняя: 5 (1 оценка)

Почему все картинки на сайте теперь выглядят не пойми как?

Оценка: 
Средняя: 3 (2 оценки)

а потому что, потому!Гггг;)

Оценка: 
Средняя: 3 (2 оценки)

на телефоне это гг

Оценка: 
Пока без оценки

Комментировать

Filtered HTML

  • Use [fn]...[/fn] (or <fn>...</fn>) to insert automatically numbered footnotes.
  • Доступны HTML теги: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <blockquote> <strike> <code> <h2> <h3> <h4> <h5> <del> <img>
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.