您当前所在位置:网站首页 >> 生活娱乐 >> 与你分享 >> 12306破解图像验证码的实验脚本 >> 阅读
12306破解图像验证码的实验脚本
2015-03-20 12:19:40 来源:左撇子在中国 作者:左撇子在中国
内容提要:12306 新版验证码识别python脚本

不少媒体新闻大呼抢票工具集体失效、12306终极验证码等新闻,这种验证码的推出有好同样也有坏处:机器识别困难,同样人眼识别也轻松不到哪里去。


用这种方式作为验证码最大的担忧就是怕脚本或人工对其图片进行爬虫遍历,然后将所有的图片保存后与关键字进行对比并关联入库,当然前提是这些图片都是静态的。


12306 验证码究竟是静态还是动态,昨晚对这个疑问进行了实践:http://linux.im/2015/03/17/12306-captcha-md5-go.html ,简单的说测试后发现这整张图片是在服务器后端动态生成的,所以不难理解为什么生成验证码页面时会比较慢。


同样上午我们又进行了第二个实践,将整张验证码中的八张图像拆分为8张小图然后进行感知hash(http://www.ruanyifeng.com/blog/2011/07/principle_of_similar_image_search.html)处理,获得样本总数72225张,不重复的图库为15478张,重复最高为869次

下载地址(python脚本):

12306破解图像验证码的实验脚本

文中完整代码链接:https://gist.github.com/Evi1m0/fbbdb1ba7c66cc4e1bb2

相关文章
2017-01-17 15:19:22
2017-01-17 14:15:45
2014-06-11 21:32:45
2014-05-13 22:17:54
2014-05-05 20:25:26
2014-05-05 20:19:29
2014-04-25 19:51:55
2014-03-24 20:17:19
热门文章
查看:0
查看:0
查看:0
查看:0
查看:0
查看:76
查看:557
查看:216