验证码识别的难度与哪些因素有关?

2018-06-01 15:06:42

在进行验证码识别时我们发现,有些验证码识别的速度快、精确度高,而有些则不然。如果是在同等的识别技术和系统的条件下,验证码识别的难易与哪些因素有关呢?主要是以下几方面:

1、噪声点和背景干扰线是否存在?噪声点的存在一般情况下不会提高验证码识别的难度,而对于背景干扰线的存在将增加验证码破解的难度。一方面背景干扰线与需要识别的字符相粘连使得计算机程序不能准确的定位字符的位置,在验证码另一方面背景干扰线的存在降低了验证码的可适用性。因此在验证码破解的前期准备工作中,如何消除背景弧线将是重中之重。

2、字符分布是否存在一定规律?如果字符的分布符合字符形状规律,那么我们可以通过制定识别线,根据字符像素的分布辅助我们将验证码图片中的字符进行归类,以帮助区分不同字符。

3、验证码图片中相邻字符是简单的相连还是相互之间有重叠?在前期处理中,直接识别出来的字符将被提取出来,如果字符重叠将影响切除效果,有可能造成错误切割甚至于切割后剩余部分不完整,因此根据需要对剩余部分进行修正。

4、一个验证码图片中包含多少字符,也就是需要识别的字符串长度?字符个数越多验证码的复杂度越高,并且固定字符长度的验证码容易破解,而动态字符长度的验证码可以提供更高的安全性。

由此我们也可以看出,并不是说数字、字符验证码就比中文验证码好识别,还是受到上述几个因素的影响。但是最这技术水平的提升,目前的验证码识别技术已经达到了很高的层面,基本上可以对所有类型的验证码作出识别。

推荐新闻