saveimage的意思,saveimage

  

  基于反爬虫场景,有一些手机号码等敏感元素,有些网站直接以图片显示,没有办法抓取;还有一个就是产品只有手机端。因为网络的传输过程是加密的,即使消息被截获,也没有办法解密。这时候可以截图手机的界面来识别图片。   

  

  

1. 思路

  

  

  通过截屏保存待处理界面的图片,定位待获取元素的位置,通过属性获取元素的坐标。然后在之前保存的图片上,根据坐标截取相应区间的截图,再用pytesseract的打包方法识别图片。   

  

  

2. 依赖的包安装

  

  

  安装枕头   

  

  安装PIP枕头安装tesseract-ocr   

  

  https://github.com/tesseract-ocr/tesseract github地址3360号   

  

  直接安装就好了。   

  

  安装pytesseract   

  

  pip install pytesserac t

3. 代码实现

  

  

   screenshot path=' e : \ python image \ image 01 . png ' save image path=' e : \ python image \ yanzhengma 01 . png ' web driver . save _ screen shot path)im glement=web driver . find _ element _ by _ id(' genCheckCode ')# Location验证码location=imglement.location #获取验证码的坐标X,Y size=imglement.size # Get int(location ' y ' size ' height '))image=image . open((截图路径))# open截图frame4=image.crop(rangle) #利用图片的裁剪功能,截取我们的区域frame4.save(保存图片路径)QQ=image.open(保存图片路径)text=pytesserac . image _ to _ string(QQ)。 strip () #使用image_to_string识别验证码frame 4 . close image . close()QQ . close()欢迎关注公众:sjyy_python.   

  

     

相关文章