@Shiraira8 月前

08/25
16:58
技术杂谈

python爬虫应对加密表单的好方法

前言

使用爬虫爬取一些网站数据的时候,总会遇到一些登陆时对用户名和密码进行加密的网站,如果只是普通的标准加密还好,但有些网站使用的加密库本身就不标准,导致手撸加密总是不能够拟合网站所使用的加密

破局

我这次遇到的网站的加密相关js文件并没有混淆,可以直接调用。经过搜索,js2py可以将js文件的函数转化为python可以直接使用的函数

用法

在python命令行中直接使用js2py把js文件转换成py文件,例如我将cry.js转换为cry.py
这时候只需要把cry.py和原本的py脚本放到同一个目录中,然后在最上方声明from cry import cry即可导入函数
例如我需要使用的函数位encMe(),直接在py里写cry.encMe()即可正常使用

python爬虫应对加密表单的好方法