不用Selenium如何爬课表。
首先先看下工大的信息门户的网页,分析下:
先用py获取下网站的源码吧。
看到学长写的选课程序,觉得直接一改就是爬课表,然后就改了。
首先是学号和密码,涉及个人隐私就不写了。
学校信息门户的网址是http://my.hfut.edu.cn/login.portal,直接写上去完事。
验证码识别我写了两个,一个是基于Tesseract-OCR的,另一个是云打码,当然还是云打码好用。
源码大概就这样,首先是爬课表本身的py:
pow(x,y,N),pow(x,y)%N和(x**y)%N
这个问题是我一开始做CTF题发现的,下面的脚本:
1 | N=16903705997349646195704375376941855414691523387719679999999999999 |
和下面的脚本
1 | import math |