网页
当我们输入网址以后,会建立http(https算了)连接,我们给服务器请求,服务器给我们回应,我们不断发送request,服务器不断返回response,请求又很多种。
大量的response
我们要把这些数据存起来,数据库啊啥的都行。
简单的爬虫
1 | import requests |
上面的代码能够得到百度网站
分析html
1 | import requests |
得到连接
1 | import requests |
当我们输入网址以后,会建立http(https算了)连接,我们给服务器请求,服务器给我们回应,我们不断发送request,服务器不断返回response,请求又很多种。
我们要把这些数据存起来,数据库啊啥的都行。
1 | import requests |
上面的代码能够得到百度网站
1 | import requests |
1 | import requests |