爬虫
2020年3月25日
网页
当我们输入网址以后,会建立http(https算了)连接,我们给服务器请求,服务器给我们回应,我们不断发送request,服务器不断返回response,请求又很多种。
大量的response
我们要把这些数据存起来,数据库啊啥的都行。
简单的爬虫
| 1 | import requests | 
上面的代码能够得到百度网站
分析html
| 1 | import requests | 
得到连接
| 1 | import requests | 

当我们输入网址以后,会建立http(https算了)连接,我们给服务器请求,服务器给我们回应,我们不断发送request,服务器不断返回response,请求又很多种。
我们要把这些数据存起来,数据库啊啥的都行。
| 1 | import requests | 
上面的代码能够得到百度网站
| 1 | import requests | 
| 1 | import requests |