更新时间2018-09-26 13:07:13
现在很多爬虫要代理ip,这是为什么呢?
在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。
如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。
通常情况下,爬虫用户自己是没有能力去自己维护服务器或者是自己搞定代理ip的问题的,一来是因为技术含量太高,二来是因为成本太高。所以需要找代理,我之前使用过一段时间九州HTTP,你们可以试一下
那是网络需要
基本上做爬虫的都躲不过去IP的问题,需要很多的IP来实现自己IP地址的不停切换,达到正常抓取信息的目的。现在一般都用软件进行自动切换,网上有很多同类软件,像芝麻、牛魔、九州等等,你可以多了解一下。