python爬虫如何解码百度搜索结果链接
1、用爬虫获取的百度搜索结果列表,其中的链接如果不经过处理的话,将会是“http://www.baidu.com/link?url=HOg4zi0c1...”的形式,被重定向且编码。

2、如果是用python编写的爬虫,有个取得原始链接地址的简单方法,是使用requests这个库。

3、通过variable=request.get(上一步获取的href),来向这个编码后的地址发送请求,然后variable.url就是真实的原始地址了:


1、用爬虫获取的百度搜索结果列表,其中的链接如果不经过处理的话,将会是“http://www.baidu.com/link?url=HOg4zi0c1...”的形式,被重定向且编码。
2、如果是用python编写的爬虫,有个取得原始链接地址的简单方法,是使用requests这个库。
3、通过variable=request.get(上一步获取的href),来向这个编码后的地址发送请求,然后variable.url就是真实的原始地址了: