Python进阶者|一篇文章教会你利用Python网络爬虫抓取王者荣耀图片2、对网站发生请求。3、对请求到的数据进行处理( 二 )


filename = parse_html2.xpath('//table[@id="endimg"]//tr//td//a/@title')
for e in filename:
# print(e)
dirname = "./王者荣耀/" + e + '.jpg'
html2 = requests.get(url=r, headers=self.headers).content
# print(html2)
print(dirname)
with open(dirname, 'wb') as f:
f.write(html2)
print("%s下载成功" % filename)
8、在main方法调用 , 如下所示 。 因为第一页的网址是没有规律的 , 所以这里先判断一下是不是第一页 。
def main(self):
startPage = int(input("起始页:"))
endPage = int(input("终止页:"))
【Python进阶者|一篇文章教会你利用Python网络爬虫抓取王者荣耀图片2、对网站发生请求。3、对请求到的数据进行处理】for page in range(startPage, endPage + 1):
if page == 1:
url = self.firsr_url
else:
url = self.url.format(page)
# print(url)
html = self.get_page(url)
print("第%s页爬取成功!!!!" % page)
# print(html)
self.parse_page(html)
【六、效果展示】
1、运行程序 , 在控制台输入你要爬取的页数 , 如下图所示 。
Python进阶者|一篇文章教会你利用Python网络爬虫抓取王者荣耀图片2、对网站发生请求。3、对请求到的数据进行处理
本文插图
2、将下载成功的图片信息显示在控制台 , 如下图所示 。
Python进阶者|一篇文章教会你利用Python网络爬虫抓取王者荣耀图片2、对网站发生请求。3、对请求到的数据进行处理
本文插图
3、在本地可以看到效果图 , 如下图所示 。
Python进阶者|一篇文章教会你利用Python网络爬虫抓取王者荣耀图片2、对网站发生请求。3、对请求到的数据进行处理
本文插图
【七、总结】
1、不建议抓取太多数据 , 容易对服务器造成负载 , 浅尝辄止即可 。
2、希望通过这个项目 , 能够帮助大家下载高清的图片 。
3、本文基于Python网络爬虫 , 利用爬虫库 , 实现王者荣耀图片的抓取 。 实现的时候 , 总会有各种各样的问题 , 切勿眼高手低 , 勤动手 , 才可以理解的更加深刻 。
4、英雄有很多 , 大家自行选择你喜欢的英雄做为你的桌面的壁纸吧 。
5、需要本文源码的小伙伴 , 后台回复“王者荣耀”四个字 , 即可获取 。
看完本文有收获?请转发分享给更多的人
IT共享之家
入群请在微信后台回复【入群】