海贼王|中年大叔学编程-Python下载海贼王漫画图片

虽然一把年纪了,但是也追过几年的海贼王,总感觉动漫更新得比较慢,所以就想着提前预知剧情,就去看看漫画来满足自己的好奇心。每次都需要去漫画的网站一个个看,觉得还是比较麻烦,最近才学了Python,所以就想着用Python把现在更新完的漫画下载下来。这里我们需要两个组件:

PyQuery 主要用于解析htmlRequests 主要用于请求图片获取文件流selenium 加载网页
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
从截图中,我们可以看到每个章节就是个超链接,它的dom结构是id为chapter-list-4的ul下的li节点中,那么我们就先解析出这些超链接地址,PyQuery的安装就不在细说了,直接使用pip install PyQuery即可(不出意外的话是可以正常使用了),from pyquery import PyQuery as pqpage = pq(url="http://www.hanhande.net/manga/94/", encoding='utf-8')lias = page("#chapter-list-4").find('li').find('a').items()for a in lias:print(a.attr['href'])print(a.text())【 海贼王|中年大叔学编程-Python下载海贼王漫画图片
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
现在我们再来结合之前的获取到的地址,来全量下载吧,来看看最终代码
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
海贼王|中年大叔学编程-Python下载海贼王漫画图片
文章插图
我只是记录我的学习过程,由于书读的少,可能很多地方表述或者是理解得不对,请轻喷并指正。