一篇文章教会你利用Python网络爬虫抓取王者荣耀图片

2020-08-03 由颛孙佳悦发布于科技

【一、项目背景】

王者荣耀作为当下最火的游戏之一，里面的人物信息更是惟妙惟肖，但受到官网的限制，想下载一张高清的图片很难。（图片有版权）。

以彼岸桌面这个网站为例，爬取王者荣耀图片的信息。

【二、项目目标】

实现将获取到的图片批量下载。

【三、涉及的库和网站】

1、网址如下：

https://www.netbian.com/s/wangzherongyao/index.htm/

2、涉及的库：requests、lxml

【四、项目分析】

首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮，观察到网站的变化分别如下所示：

https://www.netbian.com/s/wangzherongyao/index_2.htm

https://www.netbian.com/s/wangzherongyao/index_3.htm

https://www.netbian.com/s/wangzherongyao/index_4.htm

观察到只有index_()变化，变化的部分用{}代替，再用for循环遍历这网址，实现多个网址请求。

https://www.netbian.com/s/wangzherongyao/index_{}.htm

【五、项目实施】

1、我们定义一个class类继承object，然后定义init方法继承self，再定义一个主函数main继承self。准备url地址和请求头headers。

import requests

from lxml import etree

import time

class ImageSpider(object):

def __init__(self):

self.firsr_url = "https://www.netbian.com/s/wangzherongyao/index.htm"

self.url = "https://www.netbian.com/s/wangzherongyao/index_{}.htm"

self.headers = {

"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"

}

def main(self):

pass

if __name__ == '__main__':

spider= ImageSpider()

spider.main()

'''发送请求获取响应'''

def get_page(self, url):

res = requests.get(url=url, headers=self.headers)

html = res.content.decode("gbk") #网络编码

return html #返回值

'''解析数据'''

def parse_page(self, html):

parse_html = etree.HTML(html)

image_src_list = parse_html.xpath('//div[@class="list"]/ul/li/a//@href')

for image_src in image_src_list:

fa = "https://www.netbian.com" + image_src

# print(fa)

4、在谷歌浏览器上，右键选择开发者工具或者按F12。

5、右键检查，找到图片二级的页面的链接，如下图所示。

6、对二级页面发生请求，for遍历得到的网址。

bimg_url = parse_html1.xpath('//div[@class="pic-down"]/a/@href')

for i in bimg_url:

diet = "https://www.netbian.com" + i

# print(diet)

html2 = self.get_page(diet)

parse_html2 = etree.HTML(html2)

# print(parse_html2)

url2 = parse_html2.xpath('//table[@id="endimg"]//tr//td//a/img/@src')

7、将获取的图片写入文档，获取图片的title值作为图片的命名。

filename = parse_html2.xpath('//table[@id="endimg"]//tr//td//a/@title')

for e in filename:

# print(e)

dirname = "./王者荣耀/" + e + '.jpg'

html2 = requests.get(url=r, headers=self.headers).content

# print(html2)

print(dirname)

with open(dirname, 'wb') as f:

f.write(html2)

print("%s下载成功" % filename)

8、在main方法调用，如下所示。因为第一页的网址是没有规律的，所以这里先判断一下是不是第一页。

startPage = int(input("起始页:"))

endPage = int(input("终止页:"))

for page in range(startPage, endPage + 1):

if page == 1:

url = self.firsr_url

else:

url = self.url.format(page)

# print(url)

html = self.get_page(url)

print("第%s页爬取成功！！！！" % page)

# print(html)

self.parse_page(html)

【六、效果展示】

1、运行程序，在控制台输入你要爬取的页数，如下图所示。

2、将下载成功的图片信息显示在控制台，如下图所示。

3、在本地可以看到效果图，如下图所示。

【七、总结】

1、不建议抓取太多数据，容易对服务器造成负载，浅尝辄止即可。

2、希望通过这个项目，能够帮助大家下载高清的图片。

3、本文基于Python网络爬虫，利用爬虫库，实现王者荣耀图片的抓取。实现的时候，总会有各种各样的问题，切勿眼高手低，勤动手，才可以理解的更加深刻。

4、英雄有很多，大家自行选择你喜欢的英雄做为你的桌面的壁纸吧。

5、需要本文源码的小伙伴，后台回复“王者荣耀”四个字，即可获取。

看完本文有收获？请转发分享给更多的人

IT共享之家

入群请在微信后台回复【入群】

责任编辑：

转载请注明：一篇文章教会你利用Python网络爬虫抓取王者荣耀图片 - 楠木轩

孩子创造力有多强？一组课本涂鸦图片征服网友：大神收下我的膝盖

发布于: 经典2020-11-20标签: 美国队长征服图片课本

文章原创，版权归本作者所有，欢迎个人转发分享！上课的时候，很少有孩子能整堂课保持注意力，很多孩子都会开小差。开小差时，有的孩子会扔纸团聊天，有的孩子看窗外，还有的孩子会在课本上涂鸦，大秀一把创造力

皇室战争：疑似新卡牌图片曝光，5费寒冰飞龙，攻击自带减速

发布于: 科技2020-11-17标签: 网游皇室战争图片费寒冰

晓东说游戏，皇室天天见！各位CR的小伙伴们大家好，在《皇室战争》大胡子主播发布视频后，玩家们从视频的最后几秒发现了一个彩蛋。虽然画面的透明度相当高，但细心的玩家还是发现了其中的奥秘。没错，它就是即将上

原神：内鬼已经爆出了1.2版本的更新！双五星，新地图，新圣遗物，新武器！

发布于: 科技2020-11-17标签: 图片更新新圣武器

开头先说一句：MHY内鬼，YYDS！原神1.1版本才刚上线不久，下个月的1.2版本已经被内鬼爆料出好多干货了，话说明明是国产游戏，为啥选择优先爆料在外网呢？不管了，有人爆料就是好事，下面小编给大家总结

我的世界当MC变成解压游戏，这些图片，你看了后肯定会说“爽”

发布于: 科技2020-11-11标签: 我的世界肯定图片

#绝地求生电竞赛#妈，我压力有点大小孩子，哪来的压力？难道只有成年人的生活才叫不容易，小孩子的世界就毫无压力吗？当桌子上摆放着一张饱满的泡泡纸，只需轻轻一捏，它们便会“啪”得一声爆开，相信没有

办公小技巧：图片动态报表巧制作

发布于: 奇闻2020-11-10标签: power view 图片制作动态

数字式报表总让人感觉有些单调、枯燥，如果将数字式报表改造成图片式的报表，将图片做成列表，可用滑块滚动浏览，当点击相应图片时，就会出现该图片所对应的数据，这样的效果岂不别具一格（图1）？其实，利用Ex

到底是男的抱女的还是女的抱男的？这15张图片太神奇了，看懂了吗

发布于: 奇闻2020-11-10标签: wow 到底图片魔毯

1、到底是男的抱女的还是女的抱男的？2、这是晚宴？还是一张脸？3、他固执的像一头驴！4、这个轮子会不会略大！5、wow，一个优雅的芭蕾舞演员。6、Nooooooo7、这，叫人如何面对？8、活吞了一只马

8张“尴尬”到哭的图片,图3到底做错了什么

发布于: 综合2020-11-06标签: 青年图片圈圈到底

生活不免会遇到尴尬的处境，但是这些尴尬到爆的场景你一定没遇过，一起来看看吧~1、一名男子在街边休息，他买了很多鸡蛋，高度刚好可以当小板凳用。2、只想安静的吃一顿饭，为什么会有一根柱子？无奈脸演技好评。

腾讯发布“正版图库直通车”:1.2亿张正版图片

发布于: 科技2020-10-31标签: 正版图片腾讯图片互联网

今天，腾讯发布了新的业务，其来自腾讯云的“正版图库直通车”，就是针对正版图片的服务。腾讯官方表示，通过该产品，用户在一个平台上即可搜索、购买多家图库的图片资源，无需跨平台搜索。

dunk配色图片价格大全 dunk最火配色排行

发布于: 奇闻2020-10-23标签: 配色图片大全 nike

今年是dunk年，配色也是一个接一个的，加上人气流量王一博的带货，让这双鞋款火到爆，那么2020年发售了哪些值得关注的dunk sb鞋款呢？今天小编就给大家整理了一下发售的全新dunk的配色和价格，下

梦幻西游：大雁塔发生“新变化”？从这张图片中，发现了不同之处

发布于: 科技2020-10-16标签: 梦幻西游大雁塔月光宝盒图片

当年，玄奘为了保存由天竺带回长安的经卷佛像主持修建了大雁塔，在梦幻西游中，这一建筑得到了重现。在长安城内，大雁塔应该算是最高的建筑物，如果站在顶层向下眺望，也能看到不一样的风景。就在前几天，一位梦幻老

图片报：多特中场雷纳18岁之后，年薪将翻倍

发布于: 体育2020-10-15标签: 多特雷纳国际足球图片

虎扑10月15日讯多特蒙德小将雷纳的表现不俗，《图片报》表示，当雷纳年满18岁时，多特将给他提供翻倍的薪水。雷纳将在11月13日年满18岁，《图片报》表示，雷纳年满18岁之后，不仅可以得到多特蒙德

值无不言310期：10款功能强大、操作简单的在线图片处理工具，无损放大、AI修复统统轻松搞定！

发布于: 科技2020-10-13标签: GIF图图片无损在线

Hi，亲爱的值友们，《值无不言》栏目新的一期上线啦！无论你是想了解更多攻略还是学习更多知识，点此关注话题#值无不言#本期值无不言我们请来了站内生活家、游戏领域作者@青春向荣为大家分享10款功能强大、操

朋友圈晒图的注意！小心惹祸上身！

发布于: 综合2020-10-11标签: 朋友圈图片中年晒图

现在不少人都喜欢用微信发送图片给朋友或者分享图片到朋友圈但是你知道吗一张小小图片极有可能暴露你的隐私！注意！利用微信发送图片时应当注意保护个人隐私避免暴露所在位置等个人信息

200斤坦克突然变瘦！小团团直播露脸引争议，看到1图片，网友：抽脂了？

发布于: 娱乐2020-10-10标签: 娱乐八卦图片身材网友

200斤坦克突然变瘦了？小团团直播露脸引争议，看到1图片，网友：这是抽脂了？说起一条小团团，想必大家一定都不陌生，这位直播一姐拥有着非常多的粉丝，可她却也一直存在争议，就是因为她的真实相貌。

图片报：德国足协证实正在招募穆夏拉加入德国队

发布于: 体育2020-10-08标签: 国际足球德国足协图片足协

虎扑10月7日讯据《图片报》的报道，德国足协证实他们正在邀请拜仁英格兰小将穆夏拉加入德青队，穆夏拉出生于斯图加特，但拥有英国户籍，目前是英格兰U17球员。德国青年队主管舍恩维茨表示：“我们对于穆夏拉