一篇文章教會你利用Python網絡爬蟲抓取王者榮耀圖片

2020-08-03 由顓孫佳悦發佈於科技

【一、項目背景】

王者榮耀作為當下最火的遊戲之一，裏面的人物信息更是惟妙惟肖，但受到官網的限制，想下載一張高清的圖片很難。（圖片有版權）。

以彼岸桌面這個網站為例，爬取王者榮耀圖片的信息。

【二、項目目標】

實現將獲取到的圖片批量下載。

【三、涉及的庫和網站】

1、網址如下：

https://www.netbian.com/s/wangzherongyao/index.htm/

2、涉及的庫：requests、lxml

【四、項目分析】

首先需要解決如何對下一頁的網址進行請求的問題。可以點擊下一頁的按鈕，觀察到網站的變化分別如下所示：

https://www.netbian.com/s/wangzherongyao/index_2.htm

https://www.netbian.com/s/wangzherongyao/index_3.htm

https://www.netbian.com/s/wangzherongyao/index_4.htm

觀察到只有index_()變化，變化的部分用{}代替，再用for循環遍歷這網址，實現多個網址請求。

https://www.netbian.com/s/wangzherongyao/index_{}.htm

【五、項目實施】

1、我們定義一個class類繼承object，然後定義init方法繼承self，再定義一個主函數main繼承self。準備url地址和請求頭headers。

import requests

from lxml import etree

import time

class ImageSpider(object):

def __init__(self):

self.firsr_url = "https://www.netbian.com/s/wangzherongyao/index.htm"

self.url = "https://www.netbian.com/s/wangzherongyao/index_{}.htm"

self.headers = {

"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"

}

def main(self):

pass

if __name__ == '__main__':

spider= ImageSpider()

spider.main()

'''發送請求獲取響應'''

def get_page(self, url):

res = requests.get(url=url, headers=self.headers)

html = res.content.decode("gbk") #網絡編碼

return html #返回值

'''解析數據'''

def parse_page(self, html):

parse_html = etree.HTML(html)

image_src_list = parse_html.xpath('//div[@class="list"]/ul/li/a//@href')

for image_src in image_src_list:

fa = "https://www.netbian.com" + image_src

# print(fa)

4、在谷歌瀏覽器上，右鍵選擇開發者工具或者按F12。

5、右鍵檢查，找到圖片二級的頁面的鏈接，如下圖所示。

6、對二級頁面發生請求，for遍歷得到的網址。

bimg_url = parse_html1.xpath('//div[@class="pic-down"]/a/@href')

for i in bimg_url:

diet = "https://www.netbian.com" + i

# print(diet)

html2 = self.get_page(diet)

parse_html2 = etree.HTML(html2)

# print(parse_html2)

url2 = parse_html2.xpath('//table[@id="endimg"]//tr//td//a/img/@src')

7、將獲取的圖片寫入文檔，獲取圖片的title值作為圖片的命名。

filename = parse_html2.xpath('//table[@id="endimg"]//tr//td//a/@title')

for e in filename:

# print(e)

dirname = "./王者榮耀/" + e + '.jpg'

html2 = requests.get(url=r, headers=self.headers).content

# print(html2)

print(dirname)

with open(dirname, 'wb') as f:

f.write(html2)

print("%s下載成功" % filename)

8、在main方法調用，如下所示。因為第一頁的網址是沒有規律的，所以這裏先判斷一下是不是第一頁。

startPage = int(input("起始頁:"))

endPage = int(input("終止頁:"))

for page in range(startPage, endPage + 1):

if page == 1:

url = self.firsr_url

else:

url = self.url.format(page)

# print(url)

html = self.get_page(url)

print("第%s頁爬取成功！！！！" % page)

# print(html)

self.parse_page(html)

【六、效果展示】

1、運行程序，在控制枱輸入你要爬取的頁數，如下圖所示。

2、將下載成功的圖片信息顯示在控制枱，如下圖所示。

3、在本地可以看到效果圖，如下圖所示。

【七、總結】

1、不建議抓取太多數據，容易對服務器造成負載，淺嘗輒止即可。

2、希望通過這個項目，能夠幫助大家下載高清的圖片。

3、本文基於Python網絡爬蟲，利用爬蟲庫，實現王者榮耀圖片的抓取。實現的時候，總會有各種各樣的問題，切勿眼高手低，勤動手，才可以理解的更加深刻。

4、英雄有很多，大家自行選擇你喜歡的英雄做為你的桌面的壁紙吧。

5、需要本文源碼的小夥伴，後台回覆“王者榮耀”四個字，即可獲取。

看完本文有收穫？請轉發分享給更多的人

IT共享之家

入羣請在微信後台回覆【入羣】

責任編輯：

轉載請註明：一篇文章教會你利用Python網絡爬蟲抓取王者榮耀圖片 - 楠木軒

孩子創造力有多強？一組課本塗鴉圖片征服網友：大神收下我的膝蓋

發佈於: 經典2020-11-20標籤: 美國隊長征服圖片課本

文章原創，版權歸本作者所有，歡迎個人轉發分享！上課的時候，很少有孩子能整堂課保持注意力，很多孩子都會開小差。開小差時，有的孩子會扔紙團聊天，有的孩子看窗外，還有的孩子會在課本上塗鴉，大秀一把創造力

皇室戰爭：疑似新卡牌圖片曝光，5費寒冰飛龍，攻擊自帶減速

發佈於: 科技2020-11-17標籤: 網遊皇室戰爭圖片費寒冰

曉東説遊戲，皇室天天見！各位CR的小夥伴們大家好，在《皇室戰爭》大鬍子主播發布視頻後，玩家們從視頻的最後幾秒發現了一個彩蛋。雖然畫面的透明度相當高，但細心的玩家還是發現了其中的奧秘。沒錯，它就是即將上

原神：內鬼已經爆出了1.2版本的更新！雙五星，新地圖，新聖遺物，新武器！

發佈於: 科技2020-11-17標籤: 圖片更新新聖武器

開頭先説一句：MHY內鬼，YYDS！原神1.1版本才剛上線不久，下個月的1.2版本已經被內鬼爆料出好多幹貨了，話説明明是國產遊戲，為啥選擇優先爆料在外網呢？不管了，有人爆料就是好事，下面小編給大家總結

我的世界當MC變成解壓遊戲，這些圖片，你看了後肯定會説“爽”

發佈於: 科技2020-11-11標籤: 我的世界肯定圖片

#絕地求生電競賽#媽，我壓力有點大小孩子，哪來的壓力？難道只有成年人的生活才叫不容易，小孩子的世界就毫無壓力嗎？當桌子上擺放着一張飽滿的泡泡紙，只需輕輕一捏，它們便會“啪”得一聲爆開，相信沒有

辦公小技巧：圖片動態報表巧製作

發佈於: 奇聞2020-11-10標籤: power view 圖片製作動態

數字式報表總讓人感覺有些單調、枯燥，如果將數字式報表改造成圖片式的報表，將圖片做成列表，可用滑塊滾動瀏覽，當點擊相應圖片時，就會出現該圖片所對應的數據，這樣的效果豈不別具一格（圖1）？其實，利用Ex

到底是男的抱女的還是女的抱男的？這15張圖片太神奇了，看懂了嗎

發佈於: 奇聞2020-11-10標籤: wow 到底圖片魔毯

1、到底是男的抱女的還是女的抱男的？2、這是晚宴？還是一張臉？3、他固執的像一頭驢！4、這個輪子會不會略大！5、wow，一個優雅的芭蕾舞演員。6、Nooooooo7、這，叫人如何面對？8、活吞了一隻馬

8張“尷尬”到哭的圖片,圖3到底做錯了什麼

發佈於: 綜合2020-11-06標籤: 青年圖片圈圈到底

生活不免會遇到尷尬的處境，但是這些尷尬到爆的場景你一定沒遇過，一起來看看吧~1、一名男子在街邊休息，他買了很多雞蛋，高度剛好可以當小板凳用。2、只想安靜的吃一頓飯，為什麼會有一根柱子？無奈臉演技好評。

騰訊發佈“正版圖庫直通車”:1.2億張正版圖片

發佈於: 科技2020-10-31標籤: 正版圖片騰訊圖片互聯網

今天，騰訊發佈了新的業務，其來自騰訊雲的“正版圖庫直通車”，就是針對正版圖片的服務。騰訊官方表示，通過該產品，用户在一個平台上即可搜索、購買多家圖庫的圖片資源，無需跨平台搜索。

dunk配色圖片價格大全 dunk最火配色排行

發佈於: 奇聞2020-10-23標籤: 配色圖片大全 nike

今年是dunk年，配色也是一個接一個的，加上人氣流量王一博的帶貨，讓這雙鞋款火到爆，那麼2020年發售了哪些值得關注的dunk sb鞋款呢？今天小編就給大家整理了一下發售的全新dunk的配色和價格，下

夢幻西遊：大雁塔發生“新變化”？從這張圖片中，發現了不同之處

發佈於: 科技2020-10-16標籤: 夢幻西遊大雁塔月光寶盒圖片

當年，玄奘為了保存由天竺帶回長安的經卷佛像主持修建了大雁塔，在夢幻西遊中，這一建築得到了重現。在長安城內，大雁塔應該算是最高的建築物，如果站在頂層向下眺望，也能看到不一樣的風景。就在前幾天，一位夢幻老

圖片報：多特中場雷納18歲之後，年薪將翻倍

發佈於: 體育2020-10-15標籤: 多特雷納國際足球圖片

虎撲10月15日訊多特蒙德小將雷納的表現不俗，《圖片報》表示，當雷納年滿18歲時，多特將給他提供翻倍的薪水。雷納將在11月13日年滿18歲，《圖片報》表示，雷納年滿18歲之後，不僅可以得到多特蒙德

值無不言310期：10款功能強大、操作簡單的在線圖片處理工具，無損放大、AI修復統統輕鬆搞定！

發佈於: 科技2020-10-13標籤: GIF圖圖片無損在線

Hi，親愛的值友們，《值無不言》欄目新的一期上線啦！無論你是想了解更多攻略還是學習更多知識，點此關注話題#值無不言#本期值無不言我們請來了站內生活家、遊戲領域作者@青春向榮為大家分享10款功能強大、操

朋友圈曬圖的注意！小心惹禍上身！

發佈於: 綜合2020-10-11標籤: 朋友圈圖片中年曬圖

現在不少人都喜歡用微信發送圖片給朋友或者分享圖片到朋友圈但是你知道嗎一張小小圖片極有可能暴露你的隱私！注意！利用微信發送圖片時應當注意保護個人隱私避免暴露所在位置等個人信息

200斤坦克突然變瘦！小團團直播露臉引爭議，看到1圖片，網友：抽脂了？

發佈於: 娛樂2020-10-10標籤: 娛樂八卦圖片身材網友

200斤坦克突然變瘦了？小團團直播露臉引爭議，看到1圖片，網友：這是抽脂了？説起一條小團團，想必大家一定都不陌生，這位直播一姐擁有着非常多的粉絲，可她卻也一直存在爭議，就是因為她的真實相貌。

圖片報：德國足協證實正在招募穆夏拉加入德國隊

發佈於: 體育2020-10-08標籤: 國際足球德國足協圖片足協

虎撲10月7日訊據《圖片報》的報道，德國足協證實他們正在邀請拜仁英格蘭小將穆夏拉加入德青隊，穆夏拉出生於斯圖加特，但擁有英國户籍，目前是英格蘭U17球員。德國青年隊主管舍恩維茨表示：“我們對於穆夏拉