百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

3秒爬取百度图片网站,批量下载各种图片

gaoyangw 2024-12-08 13:45 46 浏览 0 评论

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:一行数据

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://t.cn/A6Zvjdun

这里想问大家三个问题:

  • 你还在为表情包各种偷图吗?
  • 你还在为找不到好看的图片素材在烦恼吗?
  • 你还在为各种精美壁纸的挑选和下载找遍各大网站吗?

30行Python代码来帮你解决这个问题,现在你只要对代码进行复制、粘贴、运行三连就可以爬取你想要的图片。

import os
import requests
import re

keyWord = "杨超越" # 设置爬取图片的主题
number = 10       # 爬取图片数量
if not os.path.exists(keyWord):
    os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \
      r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \
      r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:
    p_type = i.split('.')[-1]
    a += 1
    try:
        picture = requests.get(i, timeout=10)
        name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)
        with open(name, 'wb') as f:
            f.write(picture.content)
        print('第%d张图片正在下载' % a)
    except:
        print('第%d张图片下载失败!已跳过...' % a)
    if a >= number:
        break

代码逻辑主要是爬取百度图片网站的网页源码,然后从源码中提取每张图片的地址链接,使用循环保存每一张图片。

可以将这份代码直接拷贝到Python编辑器里,只需要修改keyWord变量和num变量,设置成自己想爬取的图片主题和数量就可以运行下载了。爬取的结果如下图所示:

爬取代码高级版本

上面的代码只能爬取一页,因为他只对一个网址里的图片链接进行提取,如果想爬取大批量的图片,需要提取图片网站下一页的链接,这个核心代码如下:

def get_url_one_page(url):
    html = requests.get(url)
    html.encoding = 'utf-8'
    html = html.text
    url_pic_this_page = re.findall(r'"objURL":"(.*?)",', html)
    url_next_page_prefix = re.findall(r'<a href="(.*?)" class="n">下一页', html)
    if len(url_next_page_prefix) != 0:
        url_next_page = 'http://image.baidu.com' + url_next_page_prefix[0]
    else:
        print("已到达最后一页!")
        url_next_page = None
    return url_pic_this_page, url_next_page

在爬取关键词里输入想要爬取的图片主题,然后输入爬取图片张数,最后选择图片保存的路径并点击开始爬取就只需要静静等待即可(网速够快的话,一般来说一秒下载一张图片)最后下载后的结果如下

相关推荐

Everything:Windows平台最强大的文件搜索神器推荐

Windows自带的搜索功能一直是让用户头疼的问题。搜索效率低下、功能不完善、响应缓慢,甚至有时明明知道文件就在某个文件夹中,却怎么也搜索不出来。现在的Windows很多时候都给我个感觉,微软操作系统...

谈谈目前最好用的文件搜索神器(强大的文件搜索软件有哪些)

Everything是由...

深度解析:如何做好网站SEO优化服务,提升网站排名

https://txc.qq.com/products/755566/blog/1790183https://txc.qq.com/products/755419/blog/1790181https:...

JDG第一,GEN第二!S13全球总决赛夺冠热门Top10

伴随着2023全球总决赛即将到来,关于本届世界赛有哪些有机会夺冠的队伍也成为了不少网友们讨论的焦点。而在近日,国外网站目前更新了各大参赛队伍的夺冠热门排名。那么,具体情况如何?就让我们一起来了解一下吧...

7大热门查重降重网站汇总,论文写作必备!(部分免费)

查重,是论文写作的必备流程。...

大量恶意广告影响荷兰的热门网站(宣传荷兰的广告句子)

阅读:26次点赞(0)收藏4月10号,Fox-IT安全指挥中心检测到了大量与漏洞利用工具有关的攻击事件。这些安全事件起源于针对荷兰网站的大规模恶意广告活动。我们在下面列出了受影响的荷兰网站站点,这些...

热门视频素材网站的在哪里找?(视频素材网址)

身为短视频剪辑者来说,不管是国内的,还是国外的,大多数都使用过了。下面分享俺剪辑多年视频后,探索出来的经典视频素材,都是榜上有名的,介绍最全的一篇,你来看看就知道啦!...

我用PPT做了1个视频,却上了B站热门!这个超酷动画库分享给你

...

热门AI视频生成网站,看这个榜单就够了

热门AI视频生成网站,看这个榜单就够了

八大受到网友一致好评的经典著作,每一本都火出天际

火的小说很多,但这么火的也是很少见的。今天就给大家来盘一盘这几本火出天际的网文经典著作,都是不少书友们的入坑神作啊。...

个人隐私遭泄露?这3类“不良网站”才是罪魁祸首!网友:不早说

大家都知道,在网络信息时代,毫无个人隐私可言,很多人每天都会收到一些垃圾短信、骚扰电话,而且使用微信、QQ时,也经常遇到陌生人,发来的“好友申请”,但实际上,这些问题,通过设置电话、短信拦截功能,就能...

想约会吗?泰国7大最热门交友程序和网站,让你情人节不孤单

空气中弥漫着爱意,情人节即将来临。但是,如果你还没有约会,别担心!还有不到一周的时间,感谢技术的力量,我们仍然有时间找到那个特别的人。有了如此多的约会应用程序和网站,与潜在的匹配对象建立联系并找到火花...

消息称微软将为Win11任务栏加入“推荐”,展示热门网站/应用

IT之家11月10日消息,据消息源Phantomofearth透露,在近期的Windows11Build27723版本中,系统新增一项名为“SnapGroupsRecommend...

TopList:一款获取各大热门网站热门头条的聚合网站

开源地址:https://github.com/tophubs/TopList...

好玩有趣的十款网页小游戏推荐,上班摸鱼爽到不行!

分享十款好玩有趣的网页小游戏,打开就能玩,随便哪个都能玩上一整天,赶紧看过来~花光比尔盖茨的钱入口:https://neal.fun/spend/这个网站会模拟拥有比尔盖茨的900亿美元资产,内置可购...

取消回复欢迎 发表评论: