百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO教程 > 正文

3秒爬取百度图片网站,批量下载各种图片

gaoyangw 2024-12-08 13:45 34 浏览 0 评论

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:一行数据

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://t.cn/A6Zvjdun

这里想问大家三个问题:

  • 你还在为表情包各种偷图吗?
  • 你还在为找不到好看的图片素材在烦恼吗?
  • 你还在为各种精美壁纸的挑选和下载找遍各大网站吗?

30行Python代码来帮你解决这个问题,现在你只要对代码进行复制、粘贴、运行三连就可以爬取你想要的图片。

Bash
import os
import requests
import re

keyWord = "杨超越" # 设置爬取图片的主题
number = 10       # 爬取图片数量
if not os.path.exists(keyWord):
    os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \
      r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \
      r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:
    p_type = i.split('.')[-1]
    a += 1
    try:
        picture = requests.get(i, timeout=10)
        name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)
        with open(name, 'wb') as f:
            f.write(picture.content)
        print('第%d张图片正在下载' % a)
    except:
        print('第%d张图片下载失败!已跳过...' % a)
    if a >= number:
        break

代码逻辑主要是爬取百度图片网站的网页源码,然后从源码中提取每张图片的地址链接,使用循环保存每一张图片。

可以将这份代码直接拷贝到Python编辑器里,只需要修改keyWord变量和num变量,设置成自己想爬取的图片主题和数量就可以运行下载了。爬取的结果如下图所示:

爬取代码高级版本

上面的代码只能爬取一页,因为他只对一个网址里的图片链接进行提取,如果想爬取大批量的图片,需要提取图片网站下一页的链接,这个核心代码如下:

Bash
def get_url_one_page(url):
    html = requests.get(url)
    html.encoding = 'utf-8'
    html = html.text
    url_pic_this_page = re.findall(r'"objURL":"(.*?)",', html)
    url_next_page_prefix = re.findall(r'<a href="(.*?)" class="n">下一页', html)
    if len(url_next_page_prefix) != 0:
        url_next_page = 'http://image.baidu.com' + url_next_page_prefix[0]
    else:
        print("已到达最后一页!")
        url_next_page = None
    return url_pic_this_page, url_next_page

在爬取关键词里输入想要爬取的图片主题,然后输入爬取图片张数,最后选择图片保存的路径并点击开始爬取就只需要静静等待即可(网速够快的话,一般来说一秒下载一张图片)最后下载后的结果如下

相关推荐

微信小程序如何推广获得流量,提升广告变现收益?

微信小程序推广能精准撬动用户增长,抓住用户,培养用户的忠诚度是所有产品的根本。#微信小程序#...

品牌活动策划:提升知名度与销量的关键

文章一开始就清楚指出,品牌活动的策划与传播是一门深奥的学问,对于提升品牌知名度、扩大销量等具有极其重要的意义。一次成功的策划与传播,不仅能吸引消费者的目光,还能在他们的心中留下美好的印象。接下来,我们...

上海商业推广方法解析:社交媒体与线下活动

上海商业气息浓郁,各种营销推广手段接连不断。以下将为大家逐一介绍几种常见的推广方法。社交媒体推广社交媒体对企业推广至关重要。在上海,微信、抖音、小红书等成了商家热捧的平台。有趣且有价值的帖子能吸引众多...

水果店如何通过线上平台拓展销售?多元化提升盈利

水果店借助线上平台拓展销售渠道,打破了地域局限,吸引了更广泛的顾客群体,显著提升了销售量。多样化的线上营销手段提升了品牌知名度,为水果店带来了更多盈利。1、搭建线上展示门面想要通过线上平台拓展水果店的...

揭秘“电诈之王” — 刷单诈骗!(电诈预警刷单类诈骗案例)

发案多!套路多变!...

刷单返利套路深度揭秘,谨防被骗!

“足不出户,日进斗金”“正规平台,诚邀刷单”...

腾讯QQ突然宣布:短视频功能不再支持!

腾讯QQ官方宣布,短视频功能将于2025年4月2日正式下线,用户将无法发布新作品或浏览他人视频。这一调整是QQ运营策略优化的一部分,旨在聚焦核心社交功能,同时整合腾讯内部资源。此次...

广点通广告有哪些投放平台?有哪些功能?

相信大家每天都在频繁的使用微信、QQ,刷朋友圈刷空间等,但是都不太清楚里面的一些广告类型,今天这篇文章,小编就带大家了解一下广点通广告有哪些投放平台?以及广告投放的功能介绍。广点通广告可自定义投放:...

一起来看“刷单诈骗”是怎样一步步套路我们的!

...

谈谈我的初中线上兼职首篇之QQ拉人进群

初中时,我刚刚接触手机聊天软件,添加了形形色色的人,进入了各种各样的群聊,像互赞群(当时特别热衷于QQ上的各类互动,还喜爱刷赞,花几分钱就能刷好几千的赞,为此还专门搭建了副网站,却不知如何运营,最后荒...

一部手机,月入过万不是梦!揭秘当下热门网络经济赚钱法

...

如何为网站加入在线客服系统,监控在线访客,主动开展营销

最近陆续有许多小伙伴询问如何在自己的服务器上部署安装自己的在线客服系统,以达到100%私有化使用的目的。所以我决定把这个过程详细的整理出来,大家按步骤来即可。...

代理 IP 地址和端口实用手册:提升网络效率的秘籍

代理IP地址和端口在网络访问中扮演着重要角色,特别是在需要隐藏真实IP地址、突破地域限制或提高网络访问效率时。以下是一份详细的实用手册,帮助您从选择、配置到优化代理IP地址和端口,以提升网...

网络营销/越客单价高的生意,越要解决信任问题

网络营销/越客单价高的生意,越要解决信任问题回想跟客户的交易过程,我觉得信任是最重要的。不管是阿里运营,还是抖音短视频运营,又或者企业的全案营销,对企业来讲,都是对他企业的一个未来投资,销售渠道的拓展...

【营销策略】(营销策略的概念)

今早要送小孩去写字,吃粉就吃得晚了点,粉店里已没人在排队。我进店就说,一两汤切粉。老板娘从汤锅那边转过身来说,哦,二两嘛?我重复一遍,一两。待打得粉过来,老板娘一手抓肉,一手抓刀,问,要什么...

取消回复欢迎 发表评论: