博客
关于我
python爬取图片
阅读量:209 次
发布时间:2019-02-28

本文共 943 字,大约阅读时间需要 3 分钟。

baidu图片打开 ——发现是瀑布流,此时可以改成分页模式

将index改为flip

在这里插入图片描述
在这里插入图片描述

就可以改为分页模式了

在这里插入图片描述

查看网页源代码,查询objURL——最清晰

在这里插入图片描述

打开后续网页url就可以得到图片,获取url后可以requests了

示例

在这里插入图片描述
在这里插入图片描述

此时:只爬取了一张图片,那么通过不同url的切换可以爬取多种图片了

如果图片地址末尾没有jpg可以自己加

在这里插入图片描述

# 思路:拿到目标url 获取网页源码 获取图片url地址 保存图片url ='https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1619608652857_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&sid=&word=%E8%8B%8D%E5%8F%B6'headers ={   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36'}r =requests.get(url=url,headers=headers)ret=r.textprint(ret)# 获取图片url地址result =re.findall(r'"objURL":"(.*?)"',ret)print(result)for url in result:    # 获取图片的名字    name =url[-10:]    print(name)    with open('图片/'+name+'.jpg','wb')as f:        r =requests.get(url)        f.write(r.content)

就取到了

在这里插入图片描述

注意:由于是瀑布流,所以网页格式有点改变,因此正则出来结果会不同,依然可以爬取不影响结果

转载地址:http://krun.baihongyu.com/

你可能感兴趣的文章
MSSQL数据库迁移到Oracle(二)
查看>>
MSSQL日期格式转换函数(使用CONVERT)
查看>>
MSTP多生成树协议(第二课)
查看>>
MSTP是什么?有哪些专有名词?
查看>>
Mstsc 远程桌面链接 And 网络映射
查看>>
Myeclipse常用快捷键
查看>>
MyEclipse更改项目名web发布名字不改问题
查看>>
MyEclipse用(JDBC)连接SQL出现的问题~
查看>>
mt-datetime-picker type="date" 时间格式 bug
查看>>
myeclipse的新建severlet不见解决方法
查看>>
MyEclipse设置当前行背景颜色、选中单词前景色、背景色
查看>>
Mtab书签导航程序 LinkStore/getIcon SQL注入漏洞复现
查看>>
myeclipse配置springmvc教程
查看>>
MyEclipse配置SVN
查看>>
MTCNN 人脸检测
查看>>
MyEcplise中SpringBoot怎样定制启动banner?
查看>>
MyPython
查看>>
MTD技术介绍
查看>>
MySQL
查看>>
MySQL
查看>>