博客
关于我
python爬取图片
阅读量:210 次
发布时间:2019-02-28

本文共 943 字,大约阅读时间需要 3 分钟。

baidu图片打开 ——发现是瀑布流,此时可以改成分页模式

将index改为flip

在这里插入图片描述

在这里插入图片描述

就可以改为分页模式了

在这里插入图片描述

查看网页源代码,查询objURL——最清晰

在这里插入图片描述

打开后续网页url就可以得到图片,获取url后可以requests了

示例

在这里插入图片描述

在这里插入图片描述

此时:只爬取了一张图片,那么通过不同url的切换可以爬取多种图片了

如果图片地址末尾没有jpg可以自己加

在这里插入图片描述

# 思路:拿到目标url 获取网页源码 获取图片url地址 保存图片url ='https://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1619608652857_R&pv=&ic=&nc=1&z=&hd=&latest=&copyright=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&sid=&word=%E8%8B%8D%E5%8F%B6'headers ={   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36'}r =requests.get(url=url,headers=headers)ret=r.textprint(ret)# 获取图片url地址result =re.findall(r'"objURL":"(.*?)"',ret)print(result)for url in result:    # 获取图片的名字    name =url[-10:]    print(name)    with open('图片/'+name+'.jpg','wb')as f:        r =requests.get(url)        f.write(r.content)

就取到了

在这里插入图片描述

注意:由于是瀑布流,所以网页格式有点改变,因此正则出来结果会不同,依然可以爬取不影响结果

转载地址:http://krun.baihongyu.com/

你可能感兴趣的文章
No 'Access-Control-Allow-Origin' header is present on the requested resource.
查看>>
NO 157 去掉禅道访问地址中的zentao
查看>>
no available service ‘default‘ found, please make sure registry config corre seata
查看>>
No compiler is provided in this environment. Perhaps you are running on a JRE rather than a JDK?
查看>>
no connection could be made because the target machine actively refused it.问题解决
查看>>
No Datastore Session bound to thread, and configuration does not allow creation of non-transactional
查看>>
No fallbackFactory instance of type class com.ruoyi---SpringCloud Alibaba_若依微服务框架改造---工作笔记005
查看>>
No Feign Client for loadBalancing defined. Did you forget to include spring-cloud-starter-loadbalanc
查看>>
No mapping found for HTTP request with URI [/...] in DispatcherServlet with name ...的解决方法
查看>>
No mapping found for HTTP request with URI [/logout.do] in DispatcherServlet with name 'springmvc'
查看>>
No module named 'crispy_forms'等使用pycharm开发
查看>>
No module named cv2
查看>>
No module named tensorboard.main在安装tensorboardX的时候遇到的问题
查看>>
No module named ‘MySQLdb‘错误解决No module named ‘MySQLdb‘错误解决
查看>>
No new migrations found. Your system is up-to-date.
查看>>
No qualifying bean of type XXX found for dependency XXX.
查看>>
No qualifying bean of type ‘com.netflix.discovery.AbstractDiscoveryClientOptionalArgs<?>‘ available
查看>>
No resource identifier found for attribute 'srcCompat' in package的解决办法
查看>>
no session found for current thread
查看>>
no such file or directory AndroidManifest.xml
查看>>