
本帖最后由 skynone 于 2018918 12:32 编辑
预览图就不放了,详情请移步原贴;
爬虫运行需要python3 /
安装好后 win + R 输入 IDLE, 复制代码到IDLE
按F5 运行,选择一个文件夹保存并且爬虫默认下载位置也在那。
import urllib.request
import os
import re
#打开url给作
def url_open(url):
headers = {‘UserAgent’:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36′,
‘Referer’: ‘http://wwww.mzitu.com’}
req = urllib.request.Request(url,headers = headers)
response = urllib.request.urlopen(req)
html = response.read()
return html
#获取当前图片组的最大页码数
def get_maxpage(url):
html = url_open(url).decode(‘utf8’)
pages = re.findall(r’
\d{1,2}’,html)
return pages[1][6:len(pages[1])]
#传入当前页面url,返回当前页面所有图片组链接地址列表
def find_imgs(url):
html = url_open(url).decode(‘utf8’)
imgs_url = re.findall(r’http:///\d{6}’,htwww.mzitu.comml)复制代码最后感谢原作者分享的爬虫代码。
2楼:妹子呢小白只会看图
3楼:能爬qq空间的吗
4楼:孙燕姿 发表于 2018918 10:58
什么代码不代码,一句都不看不懂,能不能出个详细的小白教程啊
建议到原贴的论坛,学习小甲鱼的Python视频
5楼:chuangwan2015 发表于 2018918 11:20
能爬qq空间的吗
em ,这个爬虫只是针对“妹子图”这个网站的。。。
6楼:能不能爬这个chan.sankakucomplex.com站
7楼:自己会写,还是学习下
8楼:JDK 发表于 2018918 17:07
能不能爬这个chan.sankakucomplex.com站
估计要看针对网站的页面进行分析,调整代码吧
9楼:渣渣表示看不懂
10楼:装了WIN+R也运行不了啊
11楼:学习了,谢谢分享,谢谢楼主
12楼:小白问一句 这种事都要用上 python ? 你们都是人手python环境吗?
为什么不是一个简单的易语言网页访问加正则? 落伍了~~~
13楼:欸 为什么不用requests 第三方库好用的多哈哈
14楼:没有手机的?这是源码?
15楼:下载来学习下,看能爬到多少妹子图
16楼:为啥没有人去爬91自拍这个神站?!!!
17楼:原帖论坛不错,还有没有这种爬虫分享论坛
18楼:提示语法错误是什么鬼
19楼:运行后什么都没有爬是怎么回事
20楼:tr2016 发表于 2018919 15:23
运行后什么都没有爬是怎么回事
发张截图看看?
21楼:https://www.tuao8.top/
这个站搞的定吗?
