自动爬取妹子图爬虫

本帖最后由 skynone 于 2018918 12:32 编辑
预览图就不放了

自动爬取妹子图爬虫

本帖最后由 skynone 于 2018918 12:32 编辑

预览图就不放了,详情请移步原贴;

爬虫运行需要python3 /

安装好后 win + R 输入 IDLE, 复制代码到IDLE

按F5 运行,选择一个文件夹保存并且爬虫默认下载位置也在那。

import urllib.request

import os

import re

#打开url给作

def url_open(url):

headers = {‘UserAgent’:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36′,

‘Referer’: ‘http://wwww.mzitu.com’}

req = urllib.request.Request(url,headers = headers)

response = urllib.request.urlopen(req)

html = response.read()

return html

#获取当前图片组的最大页码数

def get_maxpage(url):

html = url_open(url).decode(‘utf8’)

pages = re.findall(r’

\d{1,2}’,html)

return pages[1][6:len(pages[1])]

#传入当前页面url,返回当前页面所有图片组链接地址列表

def find_imgs(url):

html = url_open(url).decode(‘utf8’)

imgs_url = re.findall(r’http:///\d{6}’,htwww.mzitu.comml)复制代码最后感谢原作者分享的爬虫代码。

2楼:妹子呢小白只会看图

3楼:能爬qq空间的吗

4楼:孙燕姿 发表于 2018918 10:58

什么代码不代码,一句都不看不懂,能不能出个详细的小白教程啊

建议到原贴的论坛,学习小甲鱼的Python视频

5楼:chuangwan2015 发表于 2018918 11:20

能爬qq空间的吗

em ,这个爬虫只是针对“妹子图”这个网站的。。。

6楼:能不能爬这个chan.sankakucomplex.com站

7楼:自己会写,还是学习下

8楼:JDK 发表于 2018918 17:07

能不能爬这个chan.sankakucomplex.com站

估计要看针对网站的页面进行分析,调整代码吧

9楼:渣渣表示看不懂

10楼:装了WIN+R也运行不了啊

11楼:学习了,谢谢分享,谢谢楼主

12楼:小白问一句 这种事都要用上 python ? 你们都是人手python环境吗?

为什么不是一个简单的易语言网页访问加正则? 落伍了~~~

13楼:欸 为什么不用requests 第三方库好用的多哈哈

14楼:没有手机的?这是源码?

15楼:下载来学习下,看能爬到多少妹子图

16楼:为啥没有人去爬91自拍这个神站?!!!

17楼:原帖论坛不错,还有没有这种爬虫分享论坛

18楼:提示语法错误是什么鬼

19楼:运行后什么都没有爬是怎么回事

20楼:tr2016 发表于 2018919 15:23

运行后什么都没有爬是怎么回事

发张截图看看?

21楼:https://www.tuao8.top/

这个站搞的定吗?

(0)

相关推荐