发一波爬虫福利，要节制啊年轻人！-优刊号

# 废话不多说，直接上代码，求张国立

import requests

import re

url = ‘https://www.tubedelta.com/embed/{}’

xpath = ‘//*[@id=”thisPlayer_html5_api”]/source/@src’

headers = {

‘UserAgent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36’

}

def se():

for i in range(1,10001):

try:

link = url.format(str(i))

print(link)

res = requests.get(link,headers=headers).text

pattern = ‘0:

print(videos[0])

except Exception as e:

print(e)

print(link)

continue

if __name__ == “__main__”:

se()

2楼：你这个能弄成火车头的文件吗，导入下载，你这个不会用

3楼：核心就是 https://www.tubedelta.com/

4楼：swjymj 发表于 2019923 22:01

你这个能弄成火车头的文件吗，导入下载，你这个不会用

等会儿我编译一个exe文件放上来

5楼：厉害了大佬。网站打开的好慢欸

6楼：链接：https://pan.baidu.com/s/1nyD7IhtVQlow4Eqp1whXeg

提取码：cl5g

下载之后双击运行会生成一个url.txt文件视频连接都在里面

7楼：mzclub3 发表于 2019923 22:48

老哥文件被吞了

链接：https://pan.baidu.com/s/13YVEXL3aWwBts_GGEaCgA

提取码：0z49

复制这段内容后打开百度云资源手机App，给作更方便哦

8楼：本帖最后由 89574622 于 2019923 23:11 编辑

这个是把所有的文件地址打印出来吗，能不能说说这个有顺序的视频短地址是咋找的就是这个https……./1 到10001 这个地址是怎么找到的

9楼：以后请多分享点这种代码以供探讨

10楼：89574622 发表于 2019923 23:07

这个是把所有的文件地址打印出来吗，能不能说说这个有顺序的视频短地址是咋找的就是这个https……./1 到 …

打印视频地址，生成规律就看上面的代码就行

11楼：89574622 发表于 2019923 23:12

以后请多分享点这种代码以供探讨

有空就分享一下

12楼：疯蛋花发表于 2019923 23:13

有空就分享一下

非常感谢我还是个新手

我想问的是 ‘https://www.tubedelta.com/embed/’ 这个地址前缀是怎么来的我在网站正常进视频没有找到这个前缀，而变化的也都是后半段‘/5/b/b/5/f/5bb5ff3644e03.mp4’ 例如这种

13楼：少来不知萌萌贵，老来望萌萌空流泪

14楼：有没有借这个教室上课的，学生梦都意犹未尽呢

15楼：可以是可以就是这清晰度看着有点瞎眼

16楼：技术流，学习了！

17楼：车票都买了，你给我说下车

18楼：

额……exe是易语言的？又被吞了

=========来自MSE隔离区==========

类别: 特洛伊木马

描述: 这个程序很危险，而且执行来自攻击者的命令。

推荐的给作: 立即删除这个软件。

19楼：把全站视频都看过一遍才明白,原来这真是一篇教学的文章,是我落了下乘了

20楼：爬虫写得好监狱进的早

21楼：本帖最后由无言于 2019924 09:22 编辑

是分享链接，最新的已经到14163，

硬盘不够用，这样下载下载至少几百个G，

22楼：https://www.24fa.top/MeiNv/ 谁把这个，弄个爬虫，爬一下啊！

23楼：运行后并没有发现地址文件。。。

24楼：存哪去了,怎么没找到

25楼：厉害，最近爬虫盛行啊

26楼：你这代码太严谨了。。。try。。。if __name__

27楼：好多爬虫贴。。。一页能有四五个。。。

28楼：天天有福利

29楼：缘来是你发表于 2019923 22:05

核心就是 https://www.tubedelta.com/

得着了，谢谢你~果断直接~

发一波爬虫福利，要节制啊年轻人！

相关推荐