
# 废话不多说,直接上代码,求张国立
import requests
import re
url = ‘https://www.tubedelta.com/embed/{}’
xpath = ‘//*[@id=”thisPlayer_html5_api”]/source/@src’
headers = {
‘UserAgent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36’
}
def se():
for i in range(1,10001):
try:
link = url.format(str(i))
print(link)
res = requests.get(link,headers=headers).text
pattern = ‘0:
print(videos[0])
except Exception as e:
print(e)
print(link)
continue
if __name__ == “__main__”:
se()
2楼:你这个能弄成火车头的文件吗,导入下载,你这个不会用
3楼:核心就是 https://www.tubedelta.com/
4楼:swjymj 发表于 2019923 22:01
你这个能弄成火车头的文件吗,导入下载,你这个不会用
等会儿我编译一个exe文件放上来
5楼:厉害了 大佬。 网站打开的好慢欸
6楼:链接:https://pan.baidu.com/s/1nyD7IhtVQlow4Eqp1whXeg
提取码:cl5g
下载之后双击运行会生成一个url.txt文件视频连接都在里面
7楼:mzclub3 发表于 2019923 22:48
老哥 文件被吞了
链接:https://pan.baidu.com/s/13YVEXL3aWwBts_GGEaCgA
提取码:0z49
复制这段内容后打开百度云资源手机App,给作更方便哦
8楼:本帖最后由 89574622 于 2019923 23:11 编辑
这个是把所有的文件地址打印出来吗,能不能说说这个有顺序的视频短地址是咋找的就是这个https……./1 到10001 这个地址是怎么找到的
9楼:以后请多分享点这种代码 以供探讨
10楼:89574622 发表于 2019923 23:07
这个是把所有的文件地址打印出来吗,能不能说说这个有顺序的视频短地址是咋找的就是这个https……./1 到 …
打印视频地址,生成规律就看上面的代码就行
11楼:89574622 发表于 2019923 23:12
以后请多分享点这种代码 以供探讨
有空就分享一下
12楼:疯蛋花 发表于 2019923 23:13
有空就分享一下
非常感谢 我还是个新手
我想问的是 ‘https://www.tubedelta.com/embed/’ 这个地址前缀是怎么来的 我在网站正常进视频 没有找到这个前缀,而变化的也都是后半段‘/5/b/b/5/f/5bb5ff3644e03.mp4’ 例如这种
13楼:少来不知萌萌贵,老来望萌萌空流泪
14楼:有没有借这个教室上 课的 ,学生梦都意犹未尽呢
15楼: 可以是可以 就是这清晰度 看着有点瞎眼
16楼:技术流,学习了!
17楼:车票都买了,你给我说下车
18楼:
额……exe是易语言的?又被吞了
=========来自MSE隔离区==========
类别: 特洛伊木马
描述: 这个程序很危险,而且执行来自攻击者的命令。
推荐的给作: 立即删除这个软件。
19楼:把全站视频都看过一遍才明白,原来这真是一篇教学的文章,是我落了下乘了
20楼:爬虫写得好 监狱进的早
21楼:本帖最后由 无言 于 2019924 09:22 编辑
是分享链接,最新的已经到14163,
硬盘不够用,这样下载下载至少几百个G,
22楼:https://www.24fa.top/MeiNv/ 谁把这个,弄个爬虫,爬一下啊!
23楼:运行后并没有发现地址文件。。。
24楼:存哪去了,怎么没找到
25楼:厉害,最近爬虫盛行啊
26楼:你这代码太严谨了。。。try。。。if __name__
27楼:好多爬虫贴。。。一页能有四五个。。。
28楼:天天有福利
29楼:缘来是你 发表于 2019923 22:05
核心就是 https://www.tubedelta.com/
得着了,谢谢你~果断直接~
