栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > IT > 软件开发 > 后端开发 > Python

python爬虫案例:手刃电影天堂

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python爬虫案例:手刃电影天堂

废话不多说,上代码: 

import requests
import re

#提取主页源代码
domain = "https://www.dytt89.com/"
resp = requests.get(domain)
resp.encoding = 'gbk'
#定位必看热片 保存至movie
obj1 = re.compile(r'2022必看热片.*?
    (?P.*?)
',re.S) result1 = obj1.finditer(resp.text) movie = result1.__next__().group('movie') resp.close() #提取子页面链接 obj2 = re.compile(r"
  • .*?)' title",re.S) result2 = obj2.finditer(movie) child_href_list = [] #保存电影链接地址 for i in result2: child_href_list.append(domain+i.group('href')) #加上主页网址domain后保存至列表 提取成功! # 提取子页面的下载地址并保存至文件 obj3 = re.compile(r'◎片  名(?P.*?)
    .*?magnet',re.S) f = open(file='movies_download.txt',mode='w',encoding='utf-8') for href in child_href_list: resp = requests.get(href) resp.encoding='gbk' child_href = obj3.search(resp.text) print(child_href.group('load')) resp.close() f.write(child_href.group('load')+'nn') f.close()
  • 转载请注明:文章转载自 www.wk8.com.cn
    本文地址:https://www.wk8.com.cn/it/1037082.html
    我们一直用心在做
    关于我们 文章归档 网站地图 联系我们

    版权所有 (c)2021-2022 wk8.com.cn

    ICP备案号:晋ICP备2021003244-6号