怎么仿网站链接所有娱乐场网址平台
- 作者: 五速梦信息网
- 时间: 2026年04月20日 06:50
当前位置: 首页 > news >正文
怎么仿网站链接,所有娱乐场网址平台,济南网站建设公司哪家专业,郴州seo推广爬虫post收尾以及cookie加代理 目录 1.post请求收尾 2.cookie加代理 post收尾 post请求传参有两种格式#xff0c;载荷中有请求载荷和表单参数#xff0c;我们需要做不同的处理。 1.表单数据#xff1a;data字典传参 content-type: application/x-www-form-urlencoded; …爬虫post收尾以及cookie加代理 目录 1.post请求收尾 2.cookie加代理 post收尾 post请求传参有两种格式载荷中有请求载荷和表单参数我们需要做不同的处理。 1.表单数据data字典传参 content-type: application/x-www-form-urlencoded; charsetUTF-8(这种方法是上一篇文章讲到的) 查询字符串参数跟在url后面的参数 2.请求载荷json字典 content-type 告知服务端传入的参数类型是什么类型 application/json;charsetUTF-8 传入的参数是个json格式数据 两种处理办法 一 1- 伪装指定content-type 2- 传参还是使用data参数,参数值是一个json字符串 二 直接使用json参数字典 第一种方法: import requests url https://join.qq.com/api/v1/position/searchPosition?timestamp1727440821893 headers {user-agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/129.0.0.0 Safari/537.36,content-type:application/json;charsetUTF-8 } data {projectIdList:[1],keyword:,bgList:[],workCountryType:0,workCityList: [],recruitCityList:[],positionFidList:[],pageIndex:3,pageSize:10} res requests.post(url,datadata,headersheaders) print(res.text)第二种方法: import requests url https://join.qq.com/api/v1/position/searchPosition?timestamp1727440821893 data {projectIdList:[1],keyword:,bgList:[],workCountryType:0,workCityList: [],recruitCityList:[],positionFidList:[],pageIndex:3,pageSize:10} res requests.post(url,jsondata) print(res.text)cookie cookie是存储在浏览器中的一组键值对,用来保存当前用户身份 存在时效性的会过期过期的时间一般都是服务端指定 如果访问的目标网站需要cookie, 处理的办法: 1.直接复制浏览器中登录之后的cookie, 伪装请求头中有一个cookie 存储在客户端浏览器中的一组键值对, 能够用于保存一些状态, 但有个要求必须要先登录。 import requests url https://my.4399.com/forums/index-getMtags?typegamepage1 headers {cookie:UM_distinctid18f5d84be7ab12-0d4fcf3a09be2e-26001d51-1fa400-18f5d84be7bf28;_4399tongji_vid171526094309656; _4399stats_vid17152609431943750; _gprp_c;smidV2202405111957567078c442e11c09b2676e719231c52c1f00ffe8aacc95bce90; home4399yes;Puser3073859018; Pnick%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE; Qnick;Sauth4078826105%7C3073859018%7C1724907026%7C1725771373%7Cad31369854452fbfe2af%7C%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE%7C%E4%B8%AD%E9%87%8E%E5%B7%A7%E5%AE%89%E6%9B%BC%E5%A6%AE%7C47e7e4cfced0bcb5a19d88b03d094613;Hm_lvt_334aca66d28b3b338a76075366b2b9e81724391240,1724906618,1724932650;ptusertypemy.4399_login; zone_guide_date1724947200; zone_guide_time2;_4399tongji_st1724933289; USESSIONIDe61b6eb4-3e07-48dd-b354-c9fe6ef545d2;Hm_lvt_5c9e5e1fa99c3821422bf61e662d4ea51724906645,1724932678,1724933289;HMACCOUNT13108745FF137EDD;Hm_lvt_e5a07b5994f78634294b9c347a5be7d21724906645,1724932678,1724933289; phlogactl1493;Uauth4399|1|2024829|my.|1724933589815|d59a0688a9891db73745cf920f83aa63;Pauth4078826105|3073859018|t3ce7n2813b76b1e854c4b9428c211e1|1724933589|10002|690950f30d878aa6ed7e245af0c9fb18|2; ck_accname3073859018; Xauth6b199edef659802ab9fac4d9eea16604;Hm_lpvt_e5a07b5994f78634294b9c347a5be7d21724933589;Hm_lpvt_5c9e5e1fa99c3821422bf61e662d4ea51724933589;Pmtime85fe178bc1e94ed171d3%7C1724933590; ol1 }res requests.get(url,headersheaders) res.encoding utf-8 print(res.text)爬虫获取群组数据 1- 找数据所在的url https://my.4399.com/forums/index-getMtags?typegamepage1 2- 请求成功之后得到的反馈信息是要先登录明明浏览器已经登录了为什么还要登录因为浏览器和代码没有关系 3- 如何解决登录问题 1- 带上登录之后的cookie:当你登录完成之后会保存一些用户信息在里面cookie中保存的内容不会永久有效时间期 限服务端决定 优点简单直接缺点会过期 2.通过模拟登录登录成功之后获取cookie(大部分网站实现登录密码都进行了加密所以这种方式不适用所有 网站但是4399可以直接传入明文服务端没做密码是否为密文的检测只做了密码是否正确的检测) # 1- 登录请求
2- 获取数据请求
模拟登录
login_url https://ptlogin.4399.com/ptlogin/login.do?v1
post请求传入参数
import requests data {loginFrom:uframe,postLoginHandler:refreshParent,layoutSelfAdapting:false,externalLogin:qq,displayMode:embed,layout:vertical,appId:u4399,css:https://uc.img4399.com/root/css/ptlogin.css?a3993b7,mainDivId:embed_login_div,includeFcmInfo:false,level:0,regLevel:4,userNameLabel:4399用户名,userNameTip:请输入4399用户名,welcomeTip:欢迎回到4399,sec:1,password:hkyx8888, # 4399服务端支持密码传入明文但是其它网站的登录不一定支持username:3073859018, }
登录之后的响应对象 如果登录成功服务端返回cookie保存在响应对象中
login_res requests.post(login_url,datadata)
目标url
url https://my.4399.com/forums/index-getMtags?typegamepage2
res requests.get(url,cookieslogin_res.cookies)
res.encoding utf-8
print(res.text)因为访问群组页面需要先登录账号 爬虫也可以先登录服务端会返回cookie包含了用户信息 再获取目标url的时候带上登录后的cookie 小tips: 我们可以看到data里面的数据, 有这么多的键值对, 都从网上赋值过来的文本数据, 那怎么一键变为键值对数据呢? 这个其实很简单, 我们在pycharm里面打开替换文本的工具(Ctrlr快捷键打开)。 注意: 需要点亮星星哦, 就是最上面中间的地方, .*那个符号。
代码区自动会帮我们选中需要替换的区域 我们点击全部替换, 然后再给它放到一个字典里面去。
d {hca: 7AB3E94A75916BE3,cc: 1,ck: 1,cl: 24-bit,ds: 1536x960,vl: 264,ep: 5029,566,et: 3,ja: 0,ln: zh-cn,lo: 0,lt: 1727441846,rnd: 1855248226,si: e5a07b5994f78634294b9c347a5be7d2,su: https://my.4399.com/forums/mtags,v: 1.3.2,lv: 2,sn: 25299,r: 0,ww: 1523,u: https://my.4399.com/forums/mtag-78097
}以后大家可以多使用这种方法哦, 既方便又快捷, 但是需要注意的是在我们把修改好的数据全部放到新的字典里面去的时候, 每一句话的最后一行都要加分号。
实战: 获取腾讯招聘的招聘项目每一个框里面的数据(应届生的岗位投递信息, 就最下方最大的红色框里面的信息)。
自己先尝试的去做一做, 不要马上看答案哦。
参考答案:
import requestspageIndex 1
count 1
分页获取数据
while True:url https://join.qq.com/api/v1/position/searchPosition?timestamp1727532633390headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36,cookie: UserInfo1kij6FX225E8Xm5SldigGuGG8cYEEgznyKdgtlbiSLV5y/bsU4j/m2d1S8dYWCQx0yLKUpGj4XJ3ZRiN5VrTuBbk3TnGGbSg7faVuROyuNOoS5pgSyNqCS6nc51VLWrECSpiILWyPk2xP32aoS1cWGP37hTHHQzLZeJYd/QsSTJ/sSuDenS9g26yEgmphPnHE0Bfq/EDG1XZUS41Pni2nwHYHeEgEfhNspL25x67XXcVhZgb7NYaSnklM/I2GLEH8c3gXpVU6/4jC4i6kg; loginMark02}data {bgList: [],pageIndex: pageIndex,pageSize: 10,positionFidList: [],projectIdList: [1, 2, 12, 14],recruitCityList: [],workCityList: [],workCountryType: 0}response requests.post(url, headersheaders, jsondata)data response.json()if data[data][positionList] is not None:for i in data[data][positionList]:# 工作岗位work_title i[positionTitle]# 应届生的背景bgs i[bgs]# 工作地点workCities i[workCities]print(count)print(工作岗位:, work_title)print(应届生的背景:, bgs)print(工作地点:, workCities)count 1else:breakpageIndex 1这个实战题你写出来了吗?如果写出来的话, 给自己一个掌声哦。 以上就是爬虫post收尾以及cookie的所有内容了, 如果有哪里不懂的地方,可以把问题打在评论区, 欢迎大家在评论区交流!!! 如果我有写错的地方, 望大家指正, 也可以联系我, 让我们一起努力, 继续不断的进步. 学习是个漫长的过程, 需要我们不断的去学习并掌握消化知识点, 有不懂或概念模糊不理解的情况下,一定要赶紧的解决问题, 否则问题只会越来越多, 漏洞也就越老越大. 人生路漫漫, 白鹭常相伴!!!
- 上一篇: 怎么防止网站攻击东莞工程
- 下一篇: 怎么仿照别人网站大兴网站定制开发
相关文章
-
怎么防止网站攻击东莞工程
怎么防止网站攻击东莞工程
- 技术栈
- 2026年04月20日
-
怎么发布网站大连专业html5网站建设
怎么发布网站大连专业html5网站建设
- 技术栈
- 2026年04月20日
-
怎么低成本做网站建设网站需要多长时间
怎么低成本做网站建设网站需要多长时间
- 技术栈
- 2026年04月20日
-
怎么仿照别人网站大兴网站定制开发
怎么仿照别人网站大兴网站定制开发
- 技术栈
- 2026年04月20日
-
怎么仿制别人的网站湛江高端网站建设
怎么仿制别人的网站湛江高端网站建设
- 技术栈
- 2026年04月20日
-
怎么分辨网站是不是h5帝国cms如何做网站
怎么分辨网站是不是h5帝国cms如何做网站
- 技术栈
- 2026年04月20日
