觉得微博手动点赞太过麻烦?
其实自动点赞的实现并不困难!
本篇会有Cookie、session和token方面的知识,不太了解的可以先看下
web前端cookie session及token会话机制详解
我们先通过前两个小节大概了解一下我们Python登录微博的原理,然后第三小节就会跟大家介绍微博自动点赞的代码。
一、实现登陆微博功能
首先进入微博页面后按F12打开开发者工具,将如图的按钮点击后,在浏览器中手动登陆一次,在Network 标签的XHR类型中找到Login请求标签,在Form data下我们可以看到username(用户名)和password(密码),并知道了请求方式是POST,请求的参数有很多我们直接照搬就是。
网页截图
这时,可能学过一些爬虫的同学便会直接上手写出如上雷同的代码,但发现出不来结果
会报错的代码
import requests headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36' } login_data = { 'username': '你的用户名', 'password': '你的密码', 'savestate': '1', 'r': 'https://m.weibo.cn/?jumpfrom=weibocom', 'ec': '0', 'pagerefer': 'https://m.weibo.cn/login?backURL=https%253A%252F%252Fm.weibo.cn%252F%253Fjumpfrom%253Dweibocom', 'entry': 'mweibo', 'wentry': '', 'loginfrom': '', 'client_id': '', 'code': '', 'qq': '', 'mainpageflag': '1', '<em>本文来源gao.dai.ma.com搞@代*码(网$</em>hff': '', 'hfp': '', } login_req = requests.post('https://passport.weibo.cn/sso/login', data=login_data, headers=headers) print(login_req.status_code)
这是因为有些网站并不只是按照’user-agent’判断用户的正常访问的。那我们还需点开Request Headers(请求头)检查可能还有什么字段会用来判断用户正常访问
一般 referer(请求来源页面)、origin(谁发起的请求)、host(主机名及端口号) 字段也常被用于反爬虫,当我们的爬虫无法正常获取数据时,我们可以将请求头里的这些字段照搬进去试试。经过验证,微博网页是以referer 来判断是否是用户正常访问。最后我们还可以把Cookie放进代码里,这样就不用在代码里输入账号密码了。
要注意Cookie并不是永久有效的,若发现自动登录失败,可以重新上网页把新的Cookie复制下来更换
完整的代码如下
import requests headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36', 'referer': 'https://passport.weibo.cn/signin/login? entry=mweibo&res=wel&wm=3349&r=https%3A%2F%2Fm.weibo.cn%2F%3Fjumpfrom%3Dweibocom', 'cookie': '你的cookie' } login_data = { 'savestate': '1', 'r': 'https://m.weibo.cn/?jumpfrom=weibocom', 'ec': '0', 'pagerefer': 'https://m.weibo.cn/login?backURL=https%253A%252F%252Fm.weibo.cn%252F%253Fjumpfrom%253Dweibocom', 'entry': 'mweibo', 'wentry': '', 'loginfrom': '', 'client_id': '', 'code': '', 'qq': '', 'mainpageflag': '1', 'hff': '', 'hfp': '', } login_req = requests.post('https://passport.weibo.cn/sso/login', data=login_data, headers=headers) print(login_req.status_code) #输出200则代表登录成功