点击排行

您现在的位置：首页 > 技术文档 > Python网络爬虫

python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)

来源：中文源码网浏览：158 次日期：2024-04-22 00:53:43

【下载文档: python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到).txt 】

python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
baiduclient.py复制代码代码如下:import urllib.parseimport gzipimport jsonimport refrom http.client import HTTPConnectionfrom htmlutils import TieBaParserimport httputils as utils
# 请求头headers = dict()headers["Connection"] = "keep-alive"headers["Cache-Control"] = "max-age=0"headers["Accept"] = "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8"headers["User-Agent"] = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.107 Safari/537.36"headers["Content-Type"] = "application/x-www-form-urlencoded"headers["Accept-Encoding"] = "gzip,deflate,sdch"headers["Accept-Language"] = "zh-CN,zh;q=0.8"headers["Cookie"] = ""
# cookiecookies = list()
# 个人信息userInfo = {}
def login(account, password): '''登录''' global cookies headers["Host"] = "wappass.baidu.com" body = "username={0}&password={1}&submit=%E7%99%BB%E5%BD%95&quick_user=0&isphone=0&sp_login=waprate&uname_login=&loginmerge=1&vcodestr=&u=http%253A%252F%252Fwap.baidu.com%253Fuid%253D1392873796936_247&skin=default_v2&tpl=&ssid=&from=&uid=1392873796936_247&pu=&tn=&bdcm=3f7d51b436d12f2e83389b504fc2d56285356820&type=&bd_page_type=" body = body.format(account, password) conn = HTTPConnection("wappass.baidu.com", 80) conn.request("POST", "/passport/login", body, headers) resp = conn.getresponse() cookies += utils.getCookiesFromHeaders(resp.getheaders()) utils.saveCookies(headers, cookies) # 登录成功会返回302 return True if resp.code == 302 else False
def getTieBaList(): '''获取已关注的贴吧列表''' conn = HTTPConnection("tieba.baidu.com", 80) conn.request("GET", "/mo/m?tn=bdFBW&tab=favorite", "", headers) resp = conn.getresponse() tieBaParser = TieBaParser() tieBaParser.feed(resp.read().decode()) tbList = tieBaParser.getTieBaList() return tbList
def getSignInfo(tieBaName): '''获取贴吧签到信息''' queryStr = urllib.parse.urlencode({"kw":tieBaName, "ie":"utf-8", "t":0.571444}) conn = HTTPConnection("tieba.baidu.com", 80) conn.request("GET", "/sign/loadmonth?" + queryStr, "", headers) data = gzip.decompress(conn.getresponse().read()).decode("GBK") signInfo = json.loads(data) return signInfo tbsPattern = re.compile('"tbs" value=".{20,35}"')
def signIn(tieBaName): '''签到''' # 获取页面中的参数tbs conn1 = HTTPConnection("tieba.baidu.com", 80) queryStr1 = urllib.parse.urlencode({"kw": tieBaName}) conn1.request("GET", "/mo/m?" + queryStr1, "", headers) html = conn1.getresponse().read().decode() tbs = tbsPattern.search(html).group(0)[13:-1] # 签到 conn2 = HTTPConnection("tieba.baidu.com", 80) body = urllib.parse.urlencode({"kw":tieBaName, "tbs":tbs, "ie":"utf-8"}) conn2.request("POST", "/sign/add" , body , headers) resp2 = conn2.getresponse() data = json.loads((gzip.decompress(resp2.read())).decode()) return data
def getUserInfo(): '''获取个人信息''' headers.pop("Host") conn = HTTPConnection("tieba.baidu.com", 80) conn.request("GET", "/f/user/json_userinfo", "", headers) resp = conn.getresponse() data = gzip.decompress(resp.read()).decode("GBK") global userInfo userInfo = json.loads(data)
if __name__ == "__main__": account = input("请输入帐号:") password = input("请输入密码:") ok = login(account, password) if ok: getUserInfo() print(userInfo["data"]["user_name_weak"] + "~~~登录成功", end="\n------\n") for tb in getTieBaList(): print(tb + "吧:") signInfo = signIn(tb) if signInfo["no"] != 0: print("签到失败!") print(signInfo["error"]) else: print("签到成功!") print("签到天数:" + str(signInfo["data"]["uinfo"]["cout_total_sing_num"])) print("连续签到天数:" + str(signInfo["data"]["uinfo"]["cont_sign_num"])) print("------") else: print("登录失败")
htmlutils.py复制代码代码如下:'''Created on 2014-2-20
@author: Vincent'''
from html.parser import HTMLParser
class TieBaParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) self.tieBaList = list() self.flag = False def getTieBaList(self): return self.tieBaList def handle_starttag(self, tag, attrs): if tag == "a": for name , value in attrs: if name == "href" and "m?kw=" in value: self.flag = True def handle_data(self, data): if self.flag: self.tieBaList.append(data) self.flag = False
httputils.py复制代码代码如下:'''Created on 2014-2-20
@author: Vincent'''def getCookiesFromHeaders(headers): '''从http响应中获取所有cookie''' cookies = list() for header in headers: if "Set-Cookie" in header: cookie = header[1].split(";")[0] cookies.append(cookie) return cookiesdef saveCookies(headers, cookies): '''保存cookies''' for cookie in cookies: headers["Cookie"] += cookie + ";"
def getCookieValue(cookies, cookieName): '''从cookies中获取指定cookie的值''' for cookie in cookies: if cookieName in cookie: index = cookie.index("=") + 1 value = cookie[index:] return valuedef parseQueryString(queryString): '''解析查询串''' result = dict() strs = queryString.split("&") for s in strs: name = s.split("=")[0] value = s.split("=")[1] result[name] = value return result

上一篇：python实现网页链接提取的方法分享

下一篇：python抓取网页内容示例分享

点击排行

您现在的位置：首页 > 技术文档 > Python网络爬虫

python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)

相关内容