已有184人关注
大佬们,求助我这个为什么运行失败啊,帮我修正代码
发表在Python图书答疑 2021-10-20 悬赏:20 学分 《Python编程入门指南》第22章 巡店宝(企业商品运营利器)
是否精华
版块置顶:

import requests

from lxml import etree

import time

url='https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr='

header={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36'}

resp = requests.get (url,headers=header)

resp1 = resp.content.decode(encoding='utf-8',errors='ignore')

resp2=etree.HTML(resp1)

title = resp2.xpath('//*[@id="pl_top_realtimehot"]/table/tbody/tr/td/a/text()')

print (time.strftime("%F,%R")+'微博热搜\n')

for i in range(51):

    print ('  '.join([title[i]]),'\n')

    time.sleep(1)


分享到:
精彩评论 2
壹_1634900097
学分:9 LV1
2021-10-20
沙发

你要贴报错信息,不然怎么知道哪里出问题了。是获取页面就出问题了的话,你要补全一点header,大型门户网站一般都要加cookie,里面有账号登录信息,反爬虫系统会把没有登录信息的反复多次的请求直接拉黑,请求一两次你就获取不到页面了。如果解析出问题你就要检查下你的decode是不是正确,你的xpath规则是不是正确了。

tyrionsaitama
学分:24 LV2
2021-10-21
板凳

那报错可就太多了,所以需要大佬复制我的代码运行才知道

image.png

首页上一页 1 下一页尾页 2 条记录 1/1页
手机同步功能介绍
友情提示:以下图书配套资源能够实现手机同步功能
明日微信公众号
明日之星 明日之星编程特训营
客服热线(每日9:00-17:00)
400 675 1066
mingrisoft@mingrisoft.com
吉林省明日科技有限公司Copyright ©2007-2022,mingrisoft.com, All Rights Reserved长春市北湖科技开发区盛北大街3333号长春北湖科技园项目一期A10号楼四、五层
吉ICP备10002740号-2吉公网安备22010202000132经营性网站备案信息 营业执照