已有184人关注
获取电影名称,电影评分,详情页URL地址及电影图片----程序在anaconda中报错
发表在Python图书答疑 2021-04-27 悬赏:1 学分 《Python网络爬虫从入门到实践》第6章 高级网络请求模块 107页-110页
是否精华
版块置顶:
from requests_html import HTMLSession,UserAgent    # 导入HTMLSession类

session = HTMLSession()          # 创建HTML会话对象
ua = UserAgent().random          # 创建随机请求头
# 发送网路请求
r = session.get('https://movie.douban.com/tag/#/?sort=U&range=0,10'
                '&tags=%E7%94%B5%E5%BD%B1,2020',headers = {'user-agent': ua})
r.encoding='gb2312'              # 编码
if r.status_code == 200:         # 判断请求是否成功
    r.html.render()              # 调用render()方法,没有Chromium浏览器就自动下载
    class_wp = r.html.xpath('.//div[@class="list-wp"]/a')  # 获取当前页面中所有电影信息的a标签
    for a in class_wp:
        title = a.find('p span')[0].text  # 获取电影名称
        rate = a.find('p span')[1].text  # 获取电影评分
        details_url = a.attrs.get('href')  # 获取详情页url地址
        img_url = a.find('img')[0].attrs.get('src')  # 获取图片url地址
        print('电影名称为:', title)  # 打印电影名称
        print('电影评分为:', rate)  # 打印电影评分
        print('详情页地址为:', details_url)  # 打印电影详情页url地址
        print('图片地址为:', img_url)  # 打印电影图片地址

《Python网络爬虫从入门到实践》108页-109页,书上自带程序在Pycharm无输出,在anaconda中报警

2021-04-28 19:25:15编辑
分享到:
精彩评论 2
later。_1624331459
学分:1 LV1
2021-06-26
沙发

我也是

mrkj_1585153245
学分:63 LV3
2021-08-22
板凳

later。_1624331459 发表于2021-06-26 15:54

我也是

我也碰到这个问题了  
UserAgent().random   这个命令导致的
这个命令 会访问一个国外的网站 
https://fake-useragent.herokuapp.com/browsers/0.1.11
你国内访问不了 具体怎么弄的你们都懂
或者 你把访问后数据保存到本地文件里面  设置下路径就好了
ua = UserAgent(path=os.getcwd()+'/fake_useragent.json').random
首页上一页 1 下一页尾页 2 条记录 1/1页
手机同步功能介绍
友情提示:以下图书配套资源能够实现手机同步功能
明日微信公众号
明日之星 明日之星编程特训营
客服热线(每日9:00-17:00)
400 675 1066
mingrisoft@mingrisoft.com
吉林省明日科技有限公司Copyright ©2007-2022,mingrisoft.com, All Rights Reserved长春市北湖科技开发区盛北大街3333号长春北湖科技园项目一期A10号楼四、五层
吉ICP备10002740号-2吉公网安备22010202000132经营性网站备案信息 营业执照