社区

京东店铺
淘宝店铺
当当店铺
拼多多店铺

APP下载

扫描下载官方APP

VIP会员

Python图书答疑

+关注

已有184人关注

+发表新帖

所属版块： Python答疑区

wbzm66

学分:171

+关注

私信

立即签到

版块推荐

获取电影名称，电影评分，详情页URL地址及电影图片----程序在anaconda中报错

发表在Python图书答疑 2021-04-27

悬赏：1 学分《Python网络爬虫从入门到实践》第6章高级网络请求模块 107页-110页

是否精华是否

版块置顶: 是否

from requests_html import HTMLSession,UserAgent    # 导入HTMLSession类

session = HTMLSession()          # 创建HTML会话对象
ua = UserAgent().random          # 创建随机请求头
# 发送网路请求
r = session.get('https://movie.douban.com/tag/#/?sort=U&range=0,10'
                '&tags=%E7%94%B5%E5%BD%B1,2020',headers = {'user-agent': ua})
r.encoding='gb2312'              # 编码
if r.status_code == 200:         # 判断请求是否成功
    r.html.render()              # 调用render()方法，没有Chromium浏览器就自动下载
    class_wp = r.html.xpath('.//div[@class="list-wp"]/a')  # 获取当前页面中所有电影信息的a标签
    for a in class_wp:
        title = a.find('p span')[0].text  # 获取电影名称
        rate = a.find('p span')[1].text  # 获取电影评分
        details_url = a.attrs.get('href')  # 获取详情页url地址
        img_url = a.find('img')[0].attrs.get('src')  # 获取图片url地址
        print('电影名称为：', title)  # 打印电影名称
        print('电影评分为：', rate)  # 打印电影评分
        print('详情页地址为：', details_url)  # 打印电影详情页url地址
        print('图片地址为：', img_url)  # 打印电影图片地址

《Python网络爬虫从入门到实践》108页-109页，书上自带程序在Pycharm无输出，在anaconda中报警

于2021-04-28 19:25:15编辑

分享到：

关注

支持(0)

反对(0)

精彩评论 2

later。_1624331459

学分：1 LV1

+关注

私信

2021-06-26

沙发

我也是

支持(0)

反对(0)

mrkj_1585153245

学分：63 LV3

+关注

私信

2021-08-22

板凳

later。_1624331459 发表于2021-06-26 15:54

我也是

我也碰到这个问题了  
UserAgent().random   这个命令导致的
这个命令 会访问一个国外的网站 
https://fake-useragent.herokuapp.com/browsers/0.1.11
你国内访问不了 具体怎么弄的你们都懂
或者 你把访问后数据保存到本地文件里面  设置下路径就好了
ua = UserAgent(path=os.getcwd()+'/fake_useragent.json').random

支持(0)

反对(0)

首页上一页 1 下一页尾页 2 条记录 1/1页