已有183人关注
爬虫程序没报错,但是excel表格没见到阿
发表在Python图书答疑 2022-08-03 《Python实效编程百例·综合卷》第2章 网络爬虫 37页-40页
是否精华
版块置顶:
import xlsxwriter
import requests


def get_json(index):
    '''
    爬取课程的json数据
    :param index: 当前索引从0开始
    :return: JSON数据
    '''
    url = 'https://study.163.com/p/search/studycourse.json'
    # payload信息
    payload = {
        'activityId': 0,
        'keyword': "python",
        'orderType': 50,
        'pageIndex': 1,
        'pageSize': 50,
        'priceType': -1,
        'qualityType': 0,
        'relativeOffset': 0,
        'searchTimeType': -1
    }
    headers = {
        'accept': 'application/json',
        'host':'study.163.com',
        'content-type': 'application/json',
        'origin': 'https://study.163.com',
        'user-agent': 'Mozilla/5.0(Windows NT 10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/103.0.0.0Safari/537.36'
    }
    try:
        response = requests.post(url,json=payload,headers=headers)
        content_json = response.json()
        if content_json and content_json['code']== 0:
            return content_json
        return None
    except Exception as e:
        print('出错了')
        print(e)
        return None

def get_content(content_json):
    '''
    获取课程信息列表
    :param content_json: 获取json的数据格式
    :return: 课程数据
    '''
    if 'result' in content_json:
        return content_json['result']['list']           # 返回课程数据列表

def save_excel(content,index):
    '''
    存储到Excel
    :param content:课程内容
    :param index: 索引值,从0开始
    :return: None
    '''
    for num,item in enumerate(content):
        row = 50 * index + (num+1)
        # 行内容
        worksheet.write(row,0,item['productId'])
        worksheet.write(row, 1, item['courseId'])
        worksheet.write(row, 2, item['productName'])
        worksheet.write(row, 3, item['productType'])
        worksheet.write(row, 4, item['provider'])
        worksheet.write(row, 5, item['score'])
        worksheet.write(row, 6, item['scoreLevel'])
        worksheet.write(row, 7, item['learnerCount'])
        worksheet.write(row, 8, item['lessonCount'])
        worksheet.write(row, 9, item['lectorName'])
        worksheet.write(row, 10, item['originalPrice'])
        worksheet.write(row, 11, item['discountPrice'])
        worksheet.write(row, 12, item['discountRate'])
        worksheet.write(row, 13, item['imgUrl'])
        worksheet.write(row, 14, item['bigImgUrl'])
        worksheet.write(row, 15, item['description'])

def main(index):
    '''
    程序运行函数
    :param index: 索引值,从0开始
    :return:
    '''
    content_json = get_json(index)
    content = get_content(content_json)
    save_excel(content,index)

if __name__ == "__main__":
    print("开始执行")
    workbook = xlsxwriter.Workbook('网易云课堂Python课程数据.xlsx')
    worksheet = workbook.add_worksheet('first_sheet')
    # 行首标题
    worksheet.write(0, 0, '商品ID')
    worksheet.write(0, 1, '课程ID')
    worksheet.write(0, 2, '商品名称')
    worksheet.write(0, 3, '商品类型')
    worksheet.write(0, 4, '机构名称')
    worksheet.write(0, 5, '评分')
    worksheet.write(0, 6, '评分等级')
    worksheet.write(0, 7, '学习人数')
    worksheet.write(0, 8, '课程节数')
    worksheet.write(0, 9, '讲师名称')
    worksheet.write(0, 10, '原价')
    worksheet.write(0, 11, '折扣价')
    worksheet.write(0, 12, '折扣率')
    worksheet.write(0, 13, '课程小图URL')
    worksheet.write(0, 14, '课程大图URL')
    worksheet.write(0, 15, '课程描述')
    totlePageCount = get_json(1)['result']['query']['totlePageCount']   # 获取总页数
    # 遍历每一页
    for index in range(totlePageCount):
        main(index)
    workbook.close()
    print('执行结束')


一切代码按书上所示完成,执行不报错,就是没看见表格在哪,请问什么情况?用的pychram编辑器

分享到:
精彩评论 1
game99258
学分:2266 LV10
2022-08-04
沙发

表格存储位置呢?

首页上一页 1 下一页尾页 1 条记录 1/1页
手机同步功能介绍
友情提示:以下图书配套资源能够实现手机同步功能
明日微信公众号
明日之星 明日之星编程特训营
客服热线(每日9:00-17:00)
400 675 1066
mingrisoft@mingrisoft.com
吉林省明日科技有限公司Copyright ©2007-2022,mingrisoft.com, All Rights Reserved长春市北湖科技开发区盛北大街3333号长春北湖科技园项目一期A10号楼四、五层
吉ICP备10002740号-2吉公网安备22010202000132经营性网站备案信息 营业执照