《Python语言程序设计(工作手册式)【实训题目-含答案】实训8.5.docx》由会员分享,可在线阅读,更多相关《Python语言程序设计(工作手册式)【实训题目-含答案】实训8.5.docx(3页珍藏版)》请在第一文库网上搜索。
1、8.5实训I8.5.1实训1【数据挖掘与分析】一、实训目的1 .了解Python进行数据处理的过程。2 .掌握数据获取与收集方法。3 .学会数据清洗和整理的方法。4 .了解数据统计方法。5 .能够利用可视化工具进行数据的展示。二、实训任务任务1:【爬取样本网页】样本文件为8.11中网页样本moviesamp1e.htm,利用python,爬取样本网页中各个电影的票房信息并计算A平台的票房平均值。程序编写于下方importreimportosimportsysimportur11ib.requestBOR_amount=0.0p_path=sys.pathOur1=fi1e:+p_path+7m
2、oviesamp1e.htmreq=ur11ib.request.Request(ur1,headers=User-AgenfiuMagicBrowser)webpage=ur11ib.request.ur1open(req)strw=webpage.read().decode(utf-8)s=StrW.find(电影名称影thxth总场次/占比”)e=StrWs)find(以上数据仅供参考”)StrW_tab1e=StrWs:s+em=reStr=,ahref=m=re.finda11(reStr,strw_tab1e)ifnotm:os._exit(0)fortinm:ss=SS=re.f
3、indan(r(d+.?d*%?AxOO-xff*),t)ifss:BOR.amount+=f1oat(ss-3.rep1ace(7J)e1se:Print(出错了!,)Print(票房总额是:+Str(BoRamount)任务2:【利用ur11ib库获取yahoo财经数据】网址:hUps:/程序编写于下方任务3:【求电影平均评分】样本文件为8.1.1中网页样本moviesamp1e2.htm,内容为观众对电影的评分信息,分析样本文件完成以下任务:调用该函数能够获取网页中观众对某部电影的打分数据,并求出平均分。程序编写于下方任务4:【数据清洗】利用python对数据1og.csv进行清理,清理掉所有字段中为空的脏数据,保存在c1ean_data.csv文件中。并统计c1ean_data.csv文件的行数。程序编写于下方任务5:【数据分析与可视化展示】对数据1og.csv进行分析,用折线图画出用户6月份到10月份,每日购买、点击、力口入购物车,关注的变化趋势图。程序编写于下方