Python网络爬虫技术与实践 教学大纲.docx

上传人:lao****ou 文档编号:1120628 上传时间:2024-11-22 格式:DOCX 页数:3 大小:17.85KB
下载 相关 举报
Python网络爬虫技术与实践 教学大纲.docx_第1页
第1页 / 共3页
Python网络爬虫技术与实践 教学大纲.docx_第2页
第2页 / 共3页
Python网络爬虫技术与实践 教学大纲.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《Python网络爬虫技术与实践 教学大纲.docx》由会员分享,可在线阅读,更多相关《Python网络爬虫技术与实践 教学大纲.docx(3页珍藏版)》请在第一文库网上搜索。

1、PythOi1网络爬虫课程教学大纲课程代码:课程名称:Python网络爬虫/WebCraw1erProgrammingwithPython开课学期:学分/学时:3/32+16课程类型:必修/选修适用专业/开课对象:先修课程:开课单位:团队负责人:责任教授:执笔人:核准院长:一、课程的性质、目的与任务Python网络爬虫是计算机科学、软件工程等专业中的一项面向实践的课程,与高级程序设计语言、计算机网络等课程相关。本课程的目标在于使学生循序渐进地了解并掌握网络爬虫编写,在学习Python编程的基本方法与常见技巧的同时,对网络与Web相关知识也取得较好的理解。本课程的安排为:介绍Python编程基础

2、知识,之后引入数据采集与预处理等网络抓取基本概念,然后详细介绍使用Python处理各类问题的方法,包括网页解析、文件存储、数据库存储、文本分析等方面。之后进入主体部分即各类爬虫程序的编写,包括静态网页抓取、动态网页抓取、处理AJAX页面等。最后以几个较为综合的实践课题来让学生应用所学内容,完成有一定应用价值的爬虫程序。本课程不仅要求学生掌握知识与理论,还要求学生动手实践,鼓励学生自主探索,培养对于技术以及应用场景的理解。二、教学内容及教学基本要求1Python语言及编程基础(4学时)了解Python语言的基本知识,学会Python的安装与开发环境配置,包括WindOWS与UbUntU等不同系统

3、平台上的安装与配置;了解PyCharm与JUPyterNOteboOk等重要开发工具的使用;掌握Python的基本语法,理解Python中的数据类型、逻辑语句、函数与类(面向对象编程);学会进阶学习Python的方法;2 .数据采集与预处理(4学时)了解数据,包括数据和大数据的基础概念、类型、组织形式等:以及数据分析的基本环节。掌握数据源与采集方法;掌握预处理任务包括数据清洗、数据集成、数据转换和数据脱敏四部分。3 .静态网页采集(4学时)了解包括正则表达式、Beautifu1Soup.XPath等在内的网页解析工具;掌握遍历网站页面与使用网站所提供的AP1来获取数据的方法。4 .文件与数据存

4、储(4学时)掌握使用PythOn进行文件读写的方法;掌握PythOn中字符串的处理;了解Python中对图片的各类操作;掌握CSV文件的读写;掌握MySQ1、SQ1ite3等不同数据库的使用。5 .JavaScript与动态网页(4学时)了解JaVaSCriPt语言的基本知识;掌握AJAX技术的基本概念;掌握抓取AJAX数据的各类方法;了解SeIeniUm等浏览器自动化工具的使用。6 .模拟登录与验证码(2学时)讲解处理表单的方法;讲述使用COokie等方法进行模拟登录。7 .爬虫数据的分析与处理(2学时)讲述使用Python进行文本分析、数据处理等各类高级问题的方法。8 .爬虫的灵活性和多样

5、性(4学时)讲述常见的爬虫框架使用:讲解各类多样化爬虫程序。9 .SE1ENIUM模拟浏览器与网站测试(2学时)了解常见测试方式以及PythOn的单元测试,熟悉Se1eniUm框架,掌握利用Se1eniUm进行测试的方法。10 .爬虫框架SCRAPY与反爬虫(2学时)讲述常见的网站反爬虫策略;了解应对反爬虫的方法;编写高性能的爬虫程序。三、教学方法本课程以教师讲授为主,同时注重学生讨论和实验。实验以个人作业、团队作业等形式体现。具体要点包括:1 .因本课程实践性较强,因此应注意教师授课与学生实验并重。本课程拟采取PPT的教学方式,并加入课程知识相关的信息,由于网络爬虫技术本身发展速度很快,且贴

6、近日常网络生活,因此在材料选择上尤其注意时效性。2 .对于课程中涉及的程序案例,鼓励学生进行讨论,并提出自己的创意。3 .为体现面向实践的课程特点,本课程在每部分结束后安排实验作业,帮助学生将所学知识动手应用。四、课内外教学环节及基本要求本课程共32+16个学时,理论32个学时,讲授16周(每周2学时);实验16个学时。课外学习要求:1 .做好预习,学生预习时以教材与推荐阅读材料为主。2 .要求学生课外积极探索课程相关知识,向学生推荐的阅读参考资料以本大纲所列出参考资料为主。3 .强调实验内容的重要性,并对学生每次完成的实验作业进行反馈(包括打分、意见、学生互评等)。五、考核内容及方式本课程成

7、绩由平时成绩、实验成绩和期末考核成绩组合而成,课程成绩以百分制计算,分配比例如下:1 .平时成绩占20%,主要考察理论课与实验课出勤率,其中理论作业占10%,理论课出勤率占比5%,实验课出勤率占比5%。2 .实验成绩占50%,主要考察实践项目的完成度。最终实验成绩取所有实验成绩的平均数。3 .期末成绩占30%,采用考试的考核方式。考试采用闭卷形式,题型为选择题、正确/错误题、填空题、简答题和应用题。六、持续改进本课程根据学生作业、课堂讨论、平时考核情况和学生、教学督导等反馈,及时对教学中不足之处进行改进,并在下一轮课程教学中有所提高。七、建议教材及参考资料建议教材:1吕云翔等.Python网络爬虫技术与实践M.北京:机械工业出版社,2023

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服