数据采集1+x初级题库(含答案).docx

上传人:lao****ou 文档编号:682687 上传时间:2024-04-06 格式:DOCX 页数:17 大小:33.91KB
下载 相关 举报
数据采集1+x初级题库(含答案).docx_第1页
第1页 / 共17页
数据采集1+x初级题库(含答案).docx_第2页
第2页 / 共17页
数据采集1+x初级题库(含答案).docx_第3页
第3页 / 共17页
数据采集1+x初级题库(含答案).docx_第4页
第4页 / 共17页
数据采集1+x初级题库(含答案).docx_第5页
第5页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《数据采集1+x初级题库(含答案).docx》由会员分享,可在线阅读,更多相关《数据采集1+x初级题库(含答案).docx(17页珍藏版)》请在第一文库网上搜索。

1、数据采集1+初级题库(含答案)一、单选题(共40题,每题1分,共40分)1、以下选项中,不是PythOn语言特点的是A、黏性扩展:PythOn语言能够集成C、C.+等语言编写的代码B、变量声明:PythOn语言具有使用变量需要先定义后使用的特点C、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行D、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系正确答案:B2、SCraPy中,用于自定义所有SCraPy组件的行为的是()。A、 SpiderB、 ItemC、 pip1ineD、 settings正确答案:D3、以下属于应用层协议的是OA、FTPB、IPC、TCP

2、D、UDP正确答案:A4、下列不是手机操作系统的是?()A、 WindowsVistaBsWindow?Mobi1eCAndroidD、IOS正确答案:A5、使用scrapy框架编写爬虫,setting,py文件中有些配置项需要修改,比如ROBOTSTXT_OBEY的值一般情况下设置为A、1B、 Fa1seCTrueD、0正确答案:B6、关于Python,算法是指()A、程序设计语言的语句序列B、对问题的精确描述C、数学的计算公式D、解决问题的精确步骤正确答案:D7、服务器端响应状态码中,表示“0K,文档正确返回”的是A、304B、200C、302D、404正确答案:B8、APaChe服务器运

3、行后会生成两个日志文件,访问日志是哪个文件OAerrors_1ogB、 access_1ogC、 error_1ogDaccess_1ogs正确答案:B9、CSS中通过哪个属性设定元素的背景图像OAimageB、background-attachmentC、background-positionDbackground-image正确答案:D10、Python文件的后缀名是()。AgoB、doC、pyDphp正确答案:C11、下列不属于操作系统类型的是()。A、实时系统B、分时系统C、批处理系统D、模拟系统正确答案:D12、python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对象才可

4、以使用etree模块的xpath方法()ResponseB、E1ementC、DOMD、HTM1正确答案:B13、以下选项中不是Python对文件的写操作方法的是()Awrite和seekB、 writetextC、 write1inesDswrite正确答案:B14、当前INTERNET上应用最广泛的服务是A、E-Mai1B、WWWC、40个以上D、 3040个正确答案:B15、正则表达式“a-z”表示的含义是()A、取所有小写英文字母以及中的任意一个。B、取所有小写英文字母以及中的任意多个。C、取“a、-、z、中的任意一个。D、取“a、-、z、中的任意多个。正确答案:A16、关于异步请求的

5、说法错误的是A、通常用于获取页面局部的数据,但需要对页面整体进行刷新B、通过XM1HttpRequest对象可以实现与服务器的异步交互C、通常使用JSON格式进行数据的交互,但也有可能是其它格式D、能够提升用户的体验正确答案:A17、以下选项中符合Python语言变量命名规则的是A、AI!B、*iC3_1DTemp1ist正确答案:D18、服务器端响应状态码中,表示“NOTFOUND未找到”的是A、304B、302C、404D、200正确答案:C19、Python语言中用来定义函数的关键字是A、 defineB、defCfunctionDreturn正确答案:B20、网络层以上的中继系统是OA

6、、路由器B、转发器C、网桥D、网关正确答案:D21、使用Xpath获取一篇HTM1文档中所有超链接的href属性,Xpath代码为OoA/hrefB、 ahrefC、 ahrefD/a/href正确答案:D22、以下聚合函数求平均数的是()A、COUNTB、AVGC、MAXD、SUM正确答案:B23、PythOn源程序执行的方式()A、编译执行B、解析执行C、直接执行D、边编译边执行正确答案:B24、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、索引C、日志D、数据字典正确答案:D25、查找表结构用以下哪一项A、 SE1ETEB、 A1TERC、 FINDD、 D

7、ESC正确答案:D26、关于数据类型,说法不正确的是OA、结构化数据是指具有固定格式的数据B、非结构化数据的结构不规则或不完整,没有预定义的数据模型C、半结构化数据介于结构化数据和非结构化数据之间D、以上说法都不正确正确答案:D27、()是进行数据清洗的工具。A、 fi1ebeatBsapacheCtomcatDIogstash正确答案:D28、A即协议主要作用是OA、域名地址到IP地址的解析B、IP地址到域名地址的解析C、物理地址到IP地址的解析D、IP地址到物理地址的解析正确答案:D29、在Internet上浏览时,浏览器和WWW服务器之间传输网页使用的协议是:A、WWWB、 HTTPC、

8、 te1netD、ARP正确答案:B30、在操作系统中,多个进程请求相同资源而引起的无休止的相互等待的过程叫做()A、挂起B、阻塞C、死锁D中断正确答案:C31、分析以下SQ1命令:SE1ECTpriceFROMinventoryWHEREpriceBETWEEN1AND50AND(priceIN(55.30.95);命令执行后的最可能的输出结果是A、30B、55C、95D、51正确答案:A32、”内容为一个UR1,标识用户从该UR1代表的页面出发访问当前请求的页面”以上描述所指的消息头是()。AConnectionB、 User-AgentC、 AcceptDsReferer正确答案:D33

9、、1ogStaSh的数据输出中,标准输出是下列哪个选项A、e1asticsearchB、csvC、 fi1eD、 stdout正确答案:D34、层次型、网状型和关系型数据库划分原则是OA、联系的复杂程度B、文件的大小C、数据之间的联系D、记录长度正确答案:C35、关于Python语言的注释,以下选项中描述错误的是A、Python语言的多行注释以(三个单引号)开头和结尾B、Python语言有两种注释方式:单行注释和多行注释C、Python语言的单行注释以单引号开头D、Python语言的单行注释以#开头正确答案:C36、Tomcat容器数据采集中检查JDK的版本命令为()Acheckversion

10、B、javacCjavaversionD、java-version正确答案:D37、FTP主要功能是()A、满足应用B、远程访问C、文件传输D、电子商务正确答案:C38、下列哪些属于()规范数据信息收集的方式与要求A、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息B、自然人的个人信息受法律保护C、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度D、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正正确答案:B39、搜索引擎优化和网络营销的缩写分别是()A、SEO和UEOB、UEo和SEMC、SEo和SEMD、SEM和SEO

11、正确答案:C40、PythOn中,以下何者是不合法的布尔表达式?()A、3=aB、 e5and4=fC、(-6)5D、Xinrange(6)正确答案:A二、多选题(共20题,每题1分,共20分)1、下列属于1inUX发行版操作系统的是()A、UbuntuBsCentosC、 RedHatD、 So1aris正确答案:ABC2、以下属于jQuery选择器的是()A、过滤选择器Bs.c1ass选择器C、元素选择器D、id选择器正确答案:ABCD3、以下CSS中,属于font属性的是()。Afont-sty1eBsfont-weightCsizeD、font-size正确答案:ABD4、对于日志类型

12、的数据采集,常用的采集工具有A、 IogstashB、 scrapyCbeautifu1SoupD、fi1ebeat正确答案:AD5、以下哪些是Python的保留字和关键字()。A、DefB、c1assCimportD、G1oba1正确答案:BC6、Beautifu1SoUP支持Python标准库中的HTM1解析器以及一些第三方的解析器,常见的解析器有()。Ahtm151ibB、1xm1HTM1解析器C、Ixm1XM1解析器DPythOn标准库正确答案:ABCD7、数据采集的类型包括OA、结构化数据B、半结构化数据C、非结构化数据D、以上都不属于数据采集的类型正确答案:ABC8、下列哪些概念不

13、是为了提高数据库的访问速度而存在()A、外键B、视图C、关系D、索引正确答案:ABC9、网络爬虫按照系统结构和实现技术,可以有以下类型()。A、通用网络爬虫B、增量式网络爬虫C、深层页面爬虫D、聚焦网络爬虫正确答案:ABCD10、在CSS3里可以使用以下()方法,将样式表的功能加到网页里。A、嵌入外部样式表B、链接外部样式表C定义标记的sty1e属性D、定义内部样式正确答案:ABCD11、以下属于CSS选择器的是OA、类选择器B、ID选择器C、标签选择器D、伪类选择器正确答案:ABCD12、以下对网站排名有较大影响的因素是()A、服务器稳定性B、Tit1e标签C、网站内容D、Keywords标

14、签正确答案:ABC13、正则表达式中表示数量的元字符包括A、*B、,C、+D、?正确答案:ACD14、Urnib的Ur1oPen方法的参数,至少是()或()中的一个。A、ur1B、ReqUeSt对象CheadersD、data正确答案:AB15、关于Se1eCt语句下列说法正确的是Ose1ect(name)fromtab1eperson:所有记录的name字段的值B、 se1ect(name)fromtab1epersonwhereage=12;查找age=12的记录的那个字段的值C、se1ect(name,age)frompersonwhereage=12andname=aa;and并且Dse1ect(name)frompersonwhereage=12orname=aa;or或者正确答案:CD16、以下选项中是操作系统的是()A、

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服