大数据系统运维工程师辅导资料.docx

上传人:lao****ou 文档编号:532268 上传时间:2024-01-12 格式:DOCX 页数:5 大小:25.78KB
下载 相关 举报
大数据系统运维工程师辅导资料.docx_第1页
第1页 / 共5页
大数据系统运维工程师辅导资料.docx_第2页
第2页 / 共5页
大数据系统运维工程师辅导资料.docx_第3页
第3页 / 共5页
大数据系统运维工程师辅导资料.docx_第4页
第4页 / 共5页
大数据系统运维工程师辅导资料.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《大数据系统运维工程师辅导资料.docx》由会员分享,可在线阅读,更多相关《大数据系统运维工程师辅导资料.docx(5页珍藏版)》请在第一文库网上搜索。

1、2、下列系统默认端口号错误的是(C)。A、SSH端口22B、mysq1端口3306C、Te1net端口20D、Https端口4433、下列四项中,不属于数据库系统特点的是(B)。A、数据共享B、数据完整性C、数据冗余度高I)、数据独立性高5、一般的防火墙不能实现以下哪项功能(B)oA、隔离公司网络和不可信的网络B、防止病毒和木马程序C、隔离内网D、提供对单点的监控7、某文件的组外成员的权限是只读、所有者有全部权限、组内权限是可读可写、该文件权限为(D)A、467B、674C、476D、76411、以下哪种锁定方式能提供最佳的并行访问性能(D)?A、列锁定B、表锁定C、块锁定D、行锁定12、以下

2、选项中,不属于信息时代的定律的是(D)A、吉尔德定律B、摩尔定律C、麦特卡尔夫定律D、达律多定律14、医疗健康数据的基本情况不包括以下哪项(C)?A、诊疗数据B、个人健康管理数据C、公共安全数据D、健康档案数据15、数据仓库的最终目的是(D)oA、收集业务需求B、建立数据仓库逻辑模型C、开发数据仓库的应用分析D、为用户和业务部门提供决策支持16、阿里巴巴旗下的数据管理平台,被称为(B)As支付宝B、达摩盘C、招财宝D、蚂蚁花呗17、支撑大数据业务的基础是(B)A、数据科学B、数据应用C、数据硬件D、数据人才20、大数据的本质是(D)。A、挖掘B、联系C、搜集D、洞察22、当前大数据技术的基础是

3、由(C)首先提出的。A、微软B、百度C、谷歌D、阿里巴巴23、大数据的起源是(C)。A、金融B、电信C、互联网D、公共管理24、万维网之父是(C)。A、彼得.德鲁克B、舍恩伯格C、蒂姆.伯纳斯-李D、斯科特.布朗25、下列论据中,能够支撑“大数据无所不能”的观点的是(A)?A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧26、Web2.0强调(C)OA、机构B、单位C、个人D、网站27、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。A、统计报表B、网络爬虫C、API接口D、传感器28、智慧城市的构建,不包含(C)。A、数

4、字城市B、物联网C、联网监控D、云计算29、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。A、数据管理人员B、数据分析员C、研究科学家D、软件开发工程师30、从大量数据中提取知识的过程通常称为(A).A、数据挖掘B、数据筛选C、数据清洗D、数据仓库31、(D)反映数据的精细化程度,越细化的数据,价值越高。A、规模B、活性C、关联度D、颗粒度32、当前社会中,最为突出的大数据环境是(A)。A、互联网B、物联网C、综合国力D、自然资源33、对线下零售而言,做好大数据分析应用的前提是(C)oA、增加统计种类B、扩大营业面积C、增加数据来源D、开展优

5、惠促销34、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高35、在大型网络设计中,考虑到网络的健壮性,对于汇聚层设备一般采用(B)连接方式连接到核心层网络设备。A、全网状B、双上行C、星形D、直连36、下列概念中,(C)不是数据库管理系统必须提供的数据控制功能。A、安全性B、完整性C、移植性D、一致性37、大数据系统具有的特点不包括(CAs弹性容量B、高性能C、稳定性好D、自动化38、一切皆可试,大数据分析的效果好坏,可能通过模拟仿真或者实际运行来验证,这体现大数据思维中的(D)oAs定量思维B、相关思维C、因果思维D、

6、实验思维39、(A)是为了保证所有人员(包括项目成员、配置管理员和CcB)都遵守配置管理规范,质量保证人员要定期审计配置管理工作。A、配置审计B、配置管理数据库C、变更控制D、版本控制40、在关系模型中,实现“关系中不允许出现相同的元组”的约束是通过(B)。A、候选键B、主键C、外键D、超键第二题多项选择题3、大数据的定义是(AB)。A、指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B、任何超过了一台计算机处理能力的数据量C、技术D、商业4、(ABC)是大数据应用的步骤。A、数据输入B、建模分析C、使用决策支持工具输出结果D、验证假5、避免“数据孤岛”的方法包括(ABD

7、)。As关键匹配变量B、数据融合C、数据输入D、利用样本框6、大数据的预测价值体现在(ABC)。A、预测用户的偏好、流失B、预测热卖品及交易额C、预测经营趋势D、评价7、机器学习的四大类分析技术的主要算法包括(ABCD)A、描述性统计B、聚类分析C、关联分析D、分类与预测8、以下哪些选项属于决策树分析的步骤(ABC)?A、确定分析维度B、跑决策树分析C、修剪决策树D、收集数据9、以下哪些指标是衡量大数据应用成功的标准(ABCD)?A、成本更低B、质量更高C、速度更快D、风险更低10、大数据有哪些价值(ABCD)?A、用户身份识别B、描述价值C、实时价值D、预测价值11大数据处理流程可以概括为以

8、下哪几步(ABCD)?A、挖掘B、采集C、统计和分析D、导入和预处理12、医疗领域如何利用大数据(ABCD)A、临床决策支持B、个性化医疗C、社保资金安全D、用户行为分析13、传统研究中数据采集的方法包括(BCD)。A、网络监测B、电话访谈C、对面访谈D、线上互动14、以下属于机播学习的是(ABCD)。A、监督式学习B、非监督式学习C、半监督式学习D、强化学习16、局数据的修改应掌握三性,他们是(ABC)。A、数据修改的可信性B、数据修改的及时性C、数据修改的准确性D、数据修改的标准性17、信息技术(IT)主要包括(ABCD)A、通信技术B、计算机技术C、传感技术D、微电子技术18专业技术人员

9、的特点(AB)。A、工作时间长、强度高B、工作压力大C、水平总体不高于当年城镇在岗职工D、健康状况不甚理想19、以下选项中属于数据的作用的是(ABC)?A、沟通B、验证假设C、建立信心I)、欣赏20、数据只有在与(ACD)的交互中才能发挥作用。A、人B、物C、消费者D、企业第三题填空题(请将正确答案填写在题内横线处。)1、创建目录用Inkdir命令,创建文件用touch命令。2、大数据系统具有的4个特点分别是:弹性容量、高性能、集成化、自动化3、链接分为:一项鞋接和软量接缀号线装。4、故隙处理中常见的可用性能指标包括平均维修时间和平均无故障时间5、1inux下命令可使用的通配符有“?”和o7、

10、在关系A(S,SN,D)和关系B(D,CN,NM)中,A的主关键字是S,B的主关键字是D,则称,.D.是关系A的外键。8、数据安全威胁中外部攻击分为:意程序、网络入侵、拒绝服务攻击、社会工程、信息泄密9、锁可以分为两种类型:共享锁和排它锁。10、Tomcat的缺省端口是8080.在server.Xm1文件中进行修改。11、日常的巡检工作可以分为巡检、点检、厂商巡检等方式12在tomcat上发布javaweb应用时,默认的是WebaPPS.13、故障排除通常有两种做法变通解决和根本解决。14Web1ogic中boot.properties文件写入的是管理域的用户名和密码信息15、CMDB的全称是

11、COnfigUrationManageInentDatabase即配置管理数据库17、使用history命令查看用过的命令列表。18、Hadoop是一个分布式系统基础架构,由HadOOPAPaChe基金会开发。19、DMP分为开放式DMP和私有式DMK20、大数据的特征具有5个V的特点,分别是数据量大、数据流速度快、数据类型多、数据真实性的存疑、数据价值第四题判断题(请将判断结果填入括号内,正确的填“J,错误的填“X”。)(J)2、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(J)3、数据

12、可视化就是利用计算机图形学和图像处理技术,将数据以图表、地图、标签云、动画或者任何使内容更容易理解的图形方式呈给用户,并进行交互处理的理论、方法和技术。(J)4、对大数据系统而言,资产主要包括硬件资产、软件资产、云资产三种。(X)5、HadOoP指的是流式数据的实时处理。(X)6、传输数据过程可分为存储数据和备份数据。(X)7、系统测试属于大数据系统建设的最后一步。(J)8、保密性是指对数据的访问限制,只有被授权的人才能使用。(J)9、大数据允许异常数据存在,更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会对总体结果产生影响。(X)10、完整性指保证数据在授权的方式下的改变。

13、1、建设大数据系统的最后一步是什么?共包括哪些方面。测试验收是建设大数据系统的最后一步。交付测试放在开发阶段的单元测试、集成测试和系统测试之后,主要是为了确保系统稳定可靠,以保证正式交付运营。做好大数据系统的测试验收需要根据事先制定的测试计划和内容,进行全方位的测试。测试验收共分为以下五方面:(1)功能测试:作为一个应用系统,实现既定功能是最基本的要求。功能测试基于实际的业务场景,设计一些大数据系统的测试用例,测试系统是否运转正常。功能测试需要考虑到并全部覆盖系统所用的APT和功能。(2)性能测试:大数据系统的性能由任务完成、数据吞吐量、内存占用率等构成。这些指标从不同维度反映了大数据系统的处

14、理能力资源利用效率等性能。性能测试通常采用自动化的方式进行,通过性能监控工具来检测系统运行状态和性能指标。除了常规测试,性能测试还应该在不同负载情况下测试系统性能,保证系统的正常负载。(3)可用性测试:高可用性是大数据系统的主要特征之一。因为基于大数据系统的数据应用业务要求系统长时间无故障的连贯运行,对连续性的要求非常高,需手动测试(4)容错性测试:容错性是大数据系统另一个重要的特性。容错性方式具体指测试系统在异常条件下,以不影响整体性能为前提(同时保证系统继续运行),能否从部分失效中自动恢复。容错性测试的方案视实际场景而定,且需要手动测试。(5)稳定性测试:在大数据系统长期运行的过程中,稳定

15、性非常重要。稳定性测试的目的是保证系统长时间正常运行。2、安全开发需要哪几项主要措施?(1)设计完整的认证和授权。在设计和开发应用程序时,常会使用认证和授权技术来对用户或者用户的权限作出甄别。(2)数据过滤。数据过滤策略包括输入过滤和输出过滤。输入过滤不当会引起恶意代码在服务端执行,输出过滤不当会造成恶意代码在客户端执行。(3)敏感信息加密。加密是将信息的编码进行杂凑,是不知道密码的人无法获知数据的意义。对于Web应用来说,信息的传输和存储都需要加密(4)保留审计纪录。对用户访问应用中的关键操作,应该予以记录,便于日后进行审计。3、大数据系统具有的架构模式。(1)数据收集/存储层:主要包括2个部分,一是收集实时数据或已有的存储数据(包括非结构化的数据和结构化的数据),二是对这些数据进行存储,通常都是采用分布式文件系统,可供海量数据高吞吐访问(查询、检索等),同时具有良好的容错性。(2)资源管理层:为上层应用提供统一的资源管理和资源调度,以便提高资源利用效率。具体来说,包括

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服