《大数据HCIA习题含参考答案.docx》由会员分享,可在线阅读,更多相关《大数据HCIA习题含参考答案.docx(19页珍藏版)》请在第一文库网上搜索。
1、大数据HCIA习题含参考答案一、单选题(共40题,每题1分,共40分)1、安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点OA、3B、2C、1D、4正确答案:B2、以下关于HBaSe二级索引的描述哪一项是正确的OA、二级索引把要查找的列与rowkey关联成一个索引表B、此时列成新的rowkey,原rowkey成为va1ueC、二级索引查询了2次D、以上全都正确正确答案:D3、以下关于HiVeSQ1基本操作描述正确的是OA、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定IOCatiOn信息C、创建表时可以指定列分隔符D、创
2、建外部表使用externa1关键字。创建普通表需要指定interna1关键字正确答案:C4、硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存O份?A、4B、3C、5D、2正确答案:B5、下面关于zookeeper特性的描述错误的是()A、zookeeper节点数必须为奇数个B、消息更新只能成功或者失败,没有中间状态C、一条消息要被超过半数的SerVer接受,它将可以成功写入磁盘D、客户端所发送的更新会按照他们被发送的顺序进行应用正确答案:A6、在FusionInsight产品中,关于创建Kafka的Topic,以下哪些描述是正确的?A、在创建K
3、afka的TOPiC时,必须设置Partition个数B、在创建Kafka的TOPiC时,必须设置PartitiOn副本个数C、设置多副本可以增强Kafka服务的容灾能力D、以上全都正确正确答案:C7、hbase的底层数据以O的形式存在的?A、实时存储B、列存储C、keyva1ueD、行存储正确答案:C8、Kafka集群中,Kafka服务端的角色是?A、 BrokerB、 ConsumerC、 ZooKeeperD、 Producer正确答案:A9、FusionInsightHD系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?A、 SYNCHRONIZEDB、 EXP
4、IREDC、 CONFIGURINGD、UNKNO正确答案:B10、可以通过以下哪个命令创建节点数据?A、 set/nodedataB、 1s/nodeC、 get/nodeD、 Create/node正确答案:D11、以下关于KafkaPartition偏移量的描述不正确的是?A、每条消息在文件中的位置称为。ffset(偏移量)B、OffSet是一个String型字符串C、唯一标记一条消息D、消费者通过(OffSet、partition、topic)跟踪记录正确答案:B12、YARN的基于标签调度,是对下列选项中的哪个进行标签化?A、 AppMasterB、 ResourceManagerC
5、、 NodeManagerDContainer正确答案:C13、以下关于Zookeeper的1eader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、先写磁盘再写内存C、仅写入内存D、先写内存再写磁盘正确答案:B14、在HiVe中,以下关于分区的描述不正确的是OA、每个分区是一个目录B、数据表可以按照某个字段的值划分分区C、分区数量是固定的D、分区下可再有分区或者桶正确答案:C15、某用户需要搭建一个350节点的Fusion1nsightHD集群,哪种规划方案最佳?A、管理节点、控制节点、数据节点合一部署,二层组网B、管理节点、控制节点合一部署、数据节点独立部署,二
6、层组网C、管理节点、控制节点、数据节点都独立部署,三层组网D、管理节点、数据节点合一部署,控制节点独立部署,二层组网正确答案:C16、HBase的Region是有那个服务进程来管理的?A、 HRegionServerB、 HMasterC、 DataNodeD、 ZooKeeper正确答案:A17、在fusioninsight产品中,关于kafka的topic.以下描述不正确的是?A、topic的partition数量可以创建时配置B、每个topic只能被分成一个partition区C、每条发布到kafka的消息都有一个类别,这个类别被称为topi也可以理解为一个存储消息的队列D、每个part
7、ition在存储层面对应一个1og文件,1og文件中记录了所有的消息数据正确答案:B18、关于HiVe与HadOOP其他组件的关系,以下描述错误的是?A、Hive最终将数据存储在HDFS中B、HiVeSQ1其本质是执行MaPRedUCe任务C、HiVe是HadooP平台的数据仓库工具D、HiVe对HBaSe有强依赖正确答案:D19、关于HiVe与传统数据仓库的对比,以下描述错误的是?A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低B、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C、由于HiVe的数
8、据存储在HDFS中,所以可以保证数据的高容错,高可罪D、由于HiVe基于大数据平台,所以查询效率比传统数据仓库快正确答案:D20、在规划FusionIsightHD集群时,如果客户用于功能测试,对性能没有要求,节约成本的情况下可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、6D、8正确答案:B21、以下哪类数据不属于半结构化数据?A、XM1B、HTM1C、二维表D、JSON正确答案:C22、以下哪些选项属于HiVe的数据存储模型?A、以上全都正确B、表C、桶D、数据库E、分区正确答案:A23、采用F1ume传输数据过程中,为了防止因F1ume进程重启而丢失数据,
9、推荐使用以下哪种Channe1类型?A、 MemoryChanne1B、 Fi1eChanne1C、 JDBCChanne1D、 HDFSChanne1正确答案:B24、关于Fusion1nsightManager中的Contro11er和NodeAgent,说法正确的是?A、Contro11er每陪3秒向NodeAgent发送心跳B、NOdeAgent接受ContConeir下发的命令,执行具体的动作C、每个节点都必须部署COntrOnerD、NodeAgent是开源增强的正确答案:B25、HBase的物理存储单元是什么?A、 RegionB、 Co1umnFami1yC、 Co1umnD、
10、ROW正确答案:B26、FUSiOnInSightManager对服务的管理操作,下面说法错误的是?A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态正确答案:C27、下面关于Zookeeper的特性描述错误的是?A、客户端所发送的更新会按照他们被发送的顺序进行应用B、一条消息要被超过半数的SerVer接收,他将可以成功写入磁盘C、消息更新只能成功或失败,没有中间状态D、Zookeeper节点数必须为奇数个正确答案:D28、如果需要由数据生产者决定数据发送给目标Bo1t的某一个确定的Task,应选择以下哪种消息分发策略?A、局部字段分组B
11、、全局分组C、广播分组D、直接分组正确答案:D29、Fusion1nsightHD系统中HDFS的B1ock默认保存几份?A、3份B、2份C、1份D、不确定正确答案:A30、Hadoop平台中,要查看YARN服务中一个app1ication的信息,通常需要使用什么命令?A、 containerB、 app1icationattemptC、jarD、app1ication正确答案:D31、安装FusionInsightHD的Streaming组件Nimbus角色要求安装几个节点?A、4B、3C、2D、1正确答案:C32、FusionInsightManager对服务的配置功能说法不正确的是?A、
12、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效正确答案:C33、SPark应用在运行时,Stage划分的依据是哪个?A、 actionB、 taskSetC、 shuff1eDtask正确答案:C34、关于Kafka盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、磁盘大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限D、Broker节点
13、故障导致正确答案:D35、F1ume数据采集过程中,下列选项中能对数据进行过滤和修饰的是OA、 Channe1B、 Channe1Se1ectorC、 InterceptorD、 Sink正确答案:C36、ZoOkeePer的SChenIe认证方式不包含以下哪项?()A、 wor1dB、 authC、 sas1D、 digest正确答案:C37、以下关于FusionInsightManager界面Hive日志收集的描述,哪个选项不正确?OA、可指定特定用户进行日志收集,例如仅下载USerA用户产生的日志。B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志。C、可
14、指定实例进行日志收集,比如指定收集Rietstore的日志。D、可指定节点IP进行日志收集,例如仅下载某个IP的日志。正确答案:A38、在F1ink的运行流程中,负责申请资源的角色是?A、 ResourceManagerB、 JobManagerC、 C1ientDTaskManager正确答案:B39、关于RDD,下列说法错误的是?A、RDD具有血统机制(1ineage)B、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是SPark对基础数据的抽象正确答案:B40、HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、 ZookeeperB、 HDFSC、 MasterDmeta表正确答案:A二、多选题(共30题,每题1分,共30分)1、Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有?()A、帮助用户迅速找到资源消耗最高的节点,采取适当的措施B、通过每个服务主业的资源分布查看页面,查看到关键的资源分布情况C、可以帮助用户快速聚焦在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况,例如内存占有率在50%70%的主机列表,并提