《软件学院大数据实验室建设方案.docx》由会员分享,可在线阅读,更多相关《软件学院大数据实验室建设方案.docx(17页珍藏版)》请在第一文库网上搜索。
1、XX工学院大数据实验室建设方案1建设目标32配置方案31.1 已有资源31.2 扩容资源需求41.3 物理服务器扩容配置41.4 磁盘阵列扩容配置51.5 FCSAN网络扩容配置61.6 IP网络扩容配置61.7 扩容配置清单73 部署方案83.1 系统架构83.2 IP网络部署93.3 HadOoP集群部署93.4 部署计划104 HadOOP教学培训方案114.1 HadOOP教学优势114.2 课程以及考核安排114.2.1 相关教材114.2.2 课程大纲134.2.3 考核安排164.2.4 证书认证161建设目标XX工学院软件学院已经建设了云实验平台,在该平台上实现了编程教学实验、
2、数据库实验以及网盘应用系统;该平台技术上采用服务器虚拟化技术通过云管理平台实现了实验环境的快速部署;虚拟化平台基于磁盘阵列集中存储,采用FCSAN网络架构。现规划建设一个HadOoP大数据实验室,使用已经建设好的平台,通过扩展资源池的方式部署,利用现有服务器虚拟化平台虚拟出大量虚拟机用于构建Hadoop集群,主要用于学生实验以及科研用途。假定建设目标和规模如下:建设目标:建设成校级实验室,满足学生做大数据实验和教师大数据科研。建设规模:系统支持100个左右的虚机同时运行,性能满足学生大数据实验需求。扩展性需求:系统需具备良好扩展能力,可以方便扩展系统容量和性能,以满足更多实验和科研需求。2配置
3、方案本章节对构建大数据实验室所需要的硬件资源进行配置,从大数据实验资源需求出发来分析构建大数据实验室需要对现有物理服务器、磁盘阵列、FC交换机、IP网络交换机的资源做哪些扩容。2.1 已有资源云实验平台已经部署了10多台2路物理服务器,通过1台FC交换机与1台磁盘阵列连接;现有物理计算资源可以支撑同时运行200个虚机(1个1CPU、4GB内存、30GB虚拟磁盘),现有磁盘阵列的存储资源主要提供虚机存储空间和网盘存储空间。2.2 扩容资源需求对资源需求进行估算是虚拟化系统硬件配置的基本依据。在大数据实验室中,资源可分为两大类:一类是运行时系统需要的资源,它决定了系统能支持同时运行多少个虚机,该情
4、形主要关注物理服务器的CPU资源、内存资源和磁盘阵列的IOPS资源,磁盘IoPS资源在大数据实验中需求相对较高;另一类是系统可以“存放”多少个虚机,这主要关注磁盘阵列的存储容量。运行资源假定虚机规格如下表中所示,该规格满足大数据实验环境下对性能的需求;则200个虚机同时运行,需提供下表中所需资源。1inux虚机规格同时运行虚机数量虚拟资源池大小需求CPU大小2个逻辑CPU、2.0GHZ100CPU资源200个逻辑CPU、200GHz内存大小4GB内存大小400GB磁盘TOPS100磁盘TOPS10000当然,对于HadooP集群中的MaSter虚机应当配置大些内存,比如8GB。存储容量磁盘阵列
5、存储空间由需要多少个虚机和虚机磁盘大小决定,假定虚机磁盘规格如下表所示、需要存放500个虚机,总共需要约210TB的存储空间。1inux虚机规格虚机总数磁盘阵列存储空间需求磁盘1(系统盘)大小15GB500磁盘空间107500GB(IOOTB)磁盘2(数据盘)大小200GB2.3 物理服务器扩容配置作为虚拟化主机的物理服务器,目前可选择的配置主要有2路和4路,综合考虑CPU利用率、网络成本等因素,我们建议选择2路服务器作为虚拟化主机,2路较4路将提供更好的性价比。首先计算总共需要多少物理的CPU资源和内存资源,计算以上述“运行资源”为基本依据,并考虑物理资源的80%用作运行虚拟机。虚拟资源池大
6、小比例物理资源池大小需求CPU资源200个逻辑CPU、200GHz80%CPU资源250个逻辑CPU250GHz内存资源400GB内存资源500GB物理服务器规格和所需数量如下表所示。新增物理资源池大小物理服务器规格物理服务器数量CPU资源250个逻辑CPU、250GHzCPU2路10核、超线程(40个逻辑CPU)、2.0GHz7内存资源500GB内存128GB4磁盘1*240GBSSD盘网口4*IgbFC口1*8gb根据估算,需要新增7台2路物理服务器即可满足计算性能需求,本项目中我们实际配置上述规格的物理服务器8台。2.4 磁盘阵列扩容配置磁盘阵列作为虚拟化系统后端共享存储,主要考虑IOP
7、S性能和存储空间的要求。存储空间显然容易配置,而IOPS存在诸多变数,这是个无法准确估算的指标,为了使系统具备较好的性能,我们进行了仔细考量。依据2.2节所估算的IOPS性能要求和存储空间要求,估算系统需要多少块SAS磁盘。存储资源需求单块SAS盘需配置SAS磁盘数量IOPS10000TOPS20050块I存储容量I10750OGBI容量I900GB120块同时满足IOPS性能和容量需求需要新增约120块SAS盘,这个投资显得过高。为了降低存储上的投资,我们采取如下配置和部署的策略:第1:使用高性能SSD盘结合SAS盘,提供较SAS盘更好的性能;该部分的空间主要用于虚机的系统盘。第2:使用高性
8、能SSD盘结合大容量SATA盘,主要满足系统容量的需求,并提供了接近SAS盘的性能;此部分存储空间主要用于虚机的数据盘。现有磁盘阵列扩容配置配置如下表:磁盘阵列扩容配置可提供的规格、功能控制器(双活冗余控制器)IOPS大于12000缓存(32GB)存储容量I20TB裸容量SSD盘新增:4*200GBSSD缓存支持SAS盘新增:12*900GB精简置备支持SSD盘新增:4*400GB存储快照支持SATA盘新增:28*4TB2.5 FCSAN网络扩容配置由于新增加了8台物理服务器,FC交换机需要新增加激活端口和相应模块,数量为8个。2.6 IP网络扩容配置原交换机为48个千兆网口,从端口数量上来说
9、资源是够的,但是在大数据实验环境中,虚机之间存在大量的东西向数据流量,因此我们设计增加一台24口的千兆交换机用于大数据集群后端网络流量通道。2.7 扩容配置清单构建满足100个虚机同时运行的大数据实验平台,需要对现有云实验平台物理资源进行扩容,扩容包括:新增8台物理服务器、磁盘阵列添加SSD/SAS/SATA盘、FC交换机增加激活端口、新增1台24口IP交换机,详细扩容配置清单如下表:序号名称品牌/型号扩容配置描述数量单位一云实验平台硬件扩容配置1-1虚拟化主机云创cServer2U机架式服务器带机架安装套件;CPU:2颗XeonE5-2670V3,内存:128GB;4个千兆网口;Disk:1
10、块240GBSSD,板载支持RaidOj,5,FC:单口8Gb;8台1-3磁盘阵列云创rStor7000扩容新增:4*200GBSSD,4*400GBSSD,12*900GBSAS盘、28*4TBSATA盘,SSD缓存功能、精简配置功能、快照功能0台1-4光纤交换机Brocade300B扩容新增:8个端口激活许可,8个端口8gb模块;0台1-5千兆交换机华为S5700-28C-SI24个101001000Base-T,可插拔交流电源,交流供电1台二Hadoop教学培训服务2-11套三其他相关赛用3-1机柜1台3-2定制开发3-3安装调试3-4培训服务3部署方案3.1 系统架构系统架构在扩容前后
11、基本没有变化,扩容后的整个虚拟化系统部署架构如下图所示。千兆交接机48)VIanAVIanB与原先区别主要是资源池扩充了,新增的物理服务器构成一个新的集群,并且通过新增加一台千兆交换机构成大数据实验虚机后端网络流量通道。3.2 IP网络部署本项目中对于IP网络的部署设计,除了考虑VSphere环境下一般性的部署注意事项外,还需要注意由虚机构成的Hadoop集群对IP网络的需求。上图是一台物理服务器的虚拟网络和物理网络连接示意图。每个虚机配置2个虚拟千兆网口,一个用于虚机前端业务流量,一个用于Hadoop集群后端流量,虚拟交换机VSwitch1和vSwitch2技术上可以使用一台、可以配置为标准
12、虚拟交换机或分布式虚拟交换机,为了清晰和降低难度,建议配置为2个标准虚拟交换机;VSWitCho和VSWitCh1上行链路可以互为备份,VSwitch1和vSwitch2的上行链路可以互为备份;物理服务器4个网口连接到2台堆叠的物理交换机。这种部署设计实现了IP网络全冗余,提供了故障切换和网络负载均衡功能。3.3 Hadoop集群部署通过虚机部署HadOoP集群,当然需要评估虚机资源的需求,即使评估有误也无关系,虚拟化的一大好处就在于资源可以灵活调整。在部署和使用虚机时,我们可以结合使用虚机模板、虚机克隆、虚机快照等技术为创建和使用实验环境提供便利。Hadoop集群包含了Master节点和S1
13、ave节点,可以进行Hadoop部署实验、HDFS实验、M叩RedUCe实验、HBaSe实验、HiVe实验等。下表是节点虚机配置参考。Master节点配置参考S1ave节点配置参考CPU2*1CPUCPU1-2*1CPUMEM8-16GBMEM2-8GBDisk1(sc1a)I5GBDisk1(sda)15GBDisk2(sdb)20GBDisk2(sdb)50-200GB虚拟网卡1千兆虚拟网卡1千兆虚拟网卡2千兆虚拟网卡2千兆本项目部署时,需要注意一个细节点是:我们应该尽量将一个HadOOP集群内的所有虚机运行在一台物理服务器上,避免IP流量流出物理服务器。3.4 部署计划下表给出本项目部署
14、实施的一些主要任务和时间预估。任务时间IP地址规划,V1AN规划4HFabricZone规划IH存储1UN规划2H虚机资源规划IH设备上架,完成物理安装ID磁盘阵列初始安装211FC交换机配置2HIP网络配置(交换机、路由器)2H存储完成配置2HvSphere安装配置1.5D虚机资源规划2H软件ISO导入,虚机模板创建III第一个大数据集群建立ID使用测试,调整2D创建其他大数据集群4HadoOP教学培训方案云创大数据科技股份有限公司为了帮助高校/高职培养Hadoop人才,提供HadoOP培训解决方案。为高校实现信息化教学和科研管理奠定良性基础,增加高校学生就业机会和薪资水平,逐步培养当今互联网时代IT行业的Hadoop人才。云创针对高校Hadoop培训提供了一揽子解决方案,该解决方案主要包含HadOOP培训课程、培训教材、考核认证、HadOOP教学实验平台等。本章节是对云创的Hadoop教学培训的介绍。