《Linux系统运维九大技能及知识总结.docx》由会员分享,可在线阅读,更多相关《Linux系统运维九大技能及知识总结.docx(31页珍藏版)》请在第一文库网上搜索。
1、1inux系统运维九大技能及知识总结以下内容包括ReCIHat和CentOS运维工作中常用的几大技能,并总结了系统运维中网络方面的规划、操作及故障处理等知识。一、1inux系统日常运维九大技能1、安装部署方式:U盘,光盘和网络安装其中网络安装已经成为了目前批量部署的首选方式:主要工具有CObb1er和PXE+kickstart可以参考如下链接内容:http:/insta11-os.htm12、初始化配置禁用服务禁用Se1inux配置YuM源配置可以配置为光盘,内部YUM源或EPE1等常用软件安装安装Xwindows配置ntpCrontab添加如上记录,指定内部ntp服务器SSH登录设置修改ss
2、h禁用DNS选项:添加允许指定用户登录:.上传扫描工具网络上有该脚本,下载自行使用修改历史记录格式3、安全加固本次安全加固内容主要参考的是Redhat和Centos系列版本系统:参考链接http:/.htm1注释掉系统不需要的用户和用户组注意:不建议直接删除,当你需要某个用户时,自己重新添加会很麻烦。关闭系统不需要的服务给下面的文件加上不可更改属性,从而防止非授权用户获得权限限制不同文件的权限禁止使用Ctr1+A1t+De1快捷键重启服务器使用yumUPdate更新系统时不升级内核,只更新软件包注意:由于系统与硬件的兼容性问题,有可能升级内核后导致服务器不能正常启动,这是非常可怕的,没有特别的
3、需要,建议不要随意升级内核。关闭Centos自动更新“关闭多余的虚拟控制台我们知道从控制台切换到X窗口,一般采用A1t-F7,为什么呢?因为系统默认定义了6个虚拟控制台,所以X就成了第7个。实际上,很多人一般不会需要这么多虚拟控制台的,修改etcinittab,注释掉那些你不需要的。修改history命令记录隐藏服务器系统信息在缺省情况下,当你登陆到IinUX系统,它会告诉你该IinUX发行版的名称、版本、内核版本、服务器的名称。为了不让这些默认的信息泄露出来,我们要进行下面的操作,让它只显示一个1ogin:提示符。删除etcissue和/etc/这两个文件,或者把这2个文件改名,效果是一样的
4、。优化1irmX内核参数系统优化服务器禁止ping检查口令策略设置是否符合复杂度要求检查登录提示-是否设置登录成功后警告Banner修改文件etcmotd的内容,如没有该文件,则创建它。检查是否设置登录超时执行备份:修改etccsh.cshrc文件,添加如下行:改变这项设置后,重新登录才能有效5、多路径设置随着X86环境的普及化,1inUX的市场占有率也越来越高,为了方便后续的设备管理我们和1inUX自带多路径软件的成熟化,我们在日常的设备多路径软件选择方面经常会首先考虑使用DM软件,本次多路径设置主要是结合REDHAT和CENTOS自带软件DM-Mu1tipath参考:1inUX操作系统层面
5、MUIIiPa1h配置使用技巧及注意事项(点击标题可读)6、系统异常性能指标获取CPU占用最高的10个进程内存占用最高的10个进程虚拟内存使用最多的前10个进程I查看系统负载I统计当前连接数当前连接数最多的10个进程6、1VM日常使用1VM在日常运维工作当中占据着很大的比重,在此我列举1VM常见的日常操作及步骤。1 .添加一个磁盘到os,格式化文件系统使用,参考如下:扫描磁盘这个其中每个步骤就不在做详细解释,有兴趣的可以独自搜索2 .文件系统的扩容和缩小(根文件系统缩小要相当的慎重)在线扩容文件系统:缩小文件系统:在线删除一个共享磁盘1UN例如:删除一个不用的IUn7、1inux运维命令掌握1
6、inux下面日常运维使用的命令有太多了,可以根据个人的情况进行适当的记忆。系统负载:top,nmon,dstat等网络:ss,netstat,route,diag,ping,ip,Isof等io:dd,iostat,fio,nmon,dstat,pvs,1vs,vgs等内存:free,dstat等进程:ps,Isof等配置:1scpu,Ispci,dmic1ecode,Isscsi,udev等设备识别:echo,rescan-SCSi-bus.sh等诊断:StraCe,Itrace等比如还有find如何结合Xargs,tree的使用,ISb1k等等,还有很多很多,需要长期的积累,当然主要使用还
7、是配置查看,1vM设置,网络还有很多成熟的开源和商业产品进行管理,在此不一一列举,感觉可自行百度和goog1e0目前主流的python,ruby这些语言工具可以根据自身情况选择一个掌握。8、诊断工具在日常的运维过程当中,不免要进行所谓的性能或者故障方面问题的诊断,工具和手段包罗万象,在此列举一些日常使用的工具用于参考。这里附上一幅1inUX开机流程图,这样很多人就可以更加清楚的了解了1inUX在启动的整个流程,便于此类问题的解决。9、网络必杀技Netcat,SSH几种隧道转发模式,1sof,dstat,ethtoo1,iptraf,iperf,diag,route和多个网卡路由及双网卡绑定技术
8、值得了解,这些都是os层面运维网络方面经常会使用到的几个方面在日常较为常用的操作就是进行双网卡的绑定,下面分享一个绑定的具体流程:1、cp/etc/sysconfig/network/ifcfg-ethOetcsysconfig/network/ifcfg-ethO.bakcp/etc/sysconfignetwork/ifcfg-eth/etc/sysconfignetworkifcfg-bondO2、vi/etc/sysconfignetworkifcfg-eth,注释所有(除以下两行内容),并将值修改如下:bootproto=,none,STARTMODE=1Offt3、cp/etc/s
9、ysconfig/network/ifcfg-ethO/etc/sysconfignetwork/ifcfg-eth14、vietcsysconfignetworkifcfg-bondO,增加或更新如下内容,其他内容可注释:说明:以上配置mode=。为负载均衡模式,如果需要配置成主备模式,BoNDING_MODU1Ej)PTS配置如下:BONDING_MODU1E_OPTS=,mode=1miimon=100use_carrier=0primary=eth5、rcnetworkrestart,重启网络服务生效,并进行测试。6、catprocnetbondingbondO可以查看bonding的
10、状态。二、1inux系统运维的网络知识总结1、系统运维中网络方面的规划与思考在很多公司,岗位职责都是很明确的,专职转岗,每人或者每组负责一块业务。系统运维岗基本上在IT架构上相对偏后一些,该岗位和网络管理岗基本上是平行的。因为今天咱们说的是系统运维方面网络方面的事情,或多或少都会和网络岗打交道,那么谈一点网络岗的内容就显得很有必要。系统运维建立在网络的基础之上,如果没有一个相对合理的网络架构,恐怕系统运维做起来也不是那么的顺手。一个公司基本上都会把网络和服务器独立开来,划分不同的区域摆放设备,很多时候都是物理隔离。服务器接入交换机大多是经过配线架连接起来和有的服务器机柜头柜安装网络交换机,是相
11、对比较常见的两种方式。走线从侧面可以反映一个企业对IT的重视程度和投入,很多企业是做不到如图这么漂亮的效果的。这一切一切还要立足于预算,现在基本上没有预算啥事也干不了。大多数IT机房当初建立的时候,从设备混乱摆放到区域明确划分存放,又从区域功能明确到后来的后来的功能区域模糊,都反映了一个问题:计划赶不上变化。十年前还相当前卫的规划,到现在已经跟不上时代,这并不是谁的错,还是要求我们去适应去改变,业务引领变革,基础架构也需要做相应调整,所谓唯一不变的就是变。我心中企业目前现阶段相对比较理想的架构这样的,如图所示:这样一个传统企业典型的网络结构,保证每个核心节点都是双链路,链路异常自动切换,各种切
12、换在这种典型的网络结构上都或多或少的简单或复杂,不尽相同。网络方面关注几个点:稳定,安全,自动化。业务系统组件也尽量避免单点问题。这样后端业务系统在连接网络层面稳定性就有了保障,在主机系统层面,尽量避免单独问题,消除性能瓶颈,异常能够自动告警自动修复得相对比较完美,当然这一切还要立足于预算。2、系统运维中网络方面操作梳理在系统运维中,经常涉及的网络方面的操作,一般由以下几个方面组成。1设备上线,物理连线设置很多运维人员要从事从刚开始立项到项目上线再到后期运维的一条龙服务,每个环节都要自己亲自动手,这是好事也是坏事,好的是自己的环境一般会非常的熟悉,不好的是事必躬亲,不出活,业绩不明显。插个线都
13、要自己来,你恐怕也没太多精力干其他的,这就是个矛盾体,自己把握就好。2 .网络逻辑配置调整这一块内容就涉及到了具体的操作,你可以手工一步一步操作,也可以借助高大上的工具批量完成,这个要看企业的IT建设的能力。一个掩码一个点错误都会导致网络连接异常。如果自己有开发能力也可以使用脚本或语言写成成型的东西,平时多多积累,使用的时候就会方便很多。具体内容涉及:1)配置ip,别名,设置个端口监听,绑定个网卡,设置个路由2)划分个V1an,配置个trunk3)测试个端口,配置个监控具体的操作过程在此不做过多的介绍,比如做个网卡绑定啊,测试个端口啊,这些操作网上有大批的文档可以查阅,本节内容就是描述在日常的
14、1inux系统运维方面所涉及网络方面的操作,有一个整体的印象。3 .性能分析与优化该部分内容相对不太容易操作,不是随随便都可以依葫芦画瓢就能完成,性能稳定分析和定位相对困难一些,很多场景都需要结合多个方面进行统一分析。这个需要一些工作经验的结论和沉淀,选择合适的工具,多方面配合往往会有比较好的效果。工欲善其事,必先利其器:熟练掌握该图上面的各种工具,基本上可以解决性能分析99%的工作,那剩下的1%的不是bug就是天灾。这里其实在说笑了,但这也说明一个好的工具有多么的重要。剩余就是要仔细认真,再好的工具,不会用也不行,态度是第一位的。3、系统运维过程中需要掌握的利器在上文中分享了一个图,该图涵盖的面比较广,本节内容主要针对网络方面进行一些梳理,分享一下在工作当中经常使用的利器。首先我们来分享一张目前1inUX系统性能查看调优工具图:这张图片基本上涵盖了1inUX系统各个方面的性能工具,可以说相当的全面,下面我们看一下有关网络方面我们常用的命令或工具有哪些,这样有助于大家方便查看和使用。.一,Z-.,_.*-I,I以上工具基本上在日常工作当中经常会