it运维年终总结范文

2024-08-28

it运维年终总结范文(通用5篇)

篇1:it运维年终总结范文

时间过的飞快,转眼间,来XXX一年出头了。这一年来让我感受了很多,经历了很多,学到了很多。

在领导的带领下,在同学们的配合和帮助下,我不断地学习新知识、总结新经验,努力加强着自身的素质和修养,完成了入职至今自己岗位上各项工作任务,简单汇报如下:

一、严以律己

从200x年x月x日加入公司以来,在平时工作中,我始终努力以工作高标准严格要求自己,严格遵守公司的各项规章制度。负责的工作范围跨度从SA到DBA再到内网网管。具体工作从前端集群、Web服务到中间件服务的维护,到后端两类数据库(MySQL/Oracle)服务,再到办公室内网改造维护。遇到问题能够做到不等不靠、不推脱责任,以最快的速度去解决问题。适时回报领导进展情况。能够有条不紊地安排完成好各项工作,争取起到在组内的带头作用,能够主动积极和组内领导交换意见,配合支持领导开展部署好各项新工作及临时紧急工作任务。

二、工作四“件”事

a、无条件配合或完成上级或部门领导分配的任何难度工作。如:各种数据库DB管理、部署、架构改造优化、mail架构设计及实施、负载均衡部署、内网棘手问题及其它临时紧急任务。所有问题均比较圆满的一一攻克。

b、做最紧急需要处理的事。如:网站宕机、服务异常。能够做到第一时间(包括休息时间7x24)处理各类网站监控报警(独立部署并维护nagios重要报警服务、代码上线工作)。尽个人所能最大限度的减少了网站意外宕机隐患发生和大大降低了宕机率。

c、做最重要的事。如架构改造中数据库MySQL,Oracle部署、升级、维护优化,数据及数据库语句入库严格把最后一道关卡。最前端代码平滑上线,测试效率、用户体验。一年来,几乎以0失误率完成了c条中的架构调整MySQL数据库改造部署,Oracle升级(32位到64位,再到集群架构)及日常数据库维护。开发平滑上线代码,并持续坚持独自加班加点上线代码直到现在。

d、做最不重要却需要做的事。如各种棘手,琐碎、耗时,又不易出成绩的工作。如:加班或深夜处理各种日常临时问题,报警、清理日志,数据,分析数据、恢复数据测试演练。事无大小均能够做到根据事情的轻重缓急合理安排时间一一完成处理。并尽全力让相同异常不在重新上演。

三、缺点与不足

a、和公司高层领导沟通不够多,缺少深层次的沟通和交换意见。

b、和大家沟通或配合帮助大家时方式方法过于直接,导致影响到个别同学。如;语气更委婉些,态度更平和些,方式再好一些。效果就会更好。

c、对本职工作外的一些相关工作,了解的不够,如:对网站程序级别的架构改造及代码业务逻辑等的了解。

四、附1年来若干重要工作事件

1、独立开发上线(或自动上线)代码程序并且每日部署发布代码。

效果:大幅提升了用户体验,大量节省程序测试,发布时间,大幅提升了上线效率,并显著降低了出错率。

2、独立部署并维护及时监控平台nagios。

效果:大大降低了全年的网站宕机率,并在问题有趋势未故障时提前得到了处理。

3、第一次大规模系统架构改造,负责部分前端迁移,负载均衡部署,重点负责所有数据库层(MySQL/Oracle)数据顺利迁移。

4、Oracle新数据库成功顺利上线,至今稳定高效,前后各种难点问题攻克。及日常备份、维护优化、集群架构设计实施。

5、365x7x24监控网站故障报警,第一时间紧急处理公司网站各类故障,让问题胎死腹中。效果:保证了网站最大限度持续正常运行。

6、各类工作Shell脚本开发。开发程序对数据库慢查询多重分析,开发寄出MAIL程序。数据库主从延迟,同步监控并开发自动化处理程序,报警到手机。全网服务器日志轮旬,定期脚本清除。网站日志分析IP、PV、爬虫查看,为处理故障提供了重要的数据依据。开发监控网站带宽程序寄出MAIL给领导等等。

7、大量支持公司架构组架构设计改造。

8、新邮件服务器成功部署。

9、办公内网成功改造。

10、全网服务器备份方案设计及实施。

11、各种数据库(MySQL/Oracle)各种备份方案策略,参与定制负责实施。演练各种灾难恢复并出文档SA组内分享。

12、负责系统安全漏洞扫描,全网外部服务器防火墙部署安全维护。

13、架构改造前后MySQL数据库日常维护。备份。恢复优化等。

14、PHP服务器目录及文件权限特殊安全处理,防火墙加强控制。

15、配合架构组下半年的大量和系统相关的支持,改造。

16、LVS负载均衡服务部署使用并讲解。大规模监控平台Nagios服务的整体迁移。脚本监控及相关服务的迁移,休整。

17、支持架构组主站前端inca,zuma部署直到正式上线,随之的大量临时需求,及分用户后平滑上线问题研究解决。

18、办公网网络较大动作平滑改造。原内网IP冲突,上网慢、QQ/MSN掉线,网银不能登陆等等疑难杂症完全得到解决或显著改善。

19、开发程序将MySQL及正式库Oracle数据备份全自动恢复到测试库满足开发、测试工作需要,同时,利用开发和测试人员为我们进行了备份数据有效性的测试,大大提高了运维人员的工作效率。

20、SNS项目环境LVS+TTSERVERLVS负载均衡问题难点攻关。配合部署。

五、每日日常例行固定工作

1、负责每日上线发布代码,上线服务器。根据程序需求改造、开发修改平滑上线部署程序。

2、负责每日数据库(Oracle,MySQL)程序员提交的开发及维护SQL语句检查更新正式库。Oracle,MySQL测试及正式数据库维护、备份、恢复故障监控处理等。

3、第一时间(包括非工作时间)处理网站各种重大或可能给用户带来体验的故障问题及潜在的预期故障(分区,内存,URL访问故障等)。确保网站7x24提供持续访问。

4、程序员不计其数的日常开发测试支持。并能通过程序开发工具来节省大家的时间,提高沟通解决问题的效率。

5、能够经常主动提出各种潜在问题或者相关问题自己的特别见解反馈领导或者组内。

近一年来能取得这样的工作成绩,与领导的支持和大家的帮助、配合是分不开的,在此向公司的领导及全体同学们表示衷心的感谢!

以上是我近一年来的思想、工作情况的简单总结,有不全面和不准确甚至错误的地方,请领导批评、指正。以便我在新的一年的工作中,有信心更进一步完善自身。把SA的工作做的更加完善。为公司的大跨步发展添砖加瓦。

公司经历了200x的夯实基础,必将赢来新的飞跃发展。作为公司的一员我非常愿意和公司一起继续努力发展,为共同迎接美好的20xx而努力奋斗。

篇2:it运维年终总结范文

时间飞逝,转眼年终将致,回顾XX这一年,我学到了很多知识,改正了诸多自身的缺点,交到了很多新的朋友,特别是在加入我们公司,成为这个大集体中的一员,公司和公司同事对我的帮助无法用言语来表达,

运维是一个技术岗位,随着公司业务的增长,公司的壮大,设备的不断增多,这对于我们的工作是一项挑战。作为一个运维人员需要不断学习来完成公司交给我的任务,完成公司分配给我的工作。

在这一年的工作中,在自身的努力和同事的协助下,调整自身的心态,改正自身的不足,积极进取,也算是取得了不小的成绩:

1、总结下来的经验,编写成《运维笔记》,作为公司整体技术水平的一个积累,方便了各类人员通过查看笔记能够更加快捷方便地处理好日常工作中碰到的各类问题。

2、这一年坚持每周一次运维总结报告、工作详细报告以及报表统计,这些数据记录了这一年公司服务器的运维整体情况、个人的工作情况和见证公司的高速发展和扩大。

3、在运维过程中,碰到突发问题,能够及时响应,并迅速地解决问题。在同事处理问题的过程中,自己懂的协助一起解决,自己不懂的,虚心学习,得到了同事和公司多次嘉奖和赞扬。

正是自己对知识渴求的欲望和对工作的认真负责的态度,让我在运维这条路上,能够经历 风风雨雨取得今天的成果。

或许这些成果对于别人,算不得什么。但是对于 我来说,这就是成绩,让我能够对自己技术水平的肯定和坚定自己可以胜任这份工作的信心。同时,随着知识面的扩宽,我也越来越发现我还有很多的知识点没有弄 懂,就像有句话说:知道的越多,不知道的也就越多。所以,对于今后的工作我会更加认真仔细的每个环节,把工作做的更好,对于新的一年,我也对自己提出了一 些新的要求:

1、认真完成公司给出的工作任务,在工作中紧跟领导的步伐,团结同事,始终要相信,只有团队协作才能更好的将每个成员的能力发挥到最大限度。

2、坚持以服务至上,虚心听取客户提出的改进意见,改进自己的工作效率,提高公司的形像。

3、在提高服务水平的.基础上,通过技术上的培训提高自己的技术水平和解决问题的效率,提高自己的信息安全防范意识。

4、在工作过程中继续积累对新技术和新方法。对于有利于运维工作的成功方案及时整理,并分享给整个技术团队。

5、配合公司的安排完成一些其它的任务,在一方面保证运维工作的情况下,能够协助完成其它一些非运维的工作,为公司奉献自己的力量。

篇3:IT运维心得分享范文

在很多“外人”的眼中,运维工程师的工作不过是搬机器、调网络、装软件、处理故障、7×24小时值班,简单而又枯燥至极。但事实并非如此,运维工作涵盖很多技术领域,运维工程师要掌握硬件、软件、操作系统、开发等多方面的知识,核心目标是为亿万用户使用的产品保驾护航。

当今互联网行业的发展日新月异,新技术层出不穷。为了适应发展趋势,运维工程师只有提升技术能力才能更好地完成艰巨的运维任务,必须要对传统运维发出自我挑战。

在360,运维团队由基础运维团队、网络运维团队和应用运维团队三部分组成。我们将运维从技术支持领域升级,进行产品化改进,核心目标是为了降低运维成本、缩短研发周期、让产品试错更廉价。理想很丰满,现实很骨感,从最初服务少量项目、几十台服务器,发展到大量具有数亿用户的项目,我们也在不断摸索,在试错中成长。在这个过程中,我们经历了两次重要的升级。第一次升级:运维工具化

运维工作中有很多琐碎的、重复的事情,初期我们只有两个IDC,服务器数量有限,项目数量也较少,靠纯手工劳作还可以应付。但随着时间的推移,项目暴增,随之IDC和服务器的数量也成倍增长,同时360各项目都是小团队在做,开发风格不同、习惯各异,但极致要求响应速度,如果运维工作按照之前方式进行,很难满足需求。大势所趋,我们必须进行工具化升级,将重复的事情自动化。

在工具化过程中,我们秉着低成本、拿来即用的原则,借鉴业界成型的方案,同时将精力用在对开源软件的研究中,有开源工具就绝不自己凭空创造。初期,我们只围绕开源软件做周边脚本开发,不动核心代码,在实践中总结经验。例如,在最基础的部署软件环境中,我们基于YUM搭建了自己的包管理系统,将常用软件打包,同时根据项目做成模板,这样无论是初始安装还是扩容都能在分分钟完成。配置文件管理利用Puppet完成,服务器批量操控依赖SaltStack。就这样 我们的运维兵器谱在不断地丰富。

另外,运维工作离不开监控报警,这是一件让无数运维人苦不堪言的事情。而会休息才会工作,监控体系必须优化。

我们的监控大概分为系统级、应用级、项目逻辑和用户体验四部分。系统级主要监控硬件和网络等;应用级主要监控常用软件的健康状况;项目逻辑监控主要模拟用户行为探测项目功能点是否运行正常;用户体验监控主要联动博睿和基调等第三方监控一起优化用户体验。我们用过的工具很多,开源工具有Nagios、Cacti、Ganglia、Zabbix等,同时自己也开发了一些针对项目场景的监控工具,但万变不离其宗,都是围绕上述几个维度进行监控,然后再进行分级预警和报警。

为了减少报警骚扰,我们分级处理,将报警分为邮件预警、短信报警和疯狂短信报警。以磁盘空间监控为例:每天下午6点,统计 磁盘使用率超过80%的机器,发出邮件预警,下班前解决;在预警的基础上,超过85%触发短信报警;超过90%就要持续报警,避免事故的发生。此外,随着 服务器数量的增多,硬件故障在所难免,架构设计需要考虑高可用方案,冗余范围内的服务器故障会以邮件预警的方式发出,避免对运维工程师的骚扰。

有了监控工具和分级机制,还需要有好的制度。为了大部分人可以安心休息,我们每天有专人负责处理常规报警,遇到无法解决的问题才要求他人协助。第二天的负责 人要针对第一天的报警找出根本原因,并尽力解决,因为如果无法根治,困扰将持续发生。所谓线上无小事,实际工作中复杂场景引发的问题数不胜数,所以可以宽 容第一次错误,但不能接受同样问题发生第二次,要不断地总结和完善。

工具化是运维的必经之路,是向更高层发展的基础,面对运维这样复杂的学科,这样一个极其磨炼人意志的工种,运维工程师需要用聪明的方式解决复杂的问题,节省时间,去做更有意义的事情。

第二次升级:运维产品化

我刚提出运维产品化时,有朋友开玩笑说,你做后端运维吃苦受罪这么多年,看着产品经理吃香的喝辣的,羡慕嫉妒也想转行做产品吧。也有人说,你是在偷换概念,不就是做自动化运维平台嘛。其实提出这个概念,一方面是源于有了足够的工具化积累;另一方面是想换一种思路做运维,培养产品观,站在用户的角度思考问题,让处于后端的运维工程师主动挖掘需求,围绕运维做更多的探索,提升团队技术能力,解决海量用户带来的问题。有了这个想法,就需要将无形的技术转变为有形的产品形态,同时要赋予它好的寓意。我们的产品取名为HULK——绿巨人,意在让小伙伴们借助巨人的肩膀成长,轻点鼠标,运筹帷幄。

想到做这个平台,源于对实际工作需求的观察。产品经理有了创新点之后,开发工程师就想以最快的速度上线,但又会很痛苦,因为产品就好比宝塔明珠,塔基需要一 层层地盖。而开发工程师是与运维工程师合作最紧密的兄弟,“兄弟有难得拔刀相助”,因此我们明确了开发工程师就是运维平台的用户,运维工程师在平台的建设 中扮演了多重角色,是建设者也是使用者,但目标是为用户解决问题,让我们的用户有极致的用户体验。基于这些想法,我们勾画出了宏伟蓝图,提供一个塔基,第一层提供核心基础服务,如Web、RDB、NoSQL等;第二层提供通用基础服务,构造一个完美的平台,让开发工程师受益。但勾画的平台功 能大而全,需求都是我们替用户假想的,这样做的后果就是进展缓慢,但做出的功能没人用。我们在失败中反思,意识到需求还得从日常工作中去挖掘,平台上每个功能模块都必须解决用户的痛点。互联网精神唯快不破,要围绕“快”找痛点。早期开发和运维的合作中,更多的是邮件、IM及当面沟通,跨团队的沟通成本是第 一个痛点。初期平台建设中,我们从加速流程开始进行摸索,以“需求任务流”为核心,将通用需求规范流程,统一需求提交页面,同时尽量为用户提供选项,而不是随意填写,尽量减少沟通成本,同时为完全自动化打好基础。由于完整的自动化流程开发成本比较高,初期我们还“投机取巧”,用户提交需求以后,只是把格式 化的邮件发送给运维工程师。运维工程师使用半自动化工具干活,完成后再通过平台任务流告知用户结果,手工操作的部分是隐藏在平台后面的,用户不得而知。就 用这种方式,我们的平台积累了不少用户和口碑。之后我们将日常需求分层、分类:主机类包括主机申请、账号授权、软件部署等;Web类包括配置文件管理、域名管理等;DB类包括建库、建表、SQL审核、授权等。再攻克技术难点将一个个需求实现完全自动化,点点鼠标解决问题。

关于需求任务流,还有个小插曲,标准的任务流由提交、审核、驳回/通过组成。但这个流程太死板,例如用户提交的一个需求,在审核的过程中有待商榷,运维工程师会和开发工程师 沟通,最终达成一致意见即可,而如果按标准流程需要驳回再提交。为了让用户少一次操作,我们增加了管理员可编译功能。有些同事反对这样做,觉得不符合常 理。不过有时候常理是需要结合实际场景打破的,就为了让用户使用更简单。

近期为了进一步提升项目试错阶段的速度,我们在平台上推出了一个新功能:“项目孵化器”。以典型的Web业务为例,以往,申请Web Server、账号、数据库实例、负载均衡等是提给运维最基本的需求,每一步都是时间成本。使用“项目孵化器”可以最大限度解决这个痛点,只需在平台上进 行两个步骤:第一步填写业务名称,预估峰值QPS;第二步选用MySQL、MongoDB、Redis等相关数据库资源。两步之后,Web Server、数据库实例等所需资源会瞬间展示在用户面前,同时包管理、配置文件管理、代码发布系统、监控系统等配套辅助功能随之开通。

与之前的模式相比,效率和规范化都有明显提高。说起来很神奇,但实现理念很简单,我们提炼日常项目中的通用方案,构建资源池,在项目发展初期最小量匹配资源。在孵化器的设计阶段,我们听到了很多不同的声音。例如,让用户填信息不够全面,架构太简单不满足全部需求,诸如此类问题,让人头痛欲裂。经过过往项目 分析及用户调研,发现项目尚处于试错阶段,快速试错是首要需求。至于项目发展中衍生出来的需求,可以再用平台扩展功能去解决。当利用孵化器建立一个试错项目之后,用户进入平台想看见什么?展现形式如何?还能做什么?这些问题随之而来。

众所周知,项目中的关联关系是个复杂的问题,解决不好,就像一盘散沙无法联动。为了解决此问题,首先我们确定平台各功能模块以项目名为主键,将项目的域名、负载均衡、Web Server、数据库、通用基础服务等相关联。项目后期各功能模块的扩容可以借助关联关系自动化完成。例如增加一台Web Server,即可自动部署软件环境,完成相关节点授权、上传代码、测试上线。

展现形式上我们借鉴社交网站的实现方案,以“我的项目”为中心,用户进入平台以后默认页展示项目在平台中用到的各功能模块信息,例如域名、主机数量、数据库实例和监控指标等。做到信息清晰可见,操控简单易用。

在平台建设中,我们一直遵循两个准则:第一,把事情由复杂变简单;第二,给用户极致的用户体验。所谓极致,就是要超出用户的预期,但只有挖掘用户潜在的需求,才能做出超出预期的功能。传统的运维模式,大多是开发工程师提需求,运维工程师满足需求,运维工程师主动推进的意识不够。360的文化中有很重要的一点是Ownership,一个项目的成功与失败,运维工程师是有责任的,因此需要在日常工作中时刻提醒自己“这个项目是我的,为了让项目变得更好,我们需要主动思考,为开发工程师提供更多的增值服务”。例如一个项目上线前,会默认部署日志收集模块,收集汇总后进行访问日志自动化分析,以时间维度展示访问量走势,同时辅以IP地址分析模块展示地域及运营商分布。同时基于访问日志状态码做进一步的页面分析,然后以日、周、月维度生成一份体检报告,以及应对方案推送给开发工程师。这些增值服务是超出预期的,拉近了开发工程师和我们的距离,一起去探讨、改进,做出更多有利于项目发展的功能。结束语

篇4:IT运维个人工作总结

工作上事情太多,难免繁琐,难免被人抱怨,被人投诉。仔细想想,需要改进的地方的确很多。

毕业四年多了,从最基础的windows局域网维护,后来学习active directory,isa,exchange。后来去考ccna,想从事网络方面的工作,发现ccie实在是难学,需要太多的时间和精力,当然费用也不低,于是去考了mcitp。回想起来,的确走了不少弯路。来到新公司一年多了,事情比以前更多,系统开发、服务器维护,网络架构规划,这些东西都要一个人来做,的确很磨练人。简单说一下it运维人员常犯的几个毛病,总结如下: 1.态度不好。it运维人员通常每天都会遇到大量同样的问题,可能一次俩次大家都能够微笑的面对,次数多了,就开始不厌烦了,开始出现轻慢,甚至不想处理的情况。应对办法:设身处地的想一想,把自己的同事当成自己的客户,客户就是上帝,得罪了客户,你还要不要在公司继续干下去?记住,微笑是传染病。2.抱怨用户太傻。本人自己以及很多it朋友都有过抱怨,说公司某某同事那个笨啊,显示器没有开居然说电脑黑屏,更有甚者,所有问题的责任都推到it人员身上。

应对办法:我们必须明白一点,企业信息化是一个长期的过程,就算让所有同事学会简单的it知识,也是需要时间的。作为it运维人员,我们必须采取有效的手段和方式,一方面加强对用户的服务,另一方面加强it培训。比方说,我们可以制订it管理制度,发

布常见问题处理手册,方便用户查阅。这里重点说明一点,it培训必须对新员工和老员工的不同之处作不同的应对。新员工相对来说比较爱学习,容易接受公司新文化,我们可以在其入职的时候,通过邮件或者书面形式发送公司it制度和相关资料,让其学习;老员工则需要以服务为主,使其学习为辅。

这里尤其要注意一点,不论在什么情况,千万不可跟同事产生冲突。3.不及时反映问题进度。某it运维人员就遇到这样一件事情,在公司做得一直不错,突然有一天,公司一老总说邮箱满了,无法接收邮件,让其处理。这位朋友正好出差,可能事情比较多,打电话给邮件管理员后,就把这事给忘记了。第二天,这位老总就打电话过来,说处理问题不及时,也不给回复。无法接收邮件,导致重要客户邮件没有收到,严重影响公司业务。结果就投诉到it部门老大上面,年底晋升的时候,可想结果如何了。

应对方法:it运维人员在处理同事及客户出现的问题时,一定要分清问题的重要性,划分不同的等级。公司重要领导交待的事情,一定要加急处理,如不能马上解决,一定要在2-4小时内汇报问题处理进度。一些日常问题,若不能及时解决,也应该告知用户处理好所需的时间,好让用户有心里准备。这个时间也需要把握好,不能太紧也不能太长,时间太紧,对自己没好处,太长的话用户会抱怨处理问题速度过慢。4.关于工作与职业的问题。很多分不清楚,究竟什么是工作,什么是职业。如果仅仅是把工作当作一种工作去做,可能我们会比较被动的接受;如果当成一种职业,把事情认为是自己的分内之事,自己有义务去做好。怀着这样的心态,我想我们在运维中的很多事

情都能迎刃而解了。还是那句话,保持微笑,多想想,又可能帮助同事或客户解决问题了,又可以体现自己的价值了,多好啊!5.关于如何处理好技术学习与人际关系。it运维人员在追求技术上的进展时,与处理好人际关系,表面上看是俩码事,实际上却会发生冲突。很明显的例子就是,此事太过简单,不值得我动手,我教用户解决就行,或者直接发一本册子给他让其自行解决。这又回到了上面的问题,态度问题。记住,态度很重要。如果想长期在这一行做下去,很多时候,决定自己命运的,可能并不是技术多么高深,更重要的却是人际关系。我们可能无法满足所有同事或者客户的需求,但是在不违背原则的情况下,尽可能的满足他人的需求。多行善,少树敌,对自己有益无害。

最后要说一点是,放下自己的面子,行事不可过于清高。常微笑,少抱怨,少熬夜,及时睡眠有益于身心健康。个人一点小小总结,难免有失偏颇,欢迎大家发表意见。篇二:it运维年终总结

运维服务工作总结

至2014年底,银海科技有限公司在蓝湾科技有限公司的运维又届满一年的时间了。在这为期一年的运维工作当中,运维的业务飞速发展,设备数量不断增加,人员的技术水平和业务知识有了显著的提升。我们的队伍在技术水平上也有了本质的提高。

一、细致缜密的完成计划中的日常运维工作: 严把质量;服务至上;严格要求;技术领先。

1.各位领导就对我们的运维工作给予厚望,我们提出认真完善服务水平的方针。我们在服务过程中严格按照这一要求,以对保障用户的权益,对用户负责的精神,把“严把质量,服务至上”的原则贯穿于日常工作的各个环节之中。使本运维期过程中的客户满意度有了非常显著的提高,多次获得了用户的认可。2.对于在工作中我们树立新要求、新方案,本着“严格要求”的原则,对于提出的要求科学性的分析研究,及时提出完整周密的解决方案。有力的保障了运维工作的及时有效性。

二、吸收先进经验,保质保量的完成运维的各项任务: 运维期内主机、服务器、网络和桌面均没有发生严重的生产安全事故,对于一些潜在的威胁也都在得到信息技术部门的批示下,审慎周密的完成了整改工作。运用先进的技术和经验提高劳动效率和运维工作质量: 1.运用先进的运维工具提高劳动效率。一旦发生问题可以迅速定位和

修复。

2.在工作的过程中注意新技术和新方法的学习和收集,对于有利于运维工作的成功方案及时整理并提交信息数据部。

三、认真完成运维工作中的汇报、总结每个故障点率和分析原因: 自2014-5-27,截止2014-12-31根据工作记录汇报共完成1263个报修,平均每天8.2个报修(其中不包括潜在故障点),服务项目有:安装,维修,培训,会议保障,综合布线,巡检等。服务分类有pc硬件,办公软件,网络连接,网络设备,打印机,电话传真,健康巡检等。以

: 1.其中pc硬件服务分类如下

分类 服务数 kvm 8 黑屏 26 蓝屏 13 装机 13 其他 61 2.办公软件服务分类如下:

分类项目 服务数量 office 47 ie 14 金宏 106 系统 101 其他 64 3.打印机服务分类如下: 4.电话传真服务分类如下: 5.网络连接服务分类如下: 6.网络设备服务一共20个!

以上数据均不包括潜在故障

四:总结工作 2014年已经过去,在自己的工作中还有很多的不足,还不能让客户达到百分百满意,对客户的服务也没有完善,对此问题我总结了一下原因,客户投诉最多的是响应时间慢,桌面维护这个工作工作量非常的不稳定,有时候工作量少,很清闲,有时候一天近30个服务,这是不受控制因素。而且还有潜在故障点,导致响应时间慢,从数据上显示2014.05.27到2014.12.31日一共有77个综合布线,平均一周两次工程布线,而布线最起码需要一个人员,而服务人员一共2人,另外一个人就有些力不从心了。每个人总会有些事情,需要请假,这些原因都导致了响应时间慢,还有一些是技术方面的原因,有时候我没篇三:it运维工作心得总结

运维工作心得总结

运维工作直接关系到应用系统运行的正常稳定,但运维工作纷繁复杂,正规化、系统化相对比较弱,如何改变这种现状?从众多的运维工作者的成功失败中进行经验总结,并提升为运维规则,是提高运维水平,保障应用系统正常稳定运行的有效途径。

笔者通过自己的多年运维经验,总结出以下必须遵守的基本运维规则,可以大大减少缺乏经验的运维人员因为自身失误导致系统出故障的可能性。

一、系统变更、升级应先在同样的环境测试通过,执行前应有经过验证的回退预案

运维是一门经验的学科、是一门试错的学科。没有做过的东西、总是会给你出意想不到的难题,因此变更前,一定要在相同或者相似运行环境下进行测试,通过后才能在正式环境下执行变更。同时应准备好变更失败的回退预案,比如,做好系统备份、数据库备份、配置备份,固化变更前的运行现场,让变更有回头的机会。

二、对破坏性的操作要先确认符合预定方案,然后谨慎执行 什么是破坏性的操作?

比如:

对 oracle 而言:truncate table_name、delete table_name、drop table_name,这些语句执行起来轻松简单也惬意极了、但记住!即便数据可被回滚、代价也是非常大!

对 linux 而言,rm-r 所有当前及其子目录的所有数据都将被删除。经历过这种故障的人、大多会给 rm 上个别名 a liasrm=rm-i 同理、cp 和 mv 也可以有同样的选项: aliascp=cp-i alias mv=mv-i 对window而言,shift+del文件或者目录 对任何系统而言,无备份直接修改文件等

三、备份并验证备份的有效性

不管是硬件还是软件总有意外崩溃的时候,怎么办?备份!!备份的学问很大、按照不同的维度可以分:冷备和热备、实时和非实时、物理和逻辑、全备增量备。

备份有了、可以高忱无忧了吗?不行!尚须验证备份的有效性。一个总有那么几次、备份无法保证 100% 恢复,简单的验证就是找个空库恢复出来。

四、对生产环境永保敬畏之心

这是避免应用系统发生故障的一条铁规,也是被开发、运维人员容易忽视的地方。要坚决杜绝直接在生产环境做开发、测试和bug修复,这些操作只能在开发和测试环境做,否则一旦出事,将欲哭无泪。

五、交接和休假最容易出故障

接手别人的工作要一而再,再而三的确认变更方案,请教人并不见得就是能力不行的表现;

? 休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人; ? 在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原系统管理人员确认各个操作细节。? 六、一定要有监控手段和报警措施

运维人员赖于生存的工具就是报警和监控。

报警可以让你及时知道系统出现了什么异常、以便及时跟进、把故障扼杀于摇篮; ? 监控可以让你了解系统的历史性能信息、以历为鉴、可以知兴替、早做优化。? 报警和监控是衣宽带水的好兄弟、相铺相成、互相促进。

七、使用自动切换技术需谨慎

为了保障数据库安全,往往会使用ha或者rac之类的技术,但是这类技术能否真正在关键时刻起作用,则是需要经过反复验证和确认的。并不是按照文档要求做好了就够的,很多意外因素或者系统因素会导致自动切换技术并不能如期发挥作用。如果到事后才发现这一点,将悔之晚矣。

八、要有偏执狂的精神,方案要检查,检查,再检查

有这么一个人:

① 他在做一个变更的时候,会先提前一两周发送邮件并电话手机通知相关人

② 在测试机上写好脚本,召集大家 review 操作步骤和脚本

③ 测试完成以后拷贝到生产环境

④ 登录对应机器,“打开,关闭,打开,关闭”该脚本

⑤ 跟相关人员再次确认执行的操作,顺序,时间点,可能的影响和回滚是否都准备好了

⑥ 执行前还要退出这个机器,然后再登录进去,“打开,关闭”脚本 ⑦ 最后才在后台运行脚本,同时在另外一个窗口登录着,随时ps和查看结果输出

期间姿势端正,呼吸急促而均匀,眼神凝重。操作的人不觉得累,倒是一边观摩的人很累。

九、简单即是美

我们总是面临各种诱惑:新的系统架构,新的更智能的命令和工具,最新的硬件平台,功能更全的ha软件...你可以在线下安装,测试,怎么做都行。但是如果想要在生产环境下使用起来、请三思!

能够使用系统内置命令的话,就不用考虑其他要专门下载安装的软件了 ? 脚本本身就能完成的功能,就没有必要专门找一个功能丰富的软件来做 ? linux本身自带的字符界面比那些复杂的图形界面要简洁方便 ? 如果能做到坚持这九条铁规,你的应用系统就能长久稳定运行了。篇四:2014it运维年终总结

运维工作年终总结

尊敬的各位领导,下面我将对2014年xx系统运行情况及本人运维维护工作进行汇报: 日常维护内容:

1、按照客户需求建立kvm虚拟机(系统包含linux、windows2003、windows2008r2)。

2、websphere中间件应用软件的日常维护、参数配置、应用程序发布、节点及服务的 添加、性能的优化。

3、oracle数据库的日常维护、日志组的添加、表空间的收缩及添加、用户授权、表的建立、报错日志的收集及分析、性能报告的采集。

8、机房环境的日常巡检,包括空调温/湿度的监控、ups负载情况的监控、灯光照明、门禁等。

9、配合各个兄弟公司完成客户处的新业务系统的添加及以往业务系统的完善。

10、pki数字证书的配置。

11、xx异地容灾数据库的日常巡检,异常问题的处理(基本都是归档日志应用问题)。具体工作内容统计:

总结:

通过本年的运维工作,xx系统运行情况基本稳定,满足日常业务办理需要,但仍存在以下问题和安全隐患需要注意。

1、数据库应用速度较慢

部分时间段业务部门反映数据库运行速度较慢,对数据库性能报告分析后发现,存在数据库性能瓶颈,建议对数据库性能和业务人员查询语句进行优化。

2、虚拟机资源不足

主要为刀片服务器刀片资源不足,部分项目资源利用不合理,使用单一刀片服务器作为服务器,浪费服务器性能。

3、服务器资源紧缺

因服务器资源紧缺,部分负载较高的系统搭建在虚拟机服务器上,系统运行不稳定。

4、服务器硬件老化

主要为该服务器使用时间较长,硬件存在老化现象,经常性出现自动重启和蓝屏现象。

5、机房温湿度异常

存在的安全隐患: xxx数据库磁盘空间严重不足,经过不同方式的处理后,磁盘空间紧张问题得到了缓解,但隐患仍然存在,资源库数据库磁盘空间剩余30gb。建议客户高度重视。尽快对该数据库采取有效措施,解决数据库磁盘空间不足问题。该数据库现处于非归档模式,若出现数据库崩溃数据库恢复难度非常大。

机房设备日益增多,导致机房空调超负荷工作,无法很好的控制机房温湿度。篇五:it运维服务工作总结

it运维服务工作总结 至2010年10月底,***0000有限公司在***0公司的运维又届满一年的时间了。在这为期一年的运维工作当中,xxxx的业务飞速发展,设备数量不断增加,人员的技术水平和业务知识有了显著的提升。我们的队伍在技术水平和管理经验上也有了本质的提高。

一、细致缜密的完成计划中的日常运维工作:

严把质量;服务至上;严格要求;技术领先。1.承接运维工作初始信息技术部的各位领导就对我们的运维工作给予厚望,并提出了认真完善服务水平的方针。我们在服务过程中严格按照这一要求,以对保障xxxx的发展,对用户负责的精神,把“严把质量,服务至上”的原则贯穿于日常工作的各个环节之中。使本运维期过程中的客户满意度有了非常显著的提高,多次获得了用户的认可。2.对于在工作中信息技术部提出的新要求、新方案,我们及时相应配合,本着“严格要求”的原则,对于提出的要求科学性的分析研究,及时提出完整周密的解决方案,并拟请用户试行或测试后实施。有力的保障了运维工作的及时有效性。3.对于提高服务业务技术水平上,按照信息技术部的统一规划,按时完成一系列的既定培训计划。按照“技术领先”的原则,通过技术上的培训提高了业务水平和解决故障的效率;通过制定有效的安全 机制和培训,健全了xxxx信息外包人员安全机制;通过保密制度的培训使运维人员能够树立自觉维护xxxx的信息安全防范意识;通过客户服务意识的培训提高了客户的满意度。

二、吸收先进经验,保质保量的完成运维的各项任务:

运维期内主机、服务器、网络和桌面均没有发生严重的生产安全事故,对于一些潜在的威胁也都在得到信息技术部门的批示下,审慎周密的完成了整改工作。运用先进的技术和经验提高劳动效率和运维工作质量: 1.运用先进的运维工具提高劳动效率。通过监控软件随时保持信息的及时性、可控性,一旦发生问题可以迅速定位和修复。2.经过信息技术部指导,我们在运维工作中大量了采用web2.0技术。使我们在高效完成运维工作的情况下,为xxxx节约了大量的费用投入。3.在工作的过程中注意新技术和新方法的学习和收集,对于有利于运维工作的成功方案及时整理并提交信息技术部。经过5年来的维护工作存储了大量的知识库信息。

三、适应任务需要,及时解决运维过程中的遇到的问题: 1.在运维过程中遇到突发问题及时与信息技术部门相关人员进行沟通,对于紧急情况的处理按照《应急预案》进行对应处理。在节假日安排主要人员进行值班和备勤,保障24小时均能及时相应。2.在运维工作过程中,积极协助新增设备的各项实施工作,获得了信息技术部的肯定;在到货、验收、集成方案和安装调试过程中提供全程保障;对于数据的迁移、备份,各人按照自己的职责,在制定详尽的计划后、经过信息技术部的批准严格按照方案实施; 3.在配合一些公司的重大活动、事件时,为应对信息技术部人员不足的情况。我们一方面做好运维工作的情况下,另一方面派出部分或全部人员协助信息技术部的各项工作,以弥补其人力不足的状况; 4.对于机房的升级改造过程中积极配合,全程派员监理施工过程,及时出具各种施工方案和设计资料。施工完成后及时完善各类图表的变更、标识。5.配合行政部门做好资产管理工作,对于资产管理系统派出专门人员参与学习,并对备份、升级方案及时提出自己的建议;对于办公室提出的节能减排的倡议积极响应,主动采取措施避免能源和材料的浪费;多次配合办公室进行资产统计、巡检、登记工作。

四、认真完成运维工作中的汇报、总结和知识积累工作: 1.《知识库》通过连续2年的整理已经形成了成体系的完整运维知识全集,方便了各类人员通过权限管理可以随时查找所需的运维信息,为提高运维工作效率提供了基础保障。2.日常报告:共提交《运维日报》309份、《运维周报》52份、《机房温度周报》52份、《运维月报》12份、《运维半年报》一份、《运维年报》一份、《桌面工作记录单》1914份、《磁带存取记录表》 12份; 3.工作报告:《变更报告》70份、《故障报告》5份、《数据安全保密措施报告》、《节日值班表》2份、《加班表》1份。另:《磁盘空间使用报告》等不定期报告; 4.图表:《电路电源拓扑图》、《机房及机架布局图》、《网络拓扑图》、《san环境拓扑图》、《电话配线架对应图》、《ip及工位、电话统计图》、《外包人员信息系统登记表》等。5.其他报告:《外包人员信息安全管理建议》、《文件服务器使用管理建议》等。

通过以上的工作和措施,我公司顺利的完成了本期xxxx的运维工作任务,从根本上满足了设备运维的各项要求。任务的圆满完成,有赖于信息技术部正确的领导和大力协助;仰仗于xxxx健康发展的大好形势;得益于双方长期形成的信任与默契。

篇5:IT运维试用期转正工作总结

我于2010年09月07日起正式成为公司一员。

时间飞逝,转眼间,做为一名我友正式员工已经有两个月之久。在这个难忘而又夸姣的日子里,我深入体会到了公司的积极氛围和各个部门的巨大魅力,目睹了公司一步步走向成熟,看到了公司网络的不断健全和系统不断完善,并日渐不乱,同时,也看到了运维中心给于系统管理职员带下世人向往的学习的平台和和无穷的机遇与挑战,所以,我在此对于过去的工作做下总结。总结历史

在运维中心工作期间,我工作认真,具有较强的责任心和进取心,极富工作热情,确实完成上级交付的工作,善于与他人沟通,和公司部门同事之间能够通力合作,关系相处融洽而辑穆,配合各部分负责人成功的完成各项工作,具有很强的团队合作精神。注重自己的个人发展,不断努力学习系统、网站架构知识。所以我现在已经能够纯熟维护公司的系统服务和监控网站架构,包括前段节点,源站各个站点服务的流量信息等,能及时查看并报警所引起的网络服务相关故障,能注重公司的种种流程细节,拥有了一名系统管理维护员的基本工作技能。回顾历史 瞻望未来

在今后的工作过程中,我会更加严格要求自己,同时也有几个大方向是我需要努力。nagios监控系统拥有极其多的复杂服务,它是我的核心工作,它的完成情况反映着我的工作是否尽职。我会努力做好本职工作。还有,cacti监控设备系统,因为时间的分配,有很多多知识未能及时巩固,同时也需要紧抓时间实践操纵,并参加实际建设和规划,使自己能更加灵活应用系统网络知识,并积累处理相关异常经验。同时,自己也要不断努力与充实自己,研究shell,pure各种脚本的编写,使自己处理处理突发事件的效率提高,以及nginx和squid这些常用的服务搭建。在今后的一年里,也会参加相应的证书考核,不断晋升自己,并紧抓利用业余时间努力学习it知识,搭建各种服务器知识,包括自己学习小型机跟进步英语水平。篇二:it转正工作总结 转 正 工 作 总 结

一、试用期工作总结

尊敬的各位领导,人事部的各位同事:

时间过得飞快,从来公司上班第一天到现在不知不觉已经一个月有余,在这段时间里,工作上是忙碌的,精神上是非常的愉快。在来公司的前两周周里,感谢周围同事的帮助,领导的支持和指导,很快熟悉了自己负责的工作内容,迅速的进入了角色。工作完成的非常顺利,和周围的同事也相处的很融洽。在工作中,通过多看多思考多学习,不清楚的地方积极向上级领导请教,与同事们进行沟通,全面了解公司现有it方面状况。日常为公司各部门做好it支持工作,通过自己的经验对现有的情况提出建议和意见,得到了领导的认可,这在工作中给了我很大的动力。在公司未来的it规划建设方面,力求做到专业化正规化,在日常工作中,让it部门成为公司各部门的坚强后盾,积极主动地为各部门解决it方面的各种问题,为自己的部门赢得聊好的口碑。经过这段试用期,我认为我能够积极主动的完成自己的工作,并在工作中发现问题,积极迅速的解决问题。全面的配合领导的要求来展开工作,与同事嫩嫩个够很好的配合和协调。在以后的工作中我会一如既往。对人:与人为善,对工作:力求完美。不断提高自己的业务水平和综合素质,一起为我们公司的发展尽自己的一份力量。

二、试用期期间工作内容 1.来公司的第一周里,和各个部门的同事积极沟通,全面了解公司各部门的it 现状和使用需求。并针对性的提出自己的建议和意见。

2.通过对现有网络设备和服务器的摸底,全面掌握公司it在技术方面的现状,并提出整改意见。

3.与配合行政部门进行固定资产的盘点。通过盘点情况,并根据职级和各部门 的工作特点,制定it采购的标准。做好日常it采购工作。

4.根据领导的要求和制定好的it采购标准逐步更换公司现有的组装电脑。5.根据实际需要,为公司选型安装了新的电话交换机,并将之前采购的交换机 退还给了供应商。

6.为公司新办公地点制定网络、弱电、安防方面的方案,并根据方案与领导和 同事进行沟通,根据预算寻找合适的供应商。

7.根据公司实际需求,为新办公地点办理宽带接入,电话中继线安装事宜。8.日常电脑和网络设备的维护工作。

三、待改进的事项

1.工作中应更加的细心,做事三思而后行。与人沟通要讲求方式方法。2.站在公司的立场上思考问题,要与周围同事形成良好的配合。

3.根据公司的需要,不断提高自己在技术方面的水平,满足公司在it方面的发 展需要。

四、对转正后近半年工作的一些计划 1.制定it管理制度

2.对公司网络管理进行细化,提高网络运行的安全性和稳定性。

3.根据现状,优化公司现有的服务器系统,是服务器运行更加高效稳定。从新 规划、实施服务器配置 4.规划选型文件存储系统

5.为公司选型一套文件加密系统

6.公司oa系统的规划和实施,不断学习这方面的相关知识。7.不断提高自己和下属的工作效率,优化工作的效果。

综合管理部 it负责人马曦冉

2011年11月28日篇三:运维中心的试用期工作总结 运维中心的试用期工作总结

时间飞逝,转眼间,做为一名我友正式员工已经有两个月之久。在这个难忘而又夸姣的日子里,我深入体会到了公司的积极氛围和各个部门的巨大魅力,目睹了公司一步步走向成熟,看到了公司网络的不断健全和系统不断完善,并日渐不乱,同时,也看到了运维中心给于系统管理职员带下世人向往的学习的平台和和无穷的机遇与挑战,所以,我在此对于过去的工作做下总结。总结历史

在运维中心工作期间,我工作认真,具有较强的责任心和进取心,极富工作热情,确实完成上级交付的工作,善于与他人沟通,和公司部门同事之间能够通力合作,关系相处融洽而辑穆,配合各部分负责人成功的完成各项工作,具有很强的团队合作精神。注重自己的个人发展,不断努力学习系统、网站架构知识。所以我现在已经能够纯熟维护公司的系统服务和监控网站架构,包括前段节点,源站各个站点服务的流量信息等,能及时查看并报警所引起的网络服务相关故障,能注重公司的种种流程细节,拥有了一名系统管理维护员的基本工作技能。回顾历史

x月份,是我成为公司正式员工最幼嫩的时期,一直都处在学习阶段,学习公司网站的架构分布情况,以及在系统中各种常见网络服务的搭建,包括学习系统基本的操作,pure-ftp的搭建,php网站的发布,对后台数据库的管理,通过各种熟练的基本操作之后,在此之上,我为迎合公司的发展需求,在网络服务监控方面我准备了各种实战经验;在上级的指挥下,我独自一人自主搭建了新版本软件nagios监控服务器,并通过测试,可以和公司现阶段运行的服务器媲美,在此基础上,为了更好方便的管理,我又研究了nagvis,通过实现对监控设备的3d效果使之管理人员能第一时间更清晰的了解网站后台服务器的负载情况。

上一篇:伤感说说空间说说下一篇:勇气的力量的作文250字