数据中心机房运维报告

2024-06-05

数据中心机房运维报告(通用8篇)

篇1:数据中心机房运维报告

数据中心机房建设及运维管理

1.机房建设的目的

为计算机提供稳定的运行环境 保障机房操作人员的身体健康 降低工程造价和运维成本

为计算机提供稳定的运行环境:

四保证:稳频、稳压、不间断、抗干扰 三度:温度、湿度、洁净度

七防:防火、防水、防电磁干扰、防震、防雷、防鼠、防虫

保障机房操作人员的身体健康:

温度、新风、照度、噪音、环保、安全

降低工程造价和运维成本: 设计是关键; 运维是长期投入;

协调平衡二者之间的关系(TCO,Total Cost of Ownership,总体拥有成本)

TCO “总体拥有成本”概念的问世源于1980年代后期Garnter公司的一项研究。

TCO是一项帮助组织来考核、管理和削减在一定时间范围内组织某项获得资产相关联的所有成本的技术。

在实践中,并没有普遍接受的计算TCO的公式,计算TCO的时候,一定要考虑到资产的所有关联成本。如: 购买成本、安装成本、财务成本、佣金、能源成本、维修成本、升级成本、转换成本、培训成本、支持成本、服务成本、维持成本、当机成本、安全成本、生产力成本、风险成本、处理成本。

2.机房建设的内容 供电及UPS电源系统 空调系统、新风系统 装修工程 照明系统 综合布线系统 防雷和接地系统 视频监控系统 门禁系统

火灾报警和自动消防系统 综合监控系统 屏蔽及保密工程

供电及UPS电源系统

机房负载分为:主设备负载、辅助设备负载 主设备负载:计算机及网络系统、计算机外部设备及机房监控系统;供电质量要求高,应采用UPS不间断电源供电以保持稳定性和可靠性。

辅助设备负载:空调、动力、照明、测试设备等。可由市电直接供电。后备发电机、UPS、智能配电柜

精密空调系统

排出设备和其他热源散热,维持恒温恒湿,控制空气含尘量; 新风换气系统

供给新鲜空气,维持对外正压差,避免灰尘进入,保持洁净度。

装修工程

顶面、地面、墙面、隔断 防静电活动地板

隔断:轻薄,隔音、隔热

照明系统

无眩光照明系统

综合布线系统

门禁系统

篇2:数据中心机房运维报告

(4)机房设备布局 ① 尽量缩短 UPS输出配电柜不电源列头柜之间的距离; ② 每列机柜之间的距离,最好符合活动地板的模数,避免 出现<30cm的补边; ③ IT机柜各列之间,宜“背靠背”(“面对面”)排列,形成冷、热 通道,并丏不空调机送风方向平行; ④ UPS、空调机、配电柜、蓄电池组,都要留出检修空间; ⑤ 重要功能的IT设备,宜靠近空调机送风口区域; ⑥ 活动地板下的电缆桥架、线槽,丌应阻挡空调机送风,并丏应 该架设在空调机上、下水管上方; ⑦ 新风机丌应安装在吊顶内,送进的新风应不空调回风混和,新风 出风口下方丌应安装感烟、感温探头和各种机柜; ⑧ 空调室外机安装位置,应该注意:排风无遮挡、进风无热源、噪音丌扰民、配有上下水; 2012区域数据机房建设及运维高层论坛

(5)技术处理 ① 楼板承重: 视功能区划分,300㎏/㎡、500㎏/㎡、1000㎏/㎡ 机房下层加设梁柱、机房地面增加反梁或碳纤维加固等。② 新风进气:可考虑利用楼内走廊、VRV空调。③ 室外机噪音:调整安装位置和方向、增设隔音挡板。④ 机房防水:围封立管、漏水报警。2012区域数据机房建设及运维高层论坛

篇3:网络中心机房的运维与管理

关键词:网络中心,机房管理,运行维护

一、网络中心机房的环境要求

(一) 电气环境要求。

防静电和防电磁干扰是机房电气环境要求的主要内容。由于网络设备内部电路采用大量的半导体MOS、CMOS等器件, 这类器件对静电的敏感范围为25~1, 000v, 而静电产生的静电电压往往高达数千伏甚至上万伏, 足以击穿各种类型的半导体器件。因此机房地板或地面应有静电泄放措施, 如有条件最好安装防静电地板;工作台面宜采用导静电或静电耗散材料。地板支架、机房内所有设备的金属外壳要接地;静电接地的连接线应有足够的机械强度和化学稳定性。工作人员移动设备时要轻拿轻放, 减少因频繁走动产生摩擦进而产生静电。电磁干扰对网络设备的影响不可小觑, 无论对软件还是硬件都可能造成或轻或重的损害。同时, 网络设备本身也会产生电磁辐射, 对临近的电子设备也同样有电磁干扰的影响。因此, 可以通过采用屏蔽、滤波、改良布线方式等方法来降低电磁干扰对设备的不利影响。另外, 选择设备本身具有抗电磁干扰设计的网络设备, 也能起到较好的抗干扰作用。

(二) 温湿度要求。

路由器、核心交换机、服务器等设备对机房温度十分敏感, 要求较高。当温度偏高时, 网络设备散热不畅, 电子元件寿命降低, 易造成系统宕机的威胁, 影响通信线路的稳定、可靠传输。为保障网络设备24小时不间断运行, 严格控制机房温度则显得尤为重要。一般情况下, 机房温度夏季控制在23℃左右 (可上下浮动2℃) , 冬季控制在20℃左右较为适宜。同时, 湿度对网络设备的影响也很大。湿度偏高, 容易造成金属部件氧化腐蚀, 并引起电路板、布线等绝缘材料的绝缘性能降低, 甚至造成电路短路。空气太干燥又容易引起静电, 损坏电路板。一般说来, 机房内的相对湿度应保持在40%~60%范围内较为适宜。

(三) 防尘要求。

服务器、网络设备等在工作运转过程中会产生高压与静电并吸附空气中的灰尘, 电子器件等受灰尘和空气中水分的影响容易造成绝缘性降低和接触不良。由于机房空间狭小, 长年累月线路板上吸附的灰尘会越积越多, 设备在运转过程中出现故障的可能性也越来越大。通常表现为电路板告警。此时, 可通过对电路板重新插拔并清洁插针周围的灰尘使其恢复正常。机房应具有良好的防尘措施和效果, 门窗缝隙、电缆出入口、机房地面、机柜、设备等处都需严格做防尘处理;进入室内的空气必须经过新风机过滤;设立缓冲间, 工作人员要换鞋后才能进入机房, 以最大限度的将粉尘阻隔在主机房区的外面。

(四) 防火要求。

机房应为独立的防火分区, 机房的外墙应采用非燃烧材料。进出机房区域的门应采用防火门或防火卷帘;穿越防火墙的送、回风管, 应设防火阀;机房及楼道内应装有温度烟雾感应器及防火报警探测头。在遇火情时, 系统自动报警并启动惰性气体灭火系统灭火。机房内应配备手提式或推车式灭火器并保证其有效性。机房管理人员必须抱着高度的责任感在日常勤于对线路、危险源进行检查确认来保证。具体包括:制定完善的防火制度;保证疏散通道的畅通、安全标志明显;机房内计算机布局合理, 线道规范;合理正确使用用电设备。

(五) 防鼠、虫害要求。

机房在防鼠、防虫方面如若措施不当, 也极大地增加了设备损坏的风险。当老鼠进入机房后, 不仅咬断电缆、尾纤, 其排泄物更可能直接导致设备损毁。对老鼠、虫害的防护可通过多种防护进行:在机房、设备间门口放置防鼠板;各种孔洞要用防火材料封堵;线槽封闭, 尽量不暴露裸线;线缆出入口以铁丝网封堵较好;机柜门平时保持关闭。同时, 还要严格杜绝食品进入机房。

二、网络中心机房IT设备的运维

设备日常维护主要以预防为主, 防患于未然。在维护过程中善于发现潜在故障, 找出诱发原因, 消除隐患。

(一) 网络故障的分类。

网络故障按其性质可分为物理故障和逻辑故障。物理故障也称为硬件故障, 指设备插头松动、线路损坏或受到强烈电磁干扰等情况。故障表现通常是网络时断时续或完全断开。工作人员可先采取直接观察、插拔等基础方法判断设备声音是否异常, 指示灯有无错误提示等;也可通过程序诊断和仪器检测进行进一步的诊断;或直接用新设备或新模块做替换。

逻辑故障也称为软件故障, 主要是由于设备配置等软件引起的故障, 相对于硬件故障要更为复杂。通常表现为网络协议问题、IP地址冲突等问题造成网速缓慢、时断时续、页面加载超时等。可通过重要数据双机热备份, 重启端口或重新端口配置、IP地址统一分配管理等方式来完成。

(二) 网络故障诊断和排除的一般方法。

排除网络故障要根据故障的表现情况分析可能引起故障的各种原因, 逐一排除, 缩小排查范围, 最终确定问题的症结。首先, 判断该故障是个案故障还是网络整体故障。如果是前者, 往往是由于操作过程不当、权限设置有误或本地计算机故障等原因造成;如果是后者, 则需把工作重点放在集线器、协议转换器、路由器或线缆等特定组件上, 按照通信线路结点依次做环 (包括内环、外环) 检测。必要时, 可联合电信运营商一同排查。其次, 在检查故障过程中, 应及时做好相应的文字、数据、方法等记录, 以便有据可查, 有源可溯;在问题得到解决后还应测试网络效果, 确保该网络故障排除后并未由此产生新的网络问题。第三, 善于归纳、总结和思考, 为以后的网络管理提供数据和经验。

三、人员要求

机房的运维和管理目前还是以智能监控为辅, 人员管理为主的一项工作。因此, 对管理人员提出的要求也是相对较高的。一是增强岗位责任心, 强化服务意识。二是机房管理人员要具备良好的专业技能和职业素养, 熟练掌握各种系统和设备的操作和配置, 在工作中不断积累经验, 努力提高自身知识业务水平。三是关注行业发展动态, 增加与同行工作心得、技术交流的机会。四是机房管理人员应设置A/B岗和有效的管理梯队, 保证机房管理不脱节。

四、网络安全

(一) 安装硬件防火墙。

安装硬件防火墙, 有效保证网络的安全。定期检查防火墙的设置, 查看有没有黑客入侵的行为, 及时做好更新升级工作, 确保防火墙的正常运行。

(二) 安装并更新防病毒软件服务器。

计算机病毒产生非常快, 具有较强的破坏性及传染性, 充分利用防病毒服务器对客户端的防病毒软件进行管理, 自动更新相应的病毒库。

(三) 做好内网和互联网的隔离。

从通信线路上做好机房内、外网交换机的物理隔离。机房中通过内网线路连接的服务器及其他网络设备, 统一分配、绑定IP地址以防他人篡改。

(四) 对常用软件及操作系统进行定期的补丁更新。

常用的应用软件及操作系统一定要做好定期的补丁更新, 不然系统中的安全漏洞就会遭到相应病毒的攻击, 比如蠕虫病毒、冲击波等等就是很容易出现的病毒。可以通过补丁更新服务器对操作系统进行系统补丁的统一分发, 减少维护人员的工作总量。

五、结语

网络中心机房的运维与管理是一个系统性的工作, 需要各个层次上的有效部署和紧密配合。要增强技术能力, 提高管理水平;资源分配要合理并提高利用效率;加强防范措施, 确保机房安全运行等。相信通过这些措施科学地维护和管理机房, 才能达到提高机房运营效率的目的。

参考文献

[1] .电子信息系统机房设计规范GB50174-2008[M].北京:中国计划出版社, 2009

[2] .张成泉.机房工程[M].北京:中国电力出版社, 2008

[3] .辛全民, 贾晓杰.漳卫南局专网通信机房的维护与管理[J].海河水利, 2008

篇4:高校机房的运维管理

关键词:高校 高校;机房 机房;运维 运维;管理

中图分类号:TP308 文献标识码:A 文章编号:1007-9599 (2012) 09-0000-02

一、引言

教育信息化的快速发展,促进了教育的现代化。高校机房承担了大量的实验实践程,随着信息化课程比例的提高,学生课余上网、完成作业都需要使用机房,这就需要高校机房安装相关的软件。系统不稳,机器超负荷,因大学生有强烈的好奇心而更改系统,操作恶意软件等等对运维管理工作带来种种困难[1]。为了确保机房为高校教学科研服务,必须改善其运维管理。

二、高校机房的运维管理问题

当前,高校机房的面临的问题主要是课程多,学生人数多。为了提高学生的动手实际操作能力,符合教改的要求,会安排较多的课内外的上机实验。这加重了高校机房的运维管理任务。第二,学生的使用U盘带来病毒,通过软件工具修改破坏正常系统。上课时聊QQ、玩游戏会影响学生的学习效率。这困扰着运维管理老师。此外,使用年限久,因使用频率高,自然损耗加大。

三、提高运维管理的手段

1.(一)在硬件方面

对高校机房的硬件设备进行日常运维管理,要定期定时清理机房硬件污垢,利用插拔方法手段进行判断,同时也可利用检测工具协助及时发现硬件问题[2]。粘贴醒目提示语,非机房专业管理员禁止移动设备,禁止对服务器进行配置修改,绝对禁止在机房使用黑客工具。

对于显示器的运维管理,在工作的流程如下:

图1 显示器运维流程示意图

第一步,当不显示故障出现,首先查看电源开关,是否正常打开。

第二步,在正常打开的状态下,调节显示亮度,查看亮度是否被调试为0。

第三步,如果亮度也是正常状态,重新插拔电源,听一下是否有加电时的声音。

第四步,如果加电正常,断开与主机相连接的接口,显示器上出现如“no connection”、“no display”类似的信息,可以确认显示器正常,否则,显示器内部出现故障。需要进行电路板级的维护。

对于内存故障,主要是发出长鸣的声音提示。如果经常意外的蓝屏或者系统明显速度变慢需要更换内存才能快速解决问题。一般情况可以先试着用橡皮清理金手指,同时一定要用小刷子清理内存槽的灰尘,这样可以将问题解决。显卡如果有问题也可以参考这种方法,另外还可以通过降低分辨率、安装官方驱动程序来解决显卡的问题。

对于CPU和主板方面的故障,可以打开主机箱看一下主板是否不平,长期在高温状态下工作会造成主板变形。芯片出现问题需要用检测卡来检测,对于CPU故障应该是烧掉了,更换可解决问题。

利用还原卡来保护系统文件和硬盘是当前在机房普遍采用的方法。因为基于底层设计,兼容性好,脱离硬盘工作,不占用常规内存等资源,可对分区及CMOS设置进行保护。不管计算机受到一般病毒入侵还是由学生试验修改,都可以在重新引导后恢复。LENOVO的计算机在硬件保护方面做得非常有影响力。

2.(二)在软件方面

高校机房承担众多课程,进行教学科研使用,机房的规模随着教育信息化的发展在不断的扩大,应用软件升级、操作系统更新,同时,机房计算机受病毒木马攻击、学生对Internet的好奇,恶意操作经常发生,机房管理教师面对上百台的计算机,如果一台一台的修复,势必不堪重负,工作效率大大降低,如何提高机房运维管理的效率,确保学生上课正常使用是每一位机房管理教师值得思考的重要问题。

针对软件故障,可以有两种方法来解决:U盘和Ghost恢复[3]。

随着U盘技术的发展,其容量越来越大,8G、16G、32G的U盘已经是非常普遍,机房管理教师可以利用制作好的U盘作为机房的维护工具。老毛桃,电脑店都是非常好用的制作工具,集成了Ghost、Winpe等。具体制作方法如下:

圖2 U盘启动盘制作流程示意图

图3 启动盘制作过程抓图之一

使用具有启动功能U盘维护系统方法如下:

第一,在需要维护的电脑中插入制作好的U盘。

第二,打开或者重新启动电脑进行BIOS中设置启动项。

第三,选择HDD或者ZIP模式进入启动菜单。

第四,选择启动成功的菜单中的工具进行维护操作或者进入Winpe系统后进行维护。

总之,在高校机房的维护管理中,充分感受U盘启动功能带来的方便,它使用方便,随身可带,随时使用。对于系统引导失败、感染病毒、文件误删除等操作都可以利用一个小小的U盘轻松解决。另外,利用U盘可以集成多款软件于一体,可以进行硬件的修复,单独作为硬盘来运行都可以,部分高校机房通常没有光驱,使用U盘刚好可以解决这个问题。

如果不是各别的计算机维护,如在学期末或者学期开学前对机房进行全面的维护,以确保新学期的教学正常进行,需要使用Ghost软件。它是目前在高校机房进行备份、升级、恢复系统的广泛应用软件。使用中结合DHCP技术可以进行网克,大大提高机房管理的工作效率[4]。

制作流程如下图:

第一,制作母机。将母机硬盘格式化,以免病毒木马被意外带入。母机和工作站的硬盘分区等相关的参数保持一致。对母机的硬盘合理分区,采用NTFS格式对母机进行格式化,可提高其工作的稳定性,为了提高系统性能,对其注册表进行清理,磁盘碎片整理,对全盘进行病毒木马的查杀。将所有需要的应用软件合理安装在母机上,并逐一操作测试,确保正常使用。制作一个安全、稳定、可靠的母机。

第二,制作母机镜像文件。对已经安装好的母盘制作镜像文件,可利用前面提到的U盘对整块母盘制作成GHO文件。方法为:进行winpe系统后,启动Ghost.exe程序,选择disk to image功能。设置母亲的DHCP网络配置,设置Internet协议为自动获取IP和DNS。具体操作方法是:打开“控制面板”—>双击“网络连接” —>双击“本地连接” —>单击“属性”按钮—>双击打开“Internet协议(TCP/IP)”—>选中“自动获得IP地址” —>选中“自动获得DNS服务器地址” —>单击“确定”按钮。

第三,多播Ghost实现。多播Ghost是将前面制作的母机的镜像文件通过网络途径,批量恢复到所有的工作站中,一旦客户端加入到多播克隆的任务中,机房内的所有安装有客户端的计算机就可以同时完成克隆任务。

具体操作描述如下:首先,选择一台计算机作为服务器,安装上有DHCP功能的服务器系统,如windwos server 2003,配置好DHCP服务。安装上GHOST软件,制作网络启动盘,操作方法为:运行ghost.exe,之后选择ghost boot wizard菜单中的 network boot disk,之后直接添加网卡驱动,生成多个具有ghost cast 和tcp等服务网络支持的ghost启动盘,可以用U盘来做。运行Ghost软件中的多播服务程序ghost cast server。输入session name并加载restore image 。在image file中指向母机镜像GHO文件。选择disk中的accept clients按钮以接收客户端。利用引导盘启动工作站,运行客户端,登录到ghost cast上,并选择多点传送方式。最后,当所有客户端登录成功,在服务端单击send按钮,即可开始进行多播Ghost。

第四,自动更改计算机名。收集机房内的MAC地址,建立一个批处理文件,运行之即可。更名完成后,对机房内的工作站进行抽样检查,确认无误后,实施硬件的还原保护。

3.(三)在管理制度方面

为了充分发挥机房的教学科研服务作用,针对授课计划,首先根据人数,专业班级情况合理分配上机的时间和地点。第二,各建立上机日志[5]。由授课教师上课时记录机房的使用情况,故障备注,以便于及时发现问题,解决问题,确定教学顺利进行。同时对上机日志建立档案。第三,对学生上机要求按学号入座,上机记录等各种信息按机号登记,责任明确到个人,减少恶意破坏带来的损失。第四,加强网络信息安全教育。及时升级杀毒软件的病毒库,对学生进行信息安全教育,提高系统的安全性,定期备份磁盘中重要数据。第五,对于使用U盘的情况,学生必须在杀毒后才可以使用。第六,引入学生管理员,协助管理机房。第七,机房运维管理人员加强设备的保养。加强设备及时维护和科学的保养,可以降低费用,相对延长計算机的使用寿命。

四、结束语

高校机房的运维管理繁琐,作为机房管理教师必须不断学习专研新的管理方法和技术,多种方法结合,取各家之长,加强机房运维管理手段,提高其稳定和安全性。才能更好的发挥机房的教学科研之用,更好的服务于教师和学生。

参考文献:

[1][1]文雪巍.浅谈高校计算机机房维护[J].中国科技信息,,2006(,5).

[2][2]戴忠朝.运用Ghost和电子教室软件维护网络机房[J].].中国教育技术装备,,2007(,5).

[3][3]陈经艳.高校计算机机房的管理和维护策略[J].科技经济市场,2007(,6).

[4][4]Joseph Davies(美)著.杨轶,,苏啸鸣,,吴超译.深入解析IPv6(第2版)北京::人民邮电出版社,,2009.6

[5][5]王爱宁..关于IPv4向IPv6过渡的有关探讨..信息与电脑(网络技术),,2009.,12

[作者简介]

篇5:中心机房升级改造报告

市局中心机房是全市地税系统的信息化枢纽。近年来,随着科技信息化建设的不断深入,市局中心机房在数据处理、系统运行、安全管理等方面的基础支持与保障作用愈发显得重要。但目前市局在用的中心机房已经投入使用14年,经过这些年来的不间断运行,机房整体已经趋于老化,此外,在机房空间布局、机房配套功能、机房管理与维护的智能化方面,也不能与日益变化的新形势相适应,急需进行全面升级改造。

在经过多方考察、学习,并进行全面论证的基础上,我们提出了市局中心机房升级改造的初步思路,主要包含以下几个方面:

一、中心机房升级改造的基本目标

中心机房升级改造是一个系统工程,要立足当前工作实际和未来发展的需要,充分考虑近期建设规模与远期发展规划的协调一致,探索把握新形势下计算机机房建设和管理的特点和规律,分析新情况、解决新问题。按照“技术先进、经济合理、实用可靠、节能环保”的要求,建成一个“功能完备、运行稳定、管理规范、绿色环保”的现代化机房。

二、中心机房升级改造的总体要求

中心机房升级改造的总体要求是:布局合理、环境达标、制度规范、管理智能。

(一)布局合理:充分利用建筑空间,统筹考虑各个功能区域的特点,实现一个较为科学、合理的机房布局。

(二)环境达标:房供配电容量充裕、空气温湿度适合、综合布线合理、消防设备齐全、防雷和防静电等符合要求。

(三)制度规范:在原有制度建设的基础上,进一步健全机房各项管理制度,制定机房应急预案,定期进行应急演练。

(四)管理智能:通过应用改造后机房的新功能,实现对机房的智能化管理。

三、中心机房升级改造的初步设计

机房建设将以国家B类标准进行建设,本次机房施工区域面积约为492平方米,初步计划包括主机房区(约103㎡)、主控制区(约21㎡)、数据处理展示区(约105㎡)、办公区(约62㎡)、值班室(约21㎡)等共五个功能区。中心机房建设工程分为以下几个部分:

(一)机房装修工程:主要包括墙体隔断(外贴防静电彩钢护墙板)、吊顶、地板、墙面、门窗、外墙处理、防水以及地面承重加固、形象墙设计等。室内装修应在清洁、环保、美观、实用方面符合相关要求。

(二)机房供配电系统:主要包括机房动力配电、照明配电、UPS配电等。供配电系统应充分考虑未来机房的可扩 展性,预留充分的备用容量。

(三)UPS供电系统:主要包括UPS主机、蓄电池、运行监控系统等,主要为机房IT设备提供稳定可靠的高质量电源,同时可保证在市电断电的情况下可为IT设备提供一定时间的供电。UPS容量应留有冗余,以保证机房的整体需要。

(四)机房照明系统:主要包括机房普通照明、应急照明、无人值守照明等。

(五)空气调节系统:主要包括空调和新风系统等。空调系统应选择机房专用精密空调,并要有冗余备机。

(六)静电与防雷接地系统:主要包括机房本身及所有设备的防静电、防雷及各类接地系统。应满足人身安全及电子信息系统正常运行的要求,并符合国家相关标准。

(七)综合布线系统:主要包括机房内部的结构化网络布线、光纤布线及光纤设备,以及机房机柜、KVM、布线桥架施工等。

(八)视频监控系统:主要包括高分辨率摄像机、嵌入式硬盘录像机等设备,用以提高机房的整体管理和安全防范。

(九)门禁管理系统:主要实现有效防止无关人员进入机房,并可以实时记录下每一位进入机房的人员及进入时间等相关信息。

(十)动力环境监控系统:主要包括温湿度监控、配电 监控、漏水检测、消防报警等。通过预防性、主动式的维护,实现及时处理,降低信息安全风险和设备损失,最大限度减小应用系统的非计划停机可能性。

(十一)消防系统:主要包括烟感、温感、控制器、手持报警按钮设备等。

(十二)机柜及PDU系统:主要包括机房内使用的各种机柜,及机柜专用的PDU电源分配单元。

(十三)数据处理展示系统:主要指通过拼接大屏显示,提供IT设备监控、系统数据信息展示、形象展示等。

四、综述

篇6:关于中心机房购置空调的报告

尊敬的学校领导:

随着夏季高温气候的来临,中心机房环境温度较高,在现有机房空调24小时运行的情况下,机房温度早晨9点就能达到26度,下午3点达到30度以上,机架内部温度长期保持在30度以上。根据《电子计算机场地通用规范》(GBT2887—2000)标准,服务器、网络设备适宜工作温度应在18℃—25℃。温度偏高,易使机器散热不畅,影响电路的稳定性和可靠性,影响系统寿命,严重时还可造成一些配件短路,造成元器件的击穿,从而造成灾难性损坏或火灾等灾害。机房场所不能开窗通风,因为空气中的灰尘对电子设备的影响也较大,灰尘太大会腐蚀各芯片,同时也会产生静电反应。

现有机房空调已经无法满足机房的降温需求,远期来说,如果还要新增设备,设备发热量将更大,机房温度会更高。为保障各类设备的可靠性、安全性,学校信息化设备的平稳运行,急需在学校中心机房新增配置空调。根据学校机房情况,空调的匹数至少需要3匹。参考型号:科龙(Kelon)KFR-72LW/EFVDN2 3匹,立柜式定速家用冷暖空调,价格:6800元。

当否,请批示。

篇7:机房与办公平台运维服务

山东省教育招生考试院数据中心位于济南市市中区土屋路3-2号。

1、高压强电配电室

高压强电机房位于土屋路3-2号院内西侧,建成面积350㎡,由双电源引入,有1路主供电源(由10KV佛欣二线引出),1路备用电源(由10KV荣光线引出),2路电源相互独立,提高了供电可靠性。配电便器共有4台,总容量为4500KVA,全部采用环氧树脂浇注型铜芯干式变压器。

2、UPS配电室

UPS配电室位于土屋路3-2号大楼一层西侧,建筑面积189㎡和山东省教育信息中心共用。由一条380V市电的线路从高压配电室到UPS配电室,经ATS柜分配到开关柜,由两路市电分别到两台UPS,经稳压滤波后再到机房配电柜供IT负载,(UPS型号为艾默生 APM 300的UPS,共128块12V 100Ah的蓄电池)。一路到市电到三楼供动力系统。

3、数据中心机房

本次运维服务的核心数据中心主机房位于土屋路 3-2 号大楼三层。机房总建筑面积 347 ㎡,包括机房一区、机房二区、机房三区、配电间、钢瓶间、缓冲一区及二区。该机房为新建云计算中心机房,属 B 级电子信息系统机房。机房已完成包括装饰装修子系统、空气调节子系统(含新风系统、精密空调、空调给排水系统等)、电气子系统(含防雷、接地、UPS 等)、机房布线子系统、机房环境监控子系统、KVM 子系统、IT 运维综合管理平台子系统、消防报警及灭火子系统共八个子系统。

机房现配备机柜 56 台,上架设备包括惠普刀片服务器、Dell 刀片服务器;惠普存储;华为核心交换机,路由器,H3C 接入交换机等,及 WEB 防火墙、DDOS 防火墙、应用负载均衡、链路负载均衡、日志审计、数据库审计、堡垒机、IPS等网络安全检测设备。后期工程仍将采购大量服务器、存储及网络安全设备。应用系统主要是基于微软云平台系统搭建的混合云管理系统、oracle数据库、weblogic中间件等。

(二)运维内容及要求

1、机房基础环境运维 1)UPS维护管理

保证UPS设备全年7×24小时不间断供电,创建维修文档记录设备运行情况,并形成完整电子文档,包括UPS设备维修维护卡、UPS电池测试记录表、UPS电池放电记录表等,要求每周提交一次。

2)机房专用空调维护

定期检查空调系统的各项功能及参数、检查温度、湿度传感器的工作状态、压缩机和加湿器的运行参数及检查报警记录,并分析报警原因等。保证空调设备全年7×24小时不间断运行,创建维修记录文档记录设备运行情况,并形成完整电子文档,每周提交一次。

3)高压强电设施维护

对高压配电室(双路2250KVA,含高压)和机房关键环境动力设施进行管理维护。制定高压变配电所、分配电室及供配电设施设备的日常检查、巡视、值班、维修保养等各项管理制度,并根据制度对设备进行巡检、值班、维修保养等日常管理工作,制定相关设备的故障处理规定和工作流程,使变、配电日常管理工作井然有序。

2、网络系统维护

主要包括IP地址维护管理、VLAN划分、网络设备配置调整及网络优化、网络系统故障诊断、网络入侵监测、网络性能及资源使用情况检查、网络广播风暴监测、网络病毒监测、临时网络布线和接入服务、网络拓扑图的维护、网络设备档案建设、网络运行日志、服务维护档案、网络运行状况报告,以及网络设备系统软件的升级等。

1)出口网络运维

数据中心将分别接入中国联通、中国移动及中国教育科研网的网络,为解决快速访问数据中心,运维方应提供下列服务:

提供网络管理软件用于监控数据中心的出口情况,对每条线路运行情况和流量情况进行实时统计和记录,根据网络运行情况进行网络优化、调整和管理,保障数据中心的网络出口带宽稳定和通畅。

根据国家“十三五”要求,完成下一代互联网部署的战略规划,并保障高校

学生在研究生考试、自考等报考期间的网络稳定,需提供IPV4/IPV6双栈网络接入,协助申请IPV6地址,提供IPV6实施及运维方案。

2)核心区网络运维

负责数据中心网络设备的维护,每周定期对网络设备的标签及物理连接进行检查记录;需实时监控路由、交换设备运行状况,对路由、交换设备每个端口的流量及设备的CPU、内存等情况进行实时统计和记录,根据网络运行情况进行优化、调整;对交换机的访问控制策略进行严格管理,根据需求随时增添访问控制列表及策略路由;每月进行安全配置核查,每周定期进行配置备份,定期修改密码等操作。

3)网络安全设备运维

负责数据中心网络安全设备的维护,每周定期对网络安全设备进行标签及物理连接进行检查记录;需实时对网络安全设备流量、连接数、规则匹配情况进行实施监控和记录,根据业务运行情况进行实施优化及调整;每天需对安全设备日志进行严格审查、分析,对网络安全设备策略进行严格管理,根据需求及工单系统进行严格添加及管理;每月进行安全配置核查,每周定期进行配置备份,定期修改密码等操作。

3、服务器及存储等设备运维

负责数据中心服务器、存储、光纤交换机等设备的维护。1)设备的监控与管理

对服务器进行监控和管理,包括对IP地址分配,vlan及划分,服务器横向隔离,服务器运行状况,服务器描述、操作系统和中间件、管理员、服务器配置等用户需求信息进行管理。2)设备运行状态监控

通过服务器拓扑图实时监控服务器的运行状态以及服务器上应用的运行状态,包括业务资源、应用的运行状态。3)设备内部监控

监控服务器的运行情况,包括服务器的CPU利用率、内存使用率、磁盘I/O情况、网络流量情况等信息,并且可以根据信息画出跟踪图表。4)设备日志巡检

运维人员每天对所有生产环境下服务器进行实时检查,包括系统资源使用率、应用程序日志、系统日志、服务器温度、软件工作状态、病毒检测,发现异常立即报告。5)知识库归档

以一月为周期,对所有的设备检查记录及故障解决方案进行评审,形成疑难问题处理查询表,纳入支持知识库文档。

①应用系统上线、变更时进行必要的存储及备份。

②每月根据业务系统存储使用情况,对存储进行综合系统优化。

4、云平台运维

1)数据中心云平台采用微软Hyper-V平台,要求驻场人员熟悉微软云平台架构。

2)Windows Server、Hyper-V、Linux、VMware ESX/ESXi Server 等操作系统安装、配置、维护等工作。

3)虚拟机的创建、虚拟机配置的修改、虚拟机管理等日常任务。4)虚拟机的日常管理工作,包括虚拟机控制管理、CPU 内存管理、存储管理、网络管理、故障诊断等。

5)业务期间业务虚拟机24小时监控 每2小时进行业务虚机状态记录 进行比对分析。

5、数据库运维

数据中心数据库为Oracle、MSSQL和MySQL等数据库系统,主要运维工作如下:

1)优化完善数据库管理规范

优化完善现有数据库管理规范,根据应用系统数据库系统和硬件实际运行情况,制定相应的日常管理规范和方案并实施。包括:数据备份恢复方案、数据容灾及演练方案、系统性能监控方案、故障应急处理方案等,要求定期对各种方案进行演练。

2)数据库安装配置

基于AIX、SOLARIS、HP-UNIX、LINUX、WINDOWS等所有平台安装单库、集群、HA(双机)等各种数据库环境,根据系统业务特征、数据量、OS 情况、主机情

况、存储情况、网络情况等定制出最佳数据库配置。

根据日常服务发现的潜在隐患及原厂产品动态,收集补丁信息,提出数据库升级建议及实施方案,并根据用户安排,进行升级实施,并生成文档。

制定数据库、应用服务器安装配置方案;检查软件安装环境是否具备;安装、配置、测试相应系统软件;配合应用系统上线。

3)数据库性能诊断及调优

①使用监控软件尽早发现性能瓶颈,及时调整。②表占用存储的调优。

③对数据安全进行审计及监控,同时随时提供最新BUG信息及补丁升级,负责实施补丁升级操作。

4)数据库数据备份、恢复及归档日志挖掘

每年两次对各应用系统进行备份数据可用性测试演练,每次演练随机抽取应用系统数据进行数据备份恢复,主要包括:

①制定切实可行的数据库备份、恢复及归档日志挖掘方案,验证备份文件有效完整性;

②协助进行应用系统数据恢复演练,通过具体的恢复实验,验证具体的备份是否有效,以及演示如何使用备份进行不同级别的恢复;

③对指定的归档日志进行挖掘,还原操作痕迹;

④周期性评估数据增量、备份时间变化、恢复时间变化,根据变化调整备份恢复策略;

⑤生成全面的备份恢复机制文档、应急处理文档、操作过程文档等。

5)数据库运行监控和审计

实时监控所有数据库的运行及性能,并根据监控中发现的问题启动对应的处理流程。为各种问题和隐患定制处理流程和响应机制。编制系统维护的等级标准和处理流程,保证数据安全,并生成文档记录。

6、中间件运维

1)中间件的安装、配置、运行监控、补丁收集及维护、故障解决、健康检查、系统调优、知识转移、应急处理、系统审计等,并建立日常服务文档。

2)对中间件的日志信息、状态信息、告警信息等进行7*24不间断的监控,有效收集并进行大数据分析,形成调优、加固建议及规划。

3)中间件系统最新安全漏洞跟踪,根据系统的实际运行情况,制订合理的补丁组合、升级和加补丁的实施方案。

4)对系统运行性能和容量变化进行有针对性的定期采样及分析并及时地调整参数配置。

5)做出容量规划,帮助用户随时把握系统的可扩展性。当预计到系统需要升级或扩容时,及时提供完整可行的实施方案。

6)新的应用系统上线时,对中间件进行配置与调优,确保应用系统顺利部署。

7、值班及重大业务保障

实施 7x24 小时机房值守,保证供电、空调、消防、门禁等机房基础设施正常运行,保持机房环境卫生,监控机房各网络、安全设备及服务器运行状况,发现异常应及时处理并做好记录,无法处理的及时向采购人报告,并配合采购人诊断和排除故障。以保障机房环境、核心设备及系统的稳定运行。投标文件中提供值班方案及人员配比情况。

8、管理制度要求

1)对日常运维和定期巡检等主要内容,制定详细的《数据中心运维服务手册》,经采购人审核通过后,按照手册规范实施运维工作,每年根据网络技术和信息安全的发展趋势和运维工作的实际情况定期更新手册内容。

2)制定并不断修订《数据中心运维知识库》,包括日常的设备维护常识、设备特性、使用经验、常见故障处理等内容。

3)制定《数据中心应急响应预案》,经采购人审核通过后实施。4)制定完善的报告制度。

5)对包括资产管理、信息安全等各个方面进行制度制定、优化落实。包括但不限于:

《运维人员管理规定》、《信息资产管理规定》、《机房安全管理规定》、《终端及工作环境安全管理规定》、《数据安全管理规定》、《存储介质安全管理规定》、《信息安全设备管理规定》、《信息系统安全审计与管理评审规定》、《信息系统安全规划方案》等。

9、运维服务人员要求

1)人员要求

成交人需为本项目成立专门的项目组(包括不少于18人的一线驻场团队和不少于15人的二线支持团队),并任命项目负责人,提供项目组所有人员名单、联系方式及投标供应商为其连续三个月缴纳社保的证明材料(加盖社保部门公章)。

项目组成员至少有一人具备IT服务项目经理证书。所有运维人员的各类保险、保障及可能发生的一切责任事故和运维人员人身事故责任均由成交人承担。

2)人员管理

要求针对驻场运维人员的工作提出有效的考核办法,包括奖惩制度、工资和值班补助方案。

现场服务人员要保持稳定,不能随便更换;遇有特殊情况需更换现场服务人员必须提前1个月向采购人提出申请,经采购人许可后,才能更换。并将现场服务人员更换频率作为考核指标。

10、运维培训要求

成交人须对采购人系统管理人员免费提供具有针对性的系统培训,培训次数每年不少于2次,每次培训人数不少于50人次,并在投标文件中提供详细的培训方案(需包含云计算、数据中心、网络安全方面的培训),至少包括如下内容:培训计划、培训大纲、培训人数、培训教材和师资。

11、运维工具要求

1)运维管理平台配备符合ITIL标准的ITSM管理平台软件,在运维工作中优化 IT 服务,包括事件、问题和变更管理、知识库管理、资产管理和用户自助等服务;要求提供截图并加盖公章。

2)IPv4/IPv6一体化网管平台。配备能对IPv4/IPv6两种协议均能进行管理的一体化网管系统,监控设备数≥2000,支持通过ICMP、SNMP协议对网络中的设备进行监控,要求提供截图并加盖公章;要求可以针对数据中心需求进行定制开发,所投产品须为投标供应商自主开发,提供软件著作权证书。

3)成交人应在现场足量配备运维工作所需的维修及清洁工具,设常用五金工具及布线工具工具墙,配备网络寻线仪、网络质量测线仪、光纤测试仪、标签

打印机、穿线器等网络工具。负责承担运维工作所需的网线、水晶头、网线接线子、网络模块等耗材。

4)服务期内更换设备故障配件费用总额 3 万以内(含 3万)由供应商承担,超出部分由采购人承担。

12、运维服务其他要求 1)信息保密要求

成交人对山东省教育招生考试院所有业务有保守秘密的义务,要求签署三方保密协议。

运维服务人员保证遵守国家有关的政策、法律、法规和制度;保证按照工作规范进行工作,凡接收到的重大服务请求在未经用户同意的情况下不得擅自行动。运维服务人员保证不向外泄漏任何业务和相关数据;保证不向外泄漏任何保密的资料。

2)服务责任

篇8:数据库运维安全现状调研报告

调查结果

大多数用户具有对核心数据的保护意识, 在系统架构上更多采用网络隔离的手段保护核心数据库。对内部人员需要授权访问, 敏感数据对外会采用脱敏或加密处理。

调查结果显示, 对于核心生产库的安全防护, 70%的参与者反馈会采用网络隔离等技术手段进行核心数据库的保护, 但仍有近30%的企业尚未采取相关技术手段加以防护。

在提供外网服务的应用系统所用数据库中, 存有敏感数据的比例占到74%。这种情况下, 共计79%的调查参与者反馈, 无论数据库中是否存有敏感数据, 运维人员访问数据库系统必须得到授权。

当敏感数据用于第三方公司进行开发、测试、培训等环节前, 62%的参与者反馈会对敏感数据进行脱敏或加密处理, 但是仍有38%的企业在此方面没有防护手段, 这是导致数据库安全隐患的重要原因之一。

目前所采取的数据库安全管控技术手段中, 数据库防火墙是选择最多的技术手段, 但仍有超半数单位没有使用专业的数据库安全管控产品, 近一半单位不能满足数据库管理制度的要求。

在数据库安全管控手段的选择上, 半数单位已采取专业的数据库管控手段。调查显示, 49%的参与者已部署数据库防火墙或数据库访问管控平台, 但仍有23%只部署了堡垒机, 29%没有采取任何技术手段进行管控。同时, 42%的参与者反馈目前的技术管理手段不能满足数据库管理制度的要求。这与企业没有选择专业的数据库管控手段有必然关系, 对技术手段的认知有待提高。

大部分企业会进行数据库访问审计, 近三成单位只对少部分核心数据库系统进行审计。

关于数据库访问审计的具体范围, 针对所有数据库、针对大多数数据库和不进行数据库审计这三个选项的比例相当, 其中针对少部分数据库进行审计的比例会稍高一些, 占到31%。可见目前大多数用户对于数据库审计接受度较高, 在此趋势下, 小部分未采取审计手段的用户可能被引导。

安全防护建议

综合调查结果, 我们针对数据库运维安全现状, 提供具有实际可落地的安全防护建议。

开发、测试、培训等工作环节中, 使用敏感数据前进行脱敏处理是必要的, 选择专业工具能够提高工作效率, 保证数据处理效果及质量。

大多数用户在数据外发之前, 会采取脱敏或加密手段对敏感数据进行处理, 这将在很大程度上降低数据泄露风险。但目前专业数据库脱敏和加密工具并没有被广泛使用, 用户多选择自行编写程序。当数据量的规模较大, 各数据表、数据子集之间的关联关系较为复杂的情况下, 手工脱敏或加密工作量大, 且处理质量无法保证。这将导致外发数据无法满足开发、测试、分析等业务需求, 影响结果准确性, 同时, 耗费的人力及时间成本往往得不偿失。

专业的数据库脱敏工具可以保持原有数据类型和业务格式, 保证长度不变、数据内涵不丢失, 保持表间、表内数据关联关系, 确保以上业务场景中的脱敏数据真实有效。同时提供动态脱敏功能, 对敏感数据进行透明、实时脱敏, 对数据库用户名、IP客户端类型、访问时间甚至业务用户等多重身份进行访问控制, 提供多种安全策略。

使用专业有效的数据库管控手段可以提供细粒度的数据库运维管控, 满足数据库管理制度要求, 防止危险访问行为。

与堡垒机相比, 使用专业的数据库管控产品, 通过对数据库访问协议的精确解析, 而不是单纯对访问操作进行录屏, 事后追责。

数据库防火墙优势:基于对SQL语句的精准解析, 提供高危访问控制、SQL注入禁止、返回行数超标禁止、SQL黑名单等技术功能, 对于匹配策略的威胁操作实时拦截、阻断, 而堡垒机由于不具备SQL语句的精准解析能力, 无法提供如此细粒度的访问控制。

数据库安全管控平台优势:目前大多数企业使用堡垒机对运维人员的数据库操作行为进行审批, 但对于实际操作的事中控制, 无法监控。运维人员的实际操作是否与申请一致?实际操作人是谁?如果出现误操作, 如何追溯?这一系列问题堡垒机无法解决。专业的数据库安全管控平台在审批通过后返回唯一的操作码, 使用任意客户端建立连接时, 无操作码或与原申请操作不符时, 拒绝访问。提高操作准确度, 防止高危操作及误操作, 弥补传统解决方案对于事中控制的缺失。

运维部门对整体数据库访问行为有必要进行实时有效的监控与审计, 审计产品的风险感知能力、审计效率及审计结果的准确度是重要依据。

传统的网络审计产品无法解析数据库通信协议, 只能通过审计访问来源的IP地址、端口号等基本用户信息判断访问是否合法, 而数据库审计产品对SQL语句的精确解析能够识别每条操作的实际含义, 结合应用行为与用户行为建模分析, 智能判断数据库是否遭到威胁, 实时发出告警。调查显示大多数用户已经局部部署或全面部署数据库审计系统, 在此基础上, 我们更应关注审计产品是否专业, 如数据库流量是否全捕获, 对于长语句、参数化语句等是否能够精准解析, 是否具有风险感知能力, 审计数据是否高效入库, 对审计结果是否能够高效分析及检索。这些关键点决定一款数据库监控与审计产品是否真正具有使用价值, 而不是简单地解决有无问题。

上一篇:春分的民间俗语下一篇:高一上学期总结一