我们力求突出那些基本的最佳实践,这些基本经验对于确保新项目或整个站点真正可以进行实时操作和交付客户服务至关重要。目的是防止将未完成的项目交给运营交付和站点管理团队,并避免可靠性问题以及利益相关者或客户的不满。如果未能将下面列出的所有元素都安装到位,可能会直接威胁站点的运行可靠性,并可能导致长期的可靠性问题。这些最佳实践应涉及所有站点管理团队,包括但不限于设施工程/运营管理和IT硬件管理团队。
数据中心项目或建筑物优化验收
在未按照预先确定的标准对项目,区域或建筑物进行正式验收的情况下,现场运营管理团队不应对“已完成”的建筑区域承担任何责任。这应该包括正式的签字和移交过程,涉及负责现场操作和持续现场可靠性的团队。至少应包括以下元素:
移交已授权的《实用完成》文档,其中包含所有未解决的问题(“拖延清单”),并注明并同意为站点运营团队提供完整而准确的资产清单。完整的调试程序已成功完成,包括集成系统测试(IST)在内,所有调试记录均已完全更新并可以使用。
所有新系统都已完全集成,正确调试并证明可与现有系统一起正常工作。移交应包括所有调试记录和操作文档,以及所有控制系统的详细信息和维护要求。所有新系统均应通过随附的维护时间表和维护程序文档证明其功能正确且可适当维护。
0&M,H&S手册和CDM文档的所有硬拷贝和软拷贝在承担任何运营责任之前,必须在现场运营管理团队之前进行更新,更正并完整地提供。
运营团队可能需要进行验收测试,以确认可维护性,并且运营团队在接受新系统的适当培训并确信自己的系统正在运行并且能够得到适当维护之前,不应承担任何管理责任。现场管理团队应有机会在现场生产操作开始之前很好地招募和培训员工。理想情况下,核心现场运营人员应在调试期间在场。
文档
以下是在移交给现场运营之前应提供给站点管理团队的关键文档列表:
1、最新和准确的“竣工”记录
2、工程单线图
3、全套手册,包括SOP,MOP,EOP,升级程序等
4、全面的调试记录
5、最新且准确的资产登记册
6、记录在案的计划维护时间表和全套维护记录
7、所有符合法定法规所需的文件(QHSE等)
8、符合自愿性标准和证书所需的所有文件
9、授权/认证和员工培训记录
10、所有部门的完整角色和职责矩阵
11、客户和供应商合同明细,OLA和SLA等。
数据中心运营报告
报告是数据中心运营和管理的关键要素,应始终考虑企业和受众所要求的信息类型。仅出于报告目的,报告毫无意义,但准确而集中的报告对于监视和管理运营绩效至关重要。
生成的报告类型通常包括:
1.内部数据中心运营团队管理报告。这些是最详细的报告,可为数据中心运营管理人员提供根据业务需求微调正在进行的站点操作以及管理外部供应商和承包商所需的信息。这些报告通常还将包括对容量和资源利用率以及能源,成本和总体绩效指标的引用。
2.高级IT管理报告。这些通常会提供有关在较高级别上如何有效运行和管理数据中心的信息。该报告将有固定的内容;运行率,响应时间,故障率,SLA合规性,成本和能效等。
3.通过引入“例外报告”?可以减少报告开销。通过根据一组明确且明确定义的度量标准和关键绩效指标(KPl),在异常的基础上证明信息,这可以减少细节和资源开销。这些通常包括指出的对站点操作,设备故障,健康和安全事件,供应商性能问题,客户投诉,重大停机或主要计划工作项目等方面的突出风险。这些例外可以以简化的仪表板格式表示。
报告将始终构成站点运营和管理总体框架的组成部分。
考虑到这一点,建议在正式移交和开始现场操作之前确定报告时间表。时间表应既确定要包括的细节,又确定报告的定期发送。报告可能基于每周和每月的时间表,并根据所需和认为适当的内容提供支持的每日公告。商定的时间表应始终考虑创建和传播这些报告所涉及的资源开销。
考虑到这一点,建议在正式移交和开始现场操作之前确定报告时间表。时间表应既确定要包括的细节,又确定报告的定期发送。报告可能基于每周和每月的时间表,并根据所需和认为适当的内容提供支持的每日公告。商定的时间表应始终考虑创建和传播这些报告所涉及的资源开销。
还建议每月定期召开服务审查会议,以检查整个数据中心站点的总体服务水平。这些内容应包括根据合同要求和商定的SLA衡量向客户或内部利益相关者以及外部供应商或承包商的服务交付。