编者按:随着IT技术的发展,当代数据中心对机房基础设施的可用性、适应性和总拥有成本提出了更高的要求,作为数据中心基础物理设施的UPS供电系统,其设计理念和配置方法也在发生着明显的变化。日前,《电源世界》采访了中国电源学会专家委员会主席张广明先生,就新形势下如何科学地规划设计数据中心供电系统等问题做了深入交流和探讨。同时,张主席与陈冀生先生共同撰写的“现代数据中心供电系统规划设计”一文将分为10期,连续刊载于本刊,相信文中叙及的新颖论点和理念能带给读者和相关从业者不少启发借鉴作用。
《电源世界》:最近,您和陈冀生先生共同撰写了“现代数据中心供电系统规划设计”一篇文章,内容很丰富,共分10个专题,请谈谈您写这篇文章的初衷,主要研究和解决什么问题?
张主席:不停电供电概念的出现和UPS设备的产生,至今已经历了五十多年的历程,在这个漫长的过程中,随着IT技术的发展,特别是当代数据中心对机房基础设施的可用性、适应性和总拥有成本提出了更高的要求,作为数据中心基础物理设施的UPS供电系统,其设计理念和配置方法也在发生着明显的变化。供电系统设计理念的变化概括起来有“研究工作从单台设备向整个供电系统变化”、“对系统可靠性的研究向可用性研究变化”、“提高供电系统的适应性”、“集成一体化设计理念”、“系统模块化设计成为供电系统设计的基本原则”等五个方面,这些变化反映了数据中心供电系统技术进步的进程,并全面地指导着供电系统的规划、方案设计、产品开发、设备选型、安装与维护管理的全过程。供电系统所有的这些变化都是紧紧围绕着IT技术的进步和当前存在的问题进行的,变化过程的一个突出特点是其渐进性,新技术新产品的产生到被广大用户认可并接受通常是一个漫长的过程,这个过程有时需要产品的一个或两个生命周期才见分晓。
这个过程之所以如此漫长,除了产品技术本身需要一个成熟过程外,还有用户对新技术、新理念、新设计方法的实践认知过程。在这个过程中,传统的设计观念、对新技术新产品的误解和误导、相关过时的标准条款等,都会成为新技术新产品新理念推广应用的束缚因素。所以,加强新技术新产品新理念的宣传、讨论和技术交流是非常必要的。
为此,我和陈冀生先生联合撰写了“当代数据中心供电系统规划设计”这篇文章(共10个专题),旨在全面介绍现代数据中心对供电系统要求、存在的问题、新的设计理念和规划设计方法,并对高频机、模块化UPS、直流UPS、数据中心节能等业内的热点议题作了专题分析介绍。陈冀生先生长期从事数据中心供电系统规划设计研究和UPS设备的开发工作,对系统模块化设计理念和供电方案有很深的造诣。由他和他带领的团队开发的系列模块化UPS,在功率等级、技术性能方面都处于领先水平,并在数据中心领域得到了越来越多的认可和应用。
《电源世界》:您在文章的前两篇讲的主要是当代数据中心供电系统存在的问题和规划设计方法,您能扼要地讲讲在当代数据中心供电系统规划设计方面存在着什么问题吗?
张主席:在现代数据中心建设的整个过程中,规划设计是最重要的一个环节,规划设计阶段要考虑并确定的因素包括:数据中心业务定位、建设规模、选址、可持续发展能力、可用性级别、经济性和总拥有成本、可服务性等。应该说,规划设计指导和规定了数据中心建设的整个过程,实际上对设备选型、施工安装和运行维护等都做了严格明确的规定;数据中心的绝大多数问题都起源于规划设计。当前不科学的非规范化的规划设计主要表现在两个方面:一是,凭主观臆断确定数据中心规模、预算、建造进度、能耗预期指标PUE;二是,在功能和技术可行性不明确的情况下,首先从工程细节和设备采购入手。要知道过早强调硬件设备会使项目陷入冗长的技术讨论中,而通常这种按照老方法建造的数据中心只能支持老技术,并得出老的结果。错误的开始给许多数据中心设计和建设项目带来巨大麻烦,如何避免高昂的代价,如何避免这些问题,关键是要有并严格遵守的正确的规划设计程序。
数据中心规划设计流程包括五个阶段:确定商业需求目标功率容量(预算范围、扩展计划、关键功能、总体效率、IT需要);基础物理设施规划(选址、机房布局、供电方案、制冷方案、其它);确定用户要求(选择性倾向、约束条件、预算、升级策略、可用性级别、效率和能源利用要求);制定项目计划书;制定工程设计计划。在这个过程中,要特别注意选择性倾向与约束条件的区别,约束条件例如自然环境、资源条件、配套环境、安全状况、建设成本等是不可逾越不可改变的物理条件,而用户的选择性倾向则可能包含了许多传统观念、片面的经验、错误的误导和误解,过分地强调和照顾选择性倾向可能会给数据中心设计和建设带来巨大麻烦,付出高昂的代价,最终建成一个性能低下的不符合用户最初确定的目标的数据中心。
《电源世界》:据我们了解,在业内对高频机UPS和工频机UPS的优劣和应用前景存在着激烈的争论,请您谈谈自己的看法。 {$page$}
张主席:最初的UPS输出逆变器都是带有变压器的。应该说,采用输出变压器是UPS逆变器输出电路形式所决定的,而变压器的存在却是弊大于利。UPS电路技术演变过程的突出问题是:是否必须用变压器以及如何配置变压器。UPS电路技术的进步直接取决于功率半导体器件的进步,50年前UPS问世时,使用的是可控硅(晶闸管),UPS输出带4个不同接线形式的变压器,到双极型功率晶体管以及电子控制级的IGBT等功率半导体器件的出现,UPS经历了输出4个变压器到1个变压器的演变过程。应该说,输出变压器是工频机UPS不可分离的构成部分,而且它的作用也很简单:系统升压和在输出端产生三相四线输出的零线。也就是说,没有输出工频变压器,工频机UPS就无法正常运行,也不能对单相负载供电。在UPS供电系统中,UPS设备的一个至关重要的功能是当输出过载或者UPS逆变器故障时,要自动转静态旁路供电,另外,在系统中还设置了维护旁路,当UPS需要维护时可手动转维护旁路向负载供电。执行这两个操作时,都是由旁路输入三相四线电压直接向负载供电,所以,系统的零线与负载端的零线必须短接在一起。这就决定了带输出变压器的UPS根本不具备系统隔离功能。
随着半导体器件水平的提高和UPS电路技术的进步,就出现了高频机电路结构的UPS,这种电路结构之所以不再需要输出变压器,一是在输入端采用高频IGBT整流技术,不仅完成了系统升压功能,还极大地改善了输入特性,输入功率因数可提高到0.99;二是在输出端采用了半桥逆变电路形式,电路本身提供了单相负载需要的输出零线。当新的电路结构本身具备升压和产生输出零线这两个功能时,输出变压器自然也就没有存在的必要了。高频机(无输出变压器)UPS的性能优势是针对工频机(带输出变压器)UPS由于自身的电路结构而不可能达到的固有缺点而言的,包括成本、效率、重量和体积等,当然还包括在设备电气性能方面的改进和提高。这些与当前社会提倡的降低能源损耗、节省资源(铜和铁)消耗、提倡绿色产品的趋势是一致的。
值得注意的是,业内对这两种电路结构UPS争论的焦点是可靠性问题,就当前情况来看,工频机和高频机的可靠性都达到了较高的水平,我认为关键是使用者对产品可靠性要求的期望值是多大。下面的例子或许可以说明这一问题:马车与飞机相比,谁都知道马车的安全性永远比飞机高。但是,当今的社会人们还是选择了飞机,难道是人们为了舒适和效率而不顾生命安全吗?不是的,人们所以选择飞机是飞机的安全系数已经超过了人们对安全要求的期望值。当前的器件和电路技术决定了带输出变压器UPS和不带输出变压器UPS的可靠性都达到了很高的水平,都超过了人们的期望值,尽管我们不能说不带输出变压器UPS的可靠性比带输出变压器UPS的可靠性还高,但我们有充分的根据说,不带输出变压器UPS的可靠性已经不是问题。
《电源世界》:很多UPS厂商都在开发模块化UPS,但在推广应用中却存在不同看法,用户选用时也就顾虑重重,请您谈谈您的观点,用用前景如何?
张主席:这要从应用的需要谈起,现代信息系统对基础设施可用性的基本要求可用三句话表达:一是,该系统必须能连续工作;二是,一个能连续工作的系统必然是一个能够修复和可快速修复的系统;三是,一个能修复和可快速修复的系统要求组成该系统的所有子系统都必须有模块化功能。
模块的基本特征是:系统中一个功能定义明确的可独立运行的单元;结构上可整体安装、拆卸、更换、移动;相同单元可冗余并机运行。一个螺帽,一条电缆,它们都有独立功能,但系统运行后,由于工具和物理空间原因,无法再对其拆卸,则该螺帽或电缆就不再具备模块化功能,也就是说它是不可修复的。一台复杂的UPS设备,它有冗余并机功能,可在线维护、拆卸、扩容、移动、运进运出更换,则这台UPS就具备模块化功能;一个集装箱数据中心是一个最复杂且集成度最高的模块,它也具备模块化的一切特征。
以上讲的是广义的模块化定义,系统模块化设计是数据中心机房基础设施设计的重要理念和基本策略,数据中心机房设计建造中的很多问题都与系统模块化程度有关。供电系统和设备的设计者首先把模块化设计概念应用到可靠性最低的UPS设备中,这就是模块化UPS。由于模块化UPS同时具备冗余容错和可拔插快速修复功能,所以,我们把模块化UPS归结为可用性级别最高的模块化系统。
用户的疑虑在于他们发现模块化UPS比单机1+1冗余并机的UPS系统的设备故障率高,因此得出模块化UPS可靠性差的概念。其实这是个认识问题,是看问题的方法和观念存在偏差。我们可以从两个方面作出解释和分析:
第一,要全面地看模块化UPS的性能优势。为此,我们首先看一下模块化UPS的体系结构。应该说模块化UPS就是从单机N+1冗余并机发展来的,但它是集成化的N+1冗余并机系统,同时具备可拔插快速修复功能。它把单机N+1冗余并机的输入输出配电、维护旁路、集中静态旁路、并机系统管理等集成在一起,因而带来诸多优势:一是,集成化的优势,省去了现场安装、调试等工作,减少人为错误,可明显地提高系统调试质量,无需再单独购置和安装并机需要的设备,提高部署速度,可缩短建设周期、缩短故障修复时间(发生故障后不再有设备供应上的推诿问题),可优化系统配置,节省机房设备安装的物理空间,并提高管理维护水平、降低运营费用;二是,可热插拔快速修复的优势,故障修复时间是单机冗余系统的1/8~1/10,可明显地提高系统可用性,又因为故障模块是整体更换和回厂修复,可大幅度降低在故障率;三是,提高系统扩展能力,可按需要扩展系统容量,降低设备和备件成本,明显地提高设备工作效率,简化规划、设计、安装流程,降低非设备资本成本。 {$page$}
第二,要明确数据中心供电系统可靠性的定义。数据中心的主体是IT设备,衡量供电系统是否可靠的判定标准应该是是否因供电系统和设备的故障而使IT设备运行受到影响。模块化UPS并联运行的模块数量多,相对于UPS单机而言,其模块故障率自然高,这与UPS单机1+1冗余并机的设备故障率比UPS单机高出一倍是同一个道理,为了提高系统的可靠性,人们宁可采用设备故障率高的1+1冗余并机(N+1系统或2N系统)而不采用单机(N系统)。因此,我们必须清楚这样一个道理:在冗余容错系统中,设备故障不等于系统故障,设备故障率也不再等于系统可靠性。
《电源世界》:当前电信系统在大力推广直流UPS供电系统,这是一种全新的技术,请您谈谈其应用前景如何?
张主席:自从上世纪90年代末计算机及内置电源普遍采用无输入工频变压器的高频开关电源后,业内就开始讨论UPS直流输出给IT设备供电问题,并作了大量设备和系统的研究,也有多篇论文和发明专利发表。应该说,UPS输出直流化是一种必然趋势,优点很多,而真正能促使这一变革付诸实现的原因是直流UPS供电可大幅度提高系统的可靠性。在传统的交流UPS供电系统中,备用电池是通过UPS可靠性的薄弱环节(输出逆变器)向负载供电的,备用电池是UPS设备的一个重要组成部分,如果UPS供电系统故障,则市电输入和备用电池这两路能源都失去作用,所以,UPS供电系统的可靠性就等于整个供电系统的可靠性。而UPS直流输出系统则不然,此时备用电池可直接向IT负载供电,整个供电系统的可靠性相当于“市电+UPS系统与备用电池”的冗余并联,其结果必然能大幅度提高整个供电系统的可靠性。
对直流UPS的研究开发,最关键的是正确的选择直流输出电压值,应该说,直流UPS的输出电压值不是由供电系统规划设计者或UPS厂商决定的,而是IT设备决定的。IT设备的机内开关电源的直流母线电压有两种,其中一种是由简单全波整流做AC/DC变换的是300V,目前这种设备已经被高输入功率因数的PFC电路替代,其直流母线电压是380V。直流电压选择不当会带来一系列不利因素,包括影响IT设备寿命(脱离最佳工作状态)、系统复杂性和成本(能否减少UPS和开关电源的转换次数)、备用电池的利用率、节能效果等。根据当前研究机构、行业和著名IT厂商的研究报告和发布的信息来看,选择380V的有台达电子、法国电信、华为技术、艾默生、爱立信、NTT数据、环境研究所、英特尔、IBM、戴尔、微软、伊顿等,选择300V的是韩国电信,选择320V的有富士通、NEC、日立。
谈到直流UPS的研究和应用前景,我的看法简单归结于以下几点:1、UPS输出直流化改革的难度并不在于直流UPS设备本身;2、这种变革要由供电设备厂商和IT设备厂商共同参于;3、对IT设备的开关电源做相应的变更工作,包括开关电源的输入开关、保险丝、继电保护等要改为直流器件,初期可能要求IT设备同时适应交流220V和直流380V输入,最终是重新定型开关电源,去掉AC/DC变换,只保留DC/DC变换;4、研究和试用是个漫长的过程,通过设备研发、技术改进和试运行,来论证这种变革的技术可行性,通过较长时间的运行实践,考察系统(包括IT设备)的适应性、可靠性、降低成本和节能效果等,有些问题(IT设备的可靠性和寿命)要通过设备运行的一个生命周期才能看出,有些问题要通过一定设备量经过一定时间运行的统计数字才能得出结论,标准更要在以上问题得出结论并在业内得到普遍认可的情况下才能制定。总之,UPS输出直流化是数据中心供电系统的一次重大变革,目前已进入改变观念、技术研发、方案论证和系统试运行阶段,这是一个可喜的开端。<