首先,目前 SCADA 并没有一个统一的标准,各家有各家的特点,功能多寡不一。所以,这里的内容不会涉及到任何一家的具体内容。
我们着眼于数据本身,大多数系统是可以把数据导出成 Excel 、文本之类的数据文件的,我们就在这个基础上动手。
在导出数据的基础上,这个系列会提供两大部分内容。一个是以微软 Excel 作为工具支撑的数据分析方法,不要小看 Excel ,它是很有效的数据分析工具;另一部分,如果您有一定的编程基础会比较好。这部分会应用一些数据分析的软件工具,用简单的编程语言来组合调用这些分析工具去进行数据分析;在工具和方法之外,更重要的是分析的思路。同样的数据,在有思路的人手里就是宝贝,就会变成效益;在没思路的人手里会变得没有多少意义。
以分析数据的思路为载体,以获取有意义的信息或结论为目标,在这样的前提下,给大家分享工具的应用和方法的实施之道。
各个整机厂商提供的 SCADA 变量数目是比较多的,各家情形不一,数百个甚至数千上万个都有。所以,我们要分析数据的时候,面临的一个问题就是如何筛选,这是进行后续分析的关键一步。
这里尽量简明扼要地分享几个筛选数据的原则:
原则 1:从设备侧出发
我们首先要选那些和传感器一一对应,有物理意义的变量,因为这些是设备运行状态最直接的反映。
不管 SCADA 系统如何变化,如何多样,同样机型不同厂家设备的物理测点是趋同的;所以,我们做数据筛选的第一步,是要把这些数据找出来。
并不是说其他变量没有用,而是第一步我们首先要找到这些。
原则 2: 以分析目标为导向
这个原则像是「正确的废话」,但它很重要。分析目标是什么,如何根据目标选变量,这其实需要很多具体的例子。我们会在这个系列文章的后续内容里再展开。
原则 3: 保证完整
选择的一组变量要能够完整反映一个系统的状态。
原则 4: 确保正确
我们在选择变量的时候不能单凭名字或描述,因为名字、描述不一定会错但可能会有歧义,或者有名称相近,也或者有重复的。
所以,要想办法去确认这些是正确的。具体的操作手段有很多,比如,最笨的一个办法就是核对变量的值和传感器的就地读数。稍微好操作些的就是把几个相近的变量放在一起比较,排除那些明显有问题的。
原则5: 排除干扰
干扰项可能来自整个系统的各个环节。当您根据分析得到结论的时候,要有这个意识,是不是存在干扰项。
比如,在分析的时间线上,数据是否完整,对于那些事件型的数据,时序是否正确。这些都需要注意,在后续的内容里,我们会分享一些排除干扰的具体方法。
对于单独的一个人,要同时做到以上几条原则显得有些困难,这要对整个机组,以及各个系统、设备非常熟悉。所以,通常数据筛选的最好方式是团队合作,熟悉各个系统和设备的,熟悉 SCADA 本身的工程师们发挥各自的优势,充分沟通配合,才能更好地做到以上几个原则,从而做好数据分析的这关键一步。
可利用率的常规定义:一个系统处在可工作状态的时间的比例,也称为任务可行率。机组的可利用率,无论用什么样的公式,最终计算的核心是:在一个给定的时间间隔内,
风电机组总的可用时间所占的比例。
有很多文献甚至给出了近 10 种可利用率的计算方法。对于风电场或风电机组,基于时间的可利用率计算总体上来看包括两部分:
第一部分:统计可用时间,或者统计不可用时间,然后求它们和总时间的比例;第二部分:修正,思路是把那些计划检修,电网故障等外部因素引起的停机或不可用的时间对计算的影响消除掉。
事实上,可利用率是可靠性理论里一个高度简化的概念,它基于时间进行计算,以可用和不可用这种非 0 即 1 的方式来定义系统的可用性。
可利用率的这种计算方法特别适用于一个小的执行单元,比如计算机系统里的某一个芯片,网络节点上的某一个设备,因为这些单元确实只有可用和不可用两种状态。
对于兆瓦级大型风电机组这样的系统,基于时间的可利用率计算其实是不够的,虽然到今天为止,我们还是拿这个指标作为评价一个机组的重要参考。
在 2012 年,欧洲业界有研究者提出基于发电量 (Energy) 来计算可利用率:
可利用率 = 实际出力 / 理论出力 (一段时间内)这种计算比上述只算时间要复杂,因为需要关注的量不仅仅有机组状态,还要关注实际出力、风速及风速下的理论出力。
虽然这个提法并没有得到广泛的响应,但我认为它对于我们分析机组真实的运行状况有非常重要的意义。为了说明这一点,我们来看一张图:
这张图是某机组三天内的理论出力和实际出力的对比图,蓝线是理论出力,绿线是实际出力。上图来自欧洲风能协会的报告截图。
如果我们按照常规的基于时间的可利用率计算,这三天的可利用率就是 100%,但是,实际运行中,由于机组内部或外部的因素,它的出力情况并不理想。如果能够按照发电量来计算可利用率,结果就不一样,就能够更全面地反映机组的情况。
我知道,这个提法肯定有很多人有不同看法。但我的观点是,既然所有人都重视可利用率,所有人都追求可利用率,那么我们就应该让这个指标全面立体地反映机组的运行状况,一个正确的指标的重要性是被当代工业界广泛认可的。
一般来讲,出力损失有以下几种:计划或非计划检修,故障停机,电网等外部因素引起的停机,机组负荷被限制,机组性能未及预期等。
基于时间的可利用率只能表正常 Stops 那部分损失,并且表现的也还不全面,因为即使只是故障停机,在不同的风况下,同样停 1 小时,但是影响远远不同。很显然,如果是基于出力进行可利用率计算,则可以全面覆盖以上的损失情况。
我们来看一个结果对比:
各位朋友保持耐心,仔细阅读对比上面的表格。我们看到一月份的时间可利用率是 97.3%,但基于出力计算出来的可利用率仅仅是 75%;这是为什么呢,我们看第四列,这里数据表示的是机组停机时的平均风速,这个值是 14m/s,也就是说,不管什么原因,这个月在那可用的 2.7% 的时间里,平均风速是 14 米每秒。
这就回到了文章开头所设问的那个情景,不同的指标计算结果给人们的信息不同,引出的行为也不一样。好的指标给出真实的反馈,真实的反馈才可能引发正确的措施,正确及时的措施才能带来效益!