客服热线021-62593189

大数据挖掘


1 公共建筑能耗分析中的数据挖掘技术

● 数据挖掘的概念

数据挖掘是釆用数据库技术、机器学习、人工智能、模式识别、统计学、信息学、高性能计算技术、数据可视化等多个领域的科学方法,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,为商业智能系统服务的各业务领域提供预测性决策支持的方法、工具和过程。数据挖掘可以帮助人们从大量数据中发现潜在未知的特定模式规律,并用一种直观容易理解的方式展示出来,从而为诸多领域提供可靠的知识、信息。

●  数据挖掘的过程

数据挖掘过程需要人机交互、反复调整、逐步实现,才能发现高质量的知识,其步骤如下:

①定义问题:划定研究问题的范围,给出研究使用的模型的度量和设定研究目的;

②准备数据:为研究的对象目标数据进行整理,并清除冗余数据;

③数据清洗:清除数据中的噪声数据及与分析任务无关的数据;

④数据集成:去除各数据源的差异性,将多种数据源组合在一起;

⑤数据抽取:从数据库中抽取与分析任务相关的数据;

⑥数据转换:为数据挖掘工作做准备,把数据变换和统一成适合挖掘的形式;

⑦数据挖掘:使用各种智能方法挖掘出有用的知识规律;

⑧模式评估:设定评估标准,验证模型的可用性和性能,评估挖掘出的模式或知识;

⑨知识表示:以直观易懂的方式,向用户展示挖掘结果。

●  公共建筑能耗的影响因子

影响公共建筑能耗的固定因子为建筑面积、层数、外形、结构、材料等,可变因子为室外环境温度、湿度、风速、人员密度、使用强度、使用习惯、舒适度水平、管理水平、设备使用时间、设备操作参数等。公共建筑能耗的数据挖掘,就是把这些因子作为自变量,探究这些因子对能耗的影响规律。


2 数据挖掘工具

对公共建筑能源物联网采集的大数据进行数据挖掘,采用Kettle数据仓库构建工具对大数据进行数据抽取、清洗、转换、装载,形成适合特定挖掘目标的数据仓库,采用的数据挖掘工具为SPSS Modeler软件、WEKA软件、SAS软件、R软件、MATLAB软件等,采用的分析技术为关联规则、分类预测、聚类分析、孤立点分析、决策树、BP神经网络、朴素贝叶斯分析、时间序列分析等技术。


3 数据挖掘在公共建筑节能中的应用

●  不同公共建筑不同工况的能耗预测

对每幢公共建筑建立专属于该建筑的能耗模型,解决不同建筑的个性因素在统一模型中对能耗预测结果的影响无法预知的问题。只要给出专属于某个公共建筑的个性能耗模型中自变量的预期值,即可预测天气等公共因子对该建筑能耗的影响,由此区分天气对不同建筑的影响程度。

●  建立公共建筑的能耗标杆

由公共建筑能耗的影响因子建立的能耗模型在进行能耗预测之后,所得到的相对平稳客观的预测值可以为建筑“应该”耗费多少能量做一个参考。如果由某个建筑的能耗预测函数算得的预期能耗比该段时间能耗测量的真实值高,则说明在一定程度上,该栋建筑做到了能耗的节约,因为实际的能耗不但没有高于预期,还比预期少。反之,则说明按照正常的使用水平,能耗不应该高于预期水平太多,即该建筑在这段时间内,节能工作做得不够好。

●  指导项目优化运行

        采用数据挖掘技术分析项目运行数据后,能够给出节能优化操作建议。例如,对于公共建筑的白天供热,若用风冷热泵机组在晚上谷电时间段生产热水并蓄热,热水温度的选择是节能的关键之一,温度过高将降低冷热泵机组效率,温度过低不能充分发挥谷电蓄热的作用,通过关联谷电蓄热能耗与温度的大数据,即可搜索出不同工况下的最优蓄热温度。能耗数据的应用不仅可诊断建筑物内的用能问题,而且还可利用能耗数据的对比来确定设备是否处在正常的运行状态,通过关联规则发现用户在日常生活中的不节能行为并加以纠正。

●  指导项目局部优化改造

对公共建筑空调主机系统能耗的高位运行进行定量分析后,可提出相应的系统局部优化改造、调整操作参数等节能措施,如按实际需要选择扬程、流量较小的水泵,这些局部改造措施仅需少量投资就能有一定的节能量提升。



地址:上海市长宁区天山西路789号中山国际广场B楼606室 021-62593189