我国火灾统计数据的聚类分析

王旭军

(河南省消防总队郑州支队,河南 郑州)

摘要:采用聚类分析的方法对2012-2014年全国31个省、自治区、直辖市火灾统计数据的基础上进行分析处理,将其分为3类,并讨论了经济发展水平、消防投入、消防宣传与地区火灾损失之间的关系。分析结果,除北京等少数地区外,大部分地区火灾损失同经济水平之间为正相关关系。以北京地区为例,利用灰色模型预测今后两年火灾发展趋势,排除这种趋势由偶发因素造成的,并结合北京总队采取的措施,为其他地区预防火灾提供理论依据。

关键词:火灾统计;火灾损失;聚类分析;灰色模型

1 引言

随着中国经济的增长,城市进程不断加快,越来越多的高层建筑和地下建筑出现在大、中型城市,虽然减缓了人口增长给社会带来的压力,但是火灾危险性也不断增大。近年来,群死群伤事故频发,火灾逐渐成为了危害人们生命财产的主要灾害,研究和预防火灾十分必要。

国内外学者针对火灾损失同社会经济因素之间的关系做过不少研究,吴赤蓬用系统分类法将各个地区1992-1998年的火灾数据进行了聚类,从直观上讨论了经济和火灾危险程度的关系。

本文以火灾发生次数、死亡人数、烧伤人数以及火灾造成的直接经济损失4项指标为依据,在描述全国31个省、自治区、直辖市2012-2014年火灾统计数据的基础上,讨论了经济水平、消防投入、消防宣传力度与地区火灾损失之间的关系。

2 数据来源

文章运用到的火灾统计数据,数据来源为中国统计年鉴2012-2014,采用3年数据的平均值,表1对31个省、市、自治区进行编号。

表1 2012~2014年各地市火灾情况

3 数据处理

采用聚类分析的方法对上述数据进行处理,从统计学的观点上来看聚类分析是通过数据建模简化数据的一种方法。在分类的过程中,人们不必实现给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。本文利用spss软件中的k-均值分类方法进行处理。

(1)首先确定分类数目k,取前k为3,及取数据编号顺序中的前三个数据作为凝聚点;

(2)剩余的28个数据逐个进入,每进入一个样品将它归入最近的凝聚点的那一类,随即计算该类的重心,将重心代替原凝聚点;

(3)这31个数据再从头至尾输入一遍,每进入一个样品,将它归入最近的凝聚点的那一类,重新计算该类的重心,以重心替代原凝聚点,如果31个样数据通过后,所分的类与原来没有改变,过程停止,否则重复上述步骤。

4 聚类结果

对处理后的数据用k-均值方法来聚类,3类的中心列于表2。聚类结果见表3。

表2 聚类的中心

表3 聚类结果

注:表中1代表火灾损失最小,3代表火灾损失最大。

同理采用上述方法,对各地的经济水平、消防投入、消防宣传次数进行了聚类分析,其中消防投入考虑到了各地市消防站、消防车、消火栓的投入情况。见表4。

表4 聚类分析结果对比

注:表中经济水平1代表发展较为落后地区,3代表发展较为迅速地区。

聚类结果,根据各地区的具体情况,将31个省、市、自治区分为3类较,其中。第1类是北京、天津、黑龙江、福建、河南、广西、海南、贵州、云南、西藏、青海、宁夏。第2类是河北、山西、内蒙古、辽宁、吉林、上海、苏州、浙江、安徽、湖北、湖南、重庆、四川、陕西、新疆。第3类为广东。

结果中,第1类中,河南、福建、广西等地区经济状况不如另外两类地区好,城镇居民年平均生活消费支出较低,因此火灾经济损失较小。

第2类江苏、上海、浙江等地区个体企业及其从业员工多,是火灾频发、伤亡惨重的原因。但该类中的内蒙古地区较为特殊,2011年内蒙古拿到中央扶持政策意见,迎来“内蒙古之春”,人们更多地把经历投入在了经济发展上,人员受教育的程度和文化水平不高,虽然生产程度较低,但因用火不慎引起的火灾较多,再加上防火意识淡薄,消防基础设施建设很差,导致近三年内,内蒙古发生火灾此处位居全国榜首。

最为特殊的是第3类广东省,虽然近三年内,广东省发生火灾的次数并不是最多,仅次于内蒙古居全国第2位,但是经济损失严重,死伤率高。由于广东省属热带、亚热带季风气候区,常年温度高;改革开放以来各项政策的支持,经济突飞猛进,GDP一直保持全国榜首,各地打工者不断涌向广东,造成广东省人口随之迅猛增长,以至于广东省发生火灾后的经济损失最为严重。

除北京、天津、黑龙江地区之外,大部分地区火灾危害与经济发展水平成正相关性。以北京地区为例,为确保这种负相关性不是偶发原因出现的,现以2009年至2012年北京地区的火灾数据为基础,运用灰色模型进行预测未来两年内火灾危害的趋势。

5 灰色模型预测

在北京地区2011年~2014年的数据的基础上(见表5),运用灰色模型进行预测北京地区今后火灾情况。

表5 北京地区2011~2014年火灾数据

设发生次数、死亡人数、受伤人数、直接经济损失为四个序列,分别如下。

对这些数据进行去量纲处理,以每个序列第一个数据为1,将之后的数据分别除以第一个数据得到新的序列:

以发生次数为例,通过累加形成新序列:

则GM(1,1)模型相应的微分方程为:

其中:a称为发展灰数;u称为内生控制灰数。则,可利用最小二乘法求解。其中:

解得:

求解微分方程得预测模型:

经预测模型计算得到新的数列:

ρ=0.5,计算关联度γ=0.608,满足要求,所以可以预测得到北京地区2014年火灾发生次数为1597次,2015年火灾发生次数为1260次。

6 结论

预测模型结果显示,北京作为国家首都,人口众多,火灾危险性大,在全国各地群死群伤事故频发的大环境下,北京近年以及今后几年内火灾发生次数却呈逐年降低态势,这种趋势并不是偶发因素造成的。

近年来,北京消防总队与政府协调合作,采取强有力的管理措施,不断加强对企事业单位消防责任人的培训工作,不断创新提高公民消防意识的宣传工作,不断落实对消防部队内部整顿的责任倒查机制。使得各单位内部的消防设施不再是摆设,使得公民时时刻刻运用防火安全知识来处理身边潜在的危险,使得消防部队人员工作中不再走过场。APEC会议期间,北京火灾发生次数同比去年降低79%。由此可见,为降低火灾造成的财产损失和人员伤亡,加大对消防的投入,加强全民消防安全意识的提高,是重中之重。

参考文献

[1] 吴赤蓬,王声勇,刘国宁. 我国火灾发生情况的聚类分析[J]. 预防火灾文献信息. 2001. 2(7):4-7.

[2] 国家统计局. 中国统计年鉴(2013)[M]. 北京:中国统计出版社,2013. 62-78.

[3] 国家统计局. 中国统计年鉴(2014)[M]. 北京:中国统计出版社,2014. 65-78.

[4] 国家统计局. 中国统计年鉴(2015)[M]. 北京:中国统计出版社,2015. 79-81.

[5] 陈子锦. 我国火灾统计数据的聚类分析[J]. 中国工程科学. 2007. 1(9):86-94.

[6] 郑锋. 城市火灾危险性的灰色评估[J]. 消防科学与技术,2009,28(4):220-225.