项目基本内容 |
[主要研究内容]:
本项目围绕桥梁养护数据的深度利用,研究联合多类别系统的数据集成,建
立了面向主题的桥梁养护数据仓库,实现各种数据挖掘算法,进行数据挖掘技术
的应用。主要研究内容包括了:多类别系统的数据集成,解决数据源选择、信息
连接机制的问题,进行跨系统的信息关联;确定数据挖掘分析主题,选取适合多
源、异构数据集成数据仓库的平台,解决数据仓库架构选型、数据筛查及修正的
问题;解决数据挖掘的软件实现和养护数据的挖掘问题,从桥梁缺损影响因素分
析、桥梁常见伴生病害分析、桥梁性能退化模型等方面,通过关联分析、聚类发
现等各种挖掘算法,实现数据分析利用的目的;对桥梁养护数据库的架构模式、
数据仓库的建立方式、数据挖掘的应用方式进行了规范、规定,建立了相应的架
构指南。
[主要研究成果]:
(1)作为知识发现的核心部分,数据挖掘可以从大量累积的数据中发现隐
含的、有意义的模式,从微观到宏观,在不同的概念层次上实现知识发现,满足
不同用户、不同层次决策的需要。典型的数据挖掘包括了分类分析、关联分析、
聚类分析、序列分析、概念描述和异常点检测等方面。
(2)数据挖掘始于问题定义,通过确定挖掘所需的数据源,对数据源数据
进行清理、集成等处理后形成数据仓库,然后选择合适算法利用仓库数据建立挖2
掘模型。为了保证挖掘出知识的有效性,需要结合专家经验对挖掘出的知识进行
解释评估和检验。
(3)数据挖掘对象包括了来自于多个桥梁管理系统的桥梁基础信息、病害
数据、状态数据、监测数据、交通量数据、环境数据等多来源信息。数据库的海
量数据中既有噪声数据、空缺数据,又存在数据不一致现象,为保证数据的质量
可靠、完整,在数据挖掘之前首先需要通过环境参数的回归分析、离群点分析、
属性变换、零—均值规范化等方法,对数据进行预处理,从而清除数据中的噪声、
纠正不一致数据、压缩数据维度。
(4)统计分析是数据挖掘中最基础的应用之一,将桥梁数据库中技术状况
等级、桥梁病害类型及程度等相关数据进行汇总分析,可以以直观、浅显的量化
数字及简明的图表展示桥梁现状。发现不同地区、不同线路、不同桥龄、不同桥
型的桥梁技术状况总体差别;分
析不同类型桥梁病害的类型、程
度。不同桥型的病害最多的构件
基本均为上部承重构件,但装配
式组合箱梁桥病害最多的构件
却是上部一般构件中的湿接缝,
支座和伸缩缝装置也是桥梁的易损构件,下部结构病害相对较少;大部分桥梁均
以外观病害和非受力型裂缝为主,但依然存在不少的受力裂缝,且部分裂缝较为
严重,说明干线公路桥梁的养护工作依然较为严峻;随着桥龄的增大,桥梁耐久
性病害发生的可能性和数量都有所增加,管理者对桥龄较大的桥梁关注度应相对
增加。
(5)随着监测桥梁的增多,江苏省将形成省级区域的监测网络,以监测周
期(年、季度、月)的最大值、最小值及平均值三个监测参数为基础,构建监测
数据的异常度指标、振荡值指标和动向指标三个指标来进行监测数据的特性描述;
以换算的当量交通量、交通重载系数描述桥梁荷载参数的情况。这些指标可以与
状况指标相结合,更加直观地进行桥梁状况、耐久性分析,以及桥梁长期性能的
跟踪观测。
(6)聚类分析根据最大化类内相似性、最小化类间相似性的原则进行大量3
数据点集合地分组,使得每个类中的数据之
间最大限度地相似,不同类中的数据最大限
度地不同。桥梁监测数据量较大,且包含了
各种原因导致的噪声数据,引入聚类分析进
行异常数据判定,发现并剔除监测数据中较
大噪声,可以保证分析数据的可靠性。
(7)桥梁监测数据和交通量数据均属于按时间顺序排列的、随时间变化且
相互关联的时间序列,序列往往采用等时间或空
间间隔进行度量。通过时间序列的 ARIMA 模型的
预测函数对桥梁监测数据进行分析,可以获得桥
梁结构参数的变化趋势,发现桥梁结构参数的异
常变化。预测结果显示:时间序列可以预测结构
参数的未来值,且短期内预测精度高于长期,长
周期预测精度高于短周期;以预测值 85%的置信率设置结构参数的阈值,可作为
结构预警的参考。
(8)关联规则挖掘的主要目的是从大量的数据中寻找一个事物与其他事物
之间的关联性;分类分析是根据数据间隐藏的规律进行分组归类。通过桥梁养护
数据关联分析和分类分析,可以发现结构构件与桥
梁属性两者之间隐藏的关联网,发现桥型、建设年
代、地理位置(线路)等外界因素与桥梁已产生病
害类型、程度等情况的相关性,桥梁病害之间的伴
生关系,不同类型病害对桥梁整体技术状况影响,
不同构件类型间的技术状况的互相影响。
(9)人工神经网络是数据挖掘中一种高效的
分析方法,具有自适应和学习能力,往往可以根据数据的变化动态地改变网络结
构和参数,得到更符合实际情况的知识和规则。利用神经网络强大的非线性映射
能力,可以建立较高精度的构件等级评分与桥梁总体评分关系,建立桥梁病害与
构件状况之间关系,最终可以实现利用数据库养护信息的桥梁技术状况、耐久性
能状况等自动评估。4
[标准、指南、 工法、 专利、 论文等成果]:
1、 指南:《公路桥梁养护多源信息系统数据挖掘技术指南》
2、 论文: 1)《桥梁养护大数据的挖掘技术综述》
2)《基于时间序列分析的桥梁应力监测预测》
3)《基于聚类分析的桥梁监测异常数据处理》
[主要创新点]:
(1)深度利用桥梁养护数据,联合多类别系统的数据集成,建立桥梁管养
运营数据仓库,开展面向主题的数据挖掘技术应用。
(2)使用聚类分析、关联规则发现、时间序列分析、分类分析、神经网络
等挖掘算法对桥梁数据进行常见伴生病害关联性分析、状况影响因素分析,并对
发现知识进行检验、评价和解释。
[研究成果的科学意义及应用前景]:
课题通过研究多类别系统的数据集成,解决数据源选择、信息连接机制的问
题,解决数据仓库架构选型、数据筛查及修正的问题,解决数据挖掘的软件实现
和养护数据的挖掘问题,通过关联分析、聚类发现等各种挖掘算法,实现数据分
析利用的目的。围绕桥梁养护的安全性、耐久性和适应性目标,从现有桥梁管养
系统的海量信息数据中进行知识发现,达到了利用现有桥梁养护数据的目的,对
桥梁辅助养护决策的制定具有重要的指导意义, 并且为以后桥梁养护数据深度研
究提供了思路和方向,具有十分重要的现实意义,也具有显著的经济和社会效益,
可在桥梁养护管理系统数据处理中进一步推广应用,具有广阔的应用前景。
该课题2017年4月通过江苏省交通运输厅组织的验收,其成果鉴定为国际先进水平。 |