当前位置:首页 > 模拟 > 模拟
[导读]针对交通管理部门积累储存的大量的与交通管理和交通安全相关的数据资源和这些数据资源的使用情况,提出了以驾驶员总量为研究对象,利用数据挖掘技术的发展成果,挖掘这些数据资源的内在联系,服务于相关部门或机构的方法。

1 引言
   
随着国民经济的快速发展和人民生活水平的不断提高,在交通运输业持续发展的同时,轿车大量进入普通百姓家庭.汽车的社会保有量快速增长,使得驾驶员培训学校门庭若市,职业驾驶员、非职业驾驶员大量增加,汽车保险业快速发展,同时交通事故的绝对数量也不断增加。对于诱发交通事故的原因,以及各种原因的概率分布就成为交通管理部门、商业保险企业、驾驶员培训学校等机构普遍关心的问题。
    借助计算机技术和信息处理技术的发展成果,各地交通管理部门不断投入大量的人力物力,建设各种各样的信息化管理系统,如机动车辆信息管理系统、机动车驾驶员信息管理系统、交通事故信息管理系统等。伴随着交通管理信息系统的不断建设、完善与发展,积累了大量宝贵的数据资源,这些信息化系统和所积累的数据资源,对提高交通管理水平起了巨大作用。目前的交通信息管理系统主要任务是进行数据查询或对特定的数据进行简单独立的数字处理,没有对这些大量的数据所包含的内在有价值的信息有效提取。在如何利用这些海量数据资源进行交通事故发生原因及概率分布分析方面,做的工作还很少,使得这些宝贵的数据资源没有发挥应有的作用。对这些进行分析归类和有效处理,从中挖掘出表征交通事故发生的原因及分布概率的内在有用信息,为相关单位或机构提供某种程度或某种方面的决策依据,如交通事故防范、商业保险评估,机动车辆驾驶员培训模式等等。从事物发展具有一定的内在联系的观点出发,结合数据挖掘技术的研究成果,答案是肯定的。

2 数据挖掘技术的基本概念和方法
   
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中识别出存在于数据库中有效的、新颖的、具有潜在价值的、最终可理解的模式的非平凡知识的过程。它利用各种分析方法和分析工具在大规模的海量数据中建立模型和发现数据间的关系。数据挖掘的技术很多,相应的实现方法也很多。一般包括下述几种方法:决策树方法,神经网络方法,概念树方法,粗糙方法,遗传算法,公式发现,模糊论方法,统计学方法.可视化技术,贝叶斯网络等。在不同的领域,针对需要解决的具体问题,需要完成的挖掘主题,采用不同的数据挖掘技术或方法。

3 交通管理信息数据挖掘方法
3.1 需求理解
   
涉及到交通管理信息积累的原始数据很多,存在于不同的数据库中,甚至有些与交通安全相关的某些数据跨行业保存在其他行业的数据库中,如气象部门记录的天气气象数据。这些数据库大多是事务性的数据库,其中的数据各自独立、互不相关。数据挖掘的主题是从这些互不相关的数据中寻找出与交通事故相关的信息,导致交通事故发生的各种因素以及交通事故对各种因素的概率分布。
3.2 数据准备
   
由于机动车辆.机动车驾驶员、交通事故信息管理系统的建设都是针对特定需求建立起来的事务性数据库,其中存放的数据往往不能直接用于挖掘主题的数据挖掘,必须进行必要的数据预处理或数据准备,包括数据选择、净化、转换、数据缩减等工作,获取与挖掘主题直接相关的有效数据。数据准备是非常重要的一个步骤,将影响数据挖掘的效率和准确度以及最终模式的有效性。
    机动车驾驶员信息管理系统主要记录与驾驶员相关的信息,如驾驶员姓名、性别、年龄、学历、驾龄、准驾车辆类别、驾驶证编号、发证机关等;机动车辆信息管理系统记录车主姓名、车辆牌号、型号、类别、颜色、发动机号、车架号、出厂时间、购买时间、车辆用途等;交通事故信息管理系统记录肇事驾驶员信息,如肇事驾驶员姓名、性别、年龄、驾龄、驾驶证编号以及肇事车辆的牌照号、型号、类别等。这些信息有些与交通事故相关,有些信息无关。车辆事故发生的概率与驾驶人员本身有着密切的关系,影响驾驶人员安全驾驶的主要因素包括年龄、性别、驾龄等。数据处理后可得表l所示的与交通事故密切相关的数据记录。

3.3 数据挖掘方法设计
   
数据挖掘算法或数据挖掘技术的选择,依赖于已有的原始数据资源和选定的挖掘主题,本课题所涉及的数据资源储存于不同的事务性数据库中,而确定的挖掘主题是利用数据挖掘技术,对这些大量的数据进行宏观的基础研究,寻求导致各种交通事故发生诸多因素的概率分布,为交通管理部门、商业保险部门、安全教育部门、机动车驾驶员培训部门等行业提供决策的宏观支持。挖掘的方法选用分类模式中的决策树方法,这是分类模式中常用的一种分类器,通过对大量数据进行有目的的分类,从中找到一些有价值的、潜在的信息。决策树方法的主要优点是可以生成可理解的规则,计算量小,可以处理连续和集合属性,决策树的输出包括属性重要性排序。决策树是一个类似于流程图的结构,它包括决策节点、分枝和叶子节点。根据本课题的目标,决策树法采用ID3方法,选择互信息最大的属性作为根节点。表l中有3个决策属性和一个分类属性,决策属性是驾驶员年龄、驾龄和性别,分类属性是事故的有无。ID3算法包括信息熵的计算、属性A条件熵的计算和互信息的计算。
    (1)信息熵的计算
    信息熵的计算公式为:

   
式中,i取值1、2,U分别表示有交通事故和无交通事故样本,P(Ui)表示类别为Ui的样本占样本总数中的比例。
    根据式(1),信息熵H(U的计算算法为:

   


式中P(Vj)表示属性A中取值为Vj的样本占样本总数的比例,P(Ui|Vj)表示属性A取值Vj时,类别为Ui的概率。
    例如,对于驾驶员年龄属性,j的取值范围是驾驶员的年龄范围,约20~70;i的取值范围仍是1、2,表示事故的有无。则驾驶员年龄属性条件熵计算的具体算法为:


    分别计算出决策属性的互信息Gain(年龄)、Gain(驾龄)、Gain(性别)的数值,选择互信息最大的属性作为决策树的根节点。依该属性的取值作为分枝,每个分枝对应一个子集。对于每一个子集,重新计算其所含样本的信息熵、条件熵和互信息,确定该子集的当前节点及其分枝,直到遍历了所有的决策属性,获得全部的叶子节点。叶子节点的数值就是从决策树根节点开始,沿相关路径(分枝)到达叶子节点所包含的样本集可能发生交通事故的概率。
    这样建立的决策树及概率分布就把交通事故与驾驶员的关系清晰地表露出来,同样,也可选择其他挖掘主题如交通事故与机动车辆的关系、与天气的关系等进行挖掘。


4 结语
   
经过多年的发展与积累,与交通管理相关的部门积累了大量的与交通安全相关的数据资源,充分利用这些数据资源,使其为促进经济发展、创建和谐社会服务。数据挖掘技术是开发这些数据资源的有效手段,可以找出这些海量数据之间的内在的规律性的联系,从而为相关部门或机构的宏观决策提供技术支持。与其他相关研究不同.这里的工作基于对机动车驾驶员总体样本的研究,结果会更真实可信,指导意义更强。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

成都2022年10月19日 /美通社/ -- 近期,平安养老险积极筹备个人养老金的产品设计和系统开发工作,发展多样化的养老金融产品,推动商业养老保险、个人养老金、专属商业养老保险等产品供给。 搭养老政策东风 ...

关键字: 温度 BSP 东风 大众

广东佛山2022年10月19日 /美通社/ -- 空间是人居生活的基础单元,承载着生存与活动的最基本功能。而对于理想空间的解构意义却在物理性容器之外,体现出人们对于空间和生活深层关系的思考,同时也塑造着人与空间的新型连接...

关键字: 温度 BSP 智能化 进程

上海2022年10月19日 /美通社/ -- 10月17日晚间,安集科技披露业绩预告。今年前三季度,公司预计实现营业收入7.54亿元至8.33亿元,同比增长60.24%至77.03%;归母净利润预计为1.73亿...

关键字: 电子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市经济和信息化局发布2022年度第一批北京市市级企业技术中心创建名单的通知,诺诚健华正式获得"北京市企业技术中心"认定。 北京市企业技...

关键字: BSP ARMA COM 代码

北京2022年10月18日 /美通社/ -- 10月14日,国际数据公司(IDC)发布《2022Q2中国软件定义存储及超融合市场研究报告》,报告显示:2022年上半年浪潮超融合销售额同比增长59.4%,近5倍于...

关键字: IDC BSP 数字化 数据中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都银行集团成立60周年的纪念日。趁着首都银行集团成立60周年与首都银行(中国)在华深耕经营12年的“大日子”,围绕作为外资金融机构对在华战略的构想和业...

关键字: 数字化 BSP 供应链 控制

东京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式会社(NIPPON EXPRESS HOLDINGS, INC.)旗下集团公司上海通运国际物流有限公司(Nipp...

关键字: 温控 精密仪器 半导体制造 BSP

广州2022年10月18日 /美通社/ -- 10月15日,第 132 届中国进出口商品交易会("广交会")于"云端"开幕。本届广交会上高新技术企业云集,展出的智能产品超过140,...

关键字: 中国智造 BSP 手机 CAN

要问机器人公司哪家强,波士顿动力绝对是其中的佼佼者。近来年该公司在机器人研发方面获得的一些成果令人印象深刻,比如其开发的机器人会后空翻,自主爬楼梯等。这不,波士顿动力又发布了其机器人组团跳男团舞的新视频,表演的机器人包括...

关键字: 机器人 BSP 工业机器人 现代汽车

南京2022年10月17日 /美通社/ -- 日前《2022第三届中国高端家电品牌G50峰会》于浙江宁波落幕,来自两百余名行业大咖、专家学者共同探讨了在形势依然严峻的当下,如何以科技创新、高端化转型等手段,帮助...

关键字: LINK AI BSP 智能家电

模拟

31144 篇文章

关注

发布文章

编辑精选

技术子站

关闭