维普资讯 http://www.cqvip.com
变通与计算机2006年第1期 第24卷(总第128期) 基于非完备贝叶斯网络的车型识别方法* 运国莲 陈启美 丁胜军 (南京大学 南京210093) (江苏省通启高速公路管理处 南通226000) 摘要针对BP神经网络等车型识别算法不能很好地适应我国车型复杂状况,分析了贝叶 斯网络(IDS—BN)算法中完备数据集的问题,提出了基于非完备数据集的贝叶斯网络车型识别方法 和车型识别系统结构模块,基于该模块拟定了车型特征变量.构建了车型识别网络模型,并给出了 模型参数学习、车型分类器等算法,包括MDL评分和贪婪搜索的结构学习、EM参数学习、随机模 拟采样推理等。实验表明,该方法识别率较高,鲁棒性好,满足我国车型识别的实际要求。 关键词交通工程I车型识别I贝叶斯网络;参数学习;概率推理 中图分类号:TP391.4 文献标识码:A Abstract:There are some disadvantages of classifiers like BP neural network and Bayesian network method based on complete data sets.First,this paper discusses the complete data sets. Then,it proposes a method for classifying vehicles with Bayesian network based on incomplete data sets,draws up vehicle classification variables,constructs network model of vehicle classification and gives algorithms of model parameter learning and vehicle classifiers,which include MDL scoring and greedy search,EM parameter learning,and stochastic simulation of causal models for probabilistic inference.Experiments show that it has a high accuracy and a good robustness. Key words:traffic engineering;vehicle classification}Bayesian network;parameter learning; probability inference 0引 言 行为等发生变化时,不需对模型进行调整,具有很 好的泛化能力。在图像解释、目标识别、医学诊断、 在智能交通系统中,车型图像识别在交通监 自然语言理解,以及不确定推理和预测等领域得 控和自动收费系统中起着重要作用。汽车车型识 到了成功应用。但在车型识别上,若套用其基于完 别的方法有;BP神经网络方法L1]和回归车型参数 备数据集的网络学习和精确推理算法,则网络结 估计方法[2 等。BP神经网络方法只能处理确定 构学习过于复杂,估计参数甚多,计算量大。由于 的、定量的信息,收敛速度慢,当车型种类增加时, 实际收集训练数据易丢失,又常出现学习过程中 网络结构也要进行大的调整[3 ;回归车型参数估 没有观察到的变量,所以上述算法识别率不高,实 计方法需要获取包括车长、车宽、车高在内的12 用困难。笔者提出一种基于非完备数据集的贝叶 个参数,参数获取较困难,计算量大,仅能用于对 斯网络(IDS—BN)车型识别方法,该方法拓展了贝 较简单的车型进行分类。而我国车辆的构成相当 叶斯网络,应用识别率较高,适用于高速公路自动 复杂,所以很难推广应用。 收费的实际要求。 Judea Pearl提出的基于概率不确定性推理 的贝叶斯网络(bayesian network,BN),将统计数 1 贝叶斯网络基本原理 据以条件概率的形式融入模型,将先验知识和后 贝叶斯网模拟人的认知思维推理模式,使用 验数据无缝结合,克服神经网络仅能处理定量信 一组条件概率函数以有向无环图(directed acyclic 息的弱点和方法表达不够直观的缺点,当条件或 graph,DAG)形式表示不确定性的因果推理模 型。贝叶斯网的信息由两部分组成:①有向无环 收稿日期:2005—11—13 图,即网络结构,包括节点集合和节点之间的有向 *交通部资助项目资助(批准号:2004 353 332 04); 江苏省交通厅科学研究项目资助(批准号:03x003) 边,每个节点代表一个变量,有向边代表变量之间 维普资讯 http://www.cqvip.com
基于非完备贝叶斯网络的车型识别方法——运固莲 陈启美 丁胜军 的依赖关系;②每一节点都附有与该变量相联系 的条件概率分布函数,若变量是离散的,则它表现 为,给定其父母节点状态时,该节点取不同值的条 件概率表(conditional probability table。CPT)。由 于贝叶斯网可表示因果过程的总体结构,故它可 被视作网络各变量的联合概率分布。 利用贝叶斯网络进行识别时,需基于样本数 据构建贝叶斯网络模型,更新领域知识所确定的 局部概率分布(先验参数分布),推算后验参数分 布,从而进行概率推理。利用样本数据由先验知识 得到后验概率分布的过程称为贝叶斯网络学习, 相对于网络结构和网络参数,贝叶斯网络学习分 为结构学习和参数学习;由后验参数分布得到所 要求解的任意的条件概率或边缘概率的过程称为 概率推理。利用贝叶斯网络进行识别的基础是特 征提取,好的特征可以建立更优的网络模型, 使推 理更有效。 ~2 IDS—BN车型识别应用 2.1 IDS—BN车型识别系统模块结构 基于非完备数据集的贝叶斯网络车型识别系 统结构,如图l所示。首先采集图像并用MPEG一2 解码,对图像进行图像恢复、图像分割、二值化、边 缘提取等一系列的预处理,以滤去干扰、噪声,从 中找出清晰的车型轮廓;然后提取有效的车型特 征,根据特征参数建立IDS—BN车型识别模型,确 定学习网络模型参数;最后将模型和参数输入 IDS—BN车型分类器,进行车型分类,并输出车型 识别图像。 图像采集并解码 车型识别 图像输出 图像预处理 二 车型特征提取 。 蠹 …………………一 型 墼………………一j 图1 IDS BN车型识别系统模块结构图 2.2 IDS—BN车型特征提取 由于训练样本数据集不完备,不可能获得需 要的特征变量,如何提取简单有效的车型特征是 IDS—BN车型识别系统设计中要解决的首要问 题。通过先验数据可知,车型识别网络模型可以提 取的特征变量,如表1所列。 在建立网络模型时采用的6个特征变量为 target,Xi,yf, , 和a/b,而且车辆内部上述变 量关系具有相对稳定的结构和状态,这种结构的 固有属性确保了结构学习的可行性。否则,直接从 数据中学习网络结构,不但复杂性高,网络维护代 价昂贵,而且它的估计参数较多,系统方差较高, 影响预测精度。 表1车型识别模型变量 变量名 变量说明 待识别的车辆类型 车辆位置的z方向坐标 车辆位置的Y方向坐标 车辆z方向的速度 车辆Y方向的速度 车辆长度 车辆宽度 6 一≠m 一以 一 车辆的长度与宽度比值 车辆周长的平方与面积的比值 车辆面积的平方 摄像机放大倍数 2.3 IDS—BN车型识别模型建立 网络模型的建立是车型识别系统构建的重要 问题,一个合适的结构不仅使贝叶斯网成为较好 的知识表述,而且会大大降低概率计算的复杂度。 确定6个特征变量及其初步内部关系后,可 采用MDLB]评分和贪婪搜索算法的贝叶斯网结 构学习方法,选择出与样本数据拟和较好的IDS— BN车型识别模型。具体算法如下。 1)建立完全的无向图,图中的节点为变量, 边是变量之间的关系; 2)根据一定的节点序关系,设置边的方向; 3)估计该网络的计分制L(Z,S ): L(B,s) 一∑l蜀 ogP( )+ (1) 式中: 为采样值个数; 为一个6维变量;P(v。) 为由 指称变量值的联合概率;S 为贝叶斯网结 构计算;lS llogm/2为传送S 要求的比特数。 变量值的联合概率P( )由贝叶斯结构S 计 算。 4)改进网络模型。逐步删减连接边,或者调 转连接弧的方向。重新计算L(B,S ),直至搜索到 一个最小描述长度的网络,如图2所示。 2.4 IDS—BN车型识别模型参数学习 参数学习就是确定变量之间关联性的概率参 数,即找到与DAG中每个节点相关的条件概率 表。采用统计遍历方法进行参数学习时只有J[)集 足够大,这个估计值才能很好的接近真值。如果训 维普资讯 http://www.cqvip.com
68 图2 IDS-BN车型识别模型 练数据集不完备,某些变量存在缺失值(也称为隐 藏变量),即学习过程中出现没有观察到的变量 时,学习问题更为复杂。此时,可采用多种方法来 近似。Geman、Kass、Russell等人分别提出了 Gibbs取样方法(一种monte—carlo法)、高斯近似 法(gaussian approximation)和梯度上升法。但这 些方法有诸多缺点,Monte—Carlo法和梯度上升 法收敛速度慢;随着样本数目的逐渐增大, Monte—Carlo法和Gaussian Approximation法学 习越来越困难。 针对非完备数据集,采用了Dempster等人提 出的EM算法进行参数学习,其收敛性好,算法稳 定,实现简单。EM算法是一种迭代算法,它的每 一步迭代由两步组成:E步(求期望)和M步(极 大化),以计算后验分布P( Iy)的众数(即极大似 然估计)。记 (i)为第i+1次迭代开始时后验众数 的估计值,则第 +1次迭代的两步为 E—step:将P( Iy,z)或logP( Iy,z)关于z 的条件分布求期望: Q( 10“ ,y)口E [-log P( Y,Z)O“ ,y]一 广 J Ilog P( Iy,z)P(z10“ ,Y)dz (2) M—step:将Q( 10“ ,y)极大化,即求解O(i+ 1)使得 Q(O“ 10“ ,Y)一maxQ(0 10“ ,Y) (3) 式中:P( Iy)为0的基于观测变量的后验分布密 度函数;P( Iy,z)为添加隐藏变量z后得到的关 于0的后验分布密度函数;P(z10,y)为在给定0 和观测数据y下隐藏数据z的条件分布密度函 数。如此形成一次迭代 一 “ 。将上述迭代进 行至『I “州 一0“ 『I或『I Q(O“州 f0“ ,y)--Q(O“’f 0“ ,y)II充分小停止。 应用EM算法进行IDS—BN车型识别模型参 数学习的基本思想是:首先给整个网络的CPT选 择随机值,并将其作为当前假设h,利用网络结构 和CPT进行概率推理,得到隐藏变量的概率权值 (给定观察数据时缺失数据的值的条件概率),通 交通与计算机 2006年第1期 第24卷(总第128期) 过采样获得这些变量的估计值;然后利用这些估 计值计算出新的最大可能的假设h ,用h 替换h,重 复上述过程,该过程伴随着隐藏变量的估计值,直 至收敛于本地最大可能的假设,即最大可能的条 件概率表。 2.5 IDS—BN车型分类器算法 概率推理是贝叶斯网络要解决的最主要的任 务。贝叶斯网的推理意味着在给定一组证据变量 确定值的情况下,计算一组查询变量的概率分布。 贝叶斯图形模式给定了所有变量的一个完整的联 合概率分布,使用较高阶的联合概率计算低阶联 合概率的方法就能回答所有可能的推理查询。那 么,依据式(4)利用较高阶的联合概率计算低阶联. 合概率的方法可以计算在给定变量取值条件下的 各个车型的概率。 P( f Ix ,y , ,口 ,})一 P(T ,X ,Y , , ,,}) P( ,Y , , ,鲁) P( ,Xf,Y , , ,÷) ————————— (4) P(T ,x ,y , ,詈) 但是,IDS—BN车型识别模型中特征变量取 值范围很大,如y 取值范围为[162,534]; 的取 值范围为[O,323 m/s;a/b的取值范围为[O.57, 1.8o3。而且样本数据不完备,在参数学习中不可 能指定所有的联合概率,更不用说计算低阶概率 了,所以上述方法很难在实际中应用。笔者采用 Pearls和Gibbs提出的随机模拟采样法作为概率 推理方法,计算简单,推理效率高。 首先,为网络上的节点进行初始实例化,证据 节点实例化为观察值,非证据节点实例化为随机 值;然后,开始进行遍历,对每一非证据节点y,计 算在其他节点给定值的情况下y的后验概率分布。 P( IW,)一 ( IPa( ))儿P(sjIPa( )) (5) 式中:W 为除了y的节点集合(实例化);S』为y 的第 个子女(实例化);口为正规化因子;其余乘 积项为条件概率,可查条件概率表得出。公式(4) 表明了本节点的概率仅与其父母节点、子节点及 其子节点的父母节点有关;最后,使用式(5)结果 对节点进行采样,结果作为新的实例化,反复进 维普资讯 http://www.cqvip.com
基于非完备贝叶斯网络的车型识别方法——运国莲 陈启美 丁胜军 行,直到近似过程收敛(设进行了 次遍历),这时 表2部分测试集样本硬测试结果 的查询结果为 一 n P(yle)一i1∑P ( l伽 ) (6) ’ !I 式中:e为证据向量的观察值。 依次计算各个车型的查询结果并比较,最大 者代表的车型即为识别车型。 3 系统测试 注:c一轿车;T-卡车;H.T-重卡;N-噪声。 数据试验在高速公路监控系统上进行,按此 缺点,尤其是在训练数据不完备的情况下仍然可 算法先采集学习样本,训练IDS—BN车型识别模 以建立精确的模型。试验结果表明,该方法在噪声 型,然后对接收到的图像进行车型识别并予标示 环境下具有较好的鲁棒性,可满足我国车型识别 该试验采集了198对样本进行学习,88对样本用 的宴际要求。 于测试,其中,图3(a)为接收到的MPEG一2图像, 接下去的工作将尝试把IDS—BN模型应用于 图3(b)为车型识别后的图像。其样本测试数据如 更加复杂区域内的车型种类车型识别,并期望能 表2所列。 找到更合适的车型识别模型变量,优化车型识别 模型。 参考文献 i周晓红.基于BP神经网络的汽车车型识别方法.微电 子学与计算机,2004(4):39 ̄41 ‘aJ (b) (a)MPEG.2图像 (b)车型识别后的图像 2 Koller D.Moving object recognition and classification 图3车型识别图像 based on recurslve shape parameter estimation.Isreal: Proc.1 2th Conf,Artificial Intelligence,Computer 4结束语 Vision,1993,Dec:27~28 3 Kumar P。Ranganath S。Sengupta K and SO on.Co— 笔者提出了一种基于非完备数据集的贝叶斯 operative multi—target tracking and classification.In 网络车型识别方法,并定义了IDS—BN车型识别 Proc.Eur.Conf.Computer Vision,2004(5):376 ̄389 特征变量,建立了网络模型,采用了EM算法,给 4 Bouckaert R R.Belief networks construction using the 出了随机模拟采样法作为概率推理方法,避免了 minimum description length principle.Lecture Notes 计算复杂、收敛性差、算法不稳定,识别率不高等 in Computer Science,1993(747):41~48 《交通与计算机》杂志2006年继续征订 《交通与计算机》杂志创刊于1983年,现为双月 《交通与计算机》杂志面向广大的交通工程及有 刊,大16开本,国内、外公开发行。国内统一刊号{ 关的计算机、通信、电子技术、信息技术科技人员、大 CN1114/U,国际标准出版物号:IISSN1o0O一8837。 专院校师生以及公路、水运、铁路交通相关行业的领 《交通与计算机》杂志是系统介绍交通行业有关 导、专业技术人员等。欢迎订阅。 计算机应用的方针、、科研成果、经验总结和发 订阅方法: 展动态的刊物。 1)可直接到邮局订阅。邮发代号;38—94。 《交通与计算机》杂志是中国科技论文统计源期 2)可来函向《交通与计算机》杂志社索取订单。 刊、中国科技核心期刊,现被收入中国学术期刊综合评 地址:武汉市武昌余家头武汉理工大学 交通与 价数据库、《中国期刊网》、《中国学术期刊(光盘版)》。 计算机》杂志社(邮编430063)。