第34卷第1期 计 算 机 学 报 Vo1.34 No.1 2011年1月 OF C0MPUTERS CHINESE JOURNAL Jan.2011 无线传感器网络中基于熵评判的关联支配集构造算法 于瑞云” 王兴伟 ”(东北大学软件学院沈阳 (东北大学信息科学与工程学院 沈阳 l10819) ”(德克萨斯大学阿灵顿分校计算机科学与工程系 美国德克萨斯76019) 摘 要无线传感器网络通常是密集分布的,因此相邻网络节点感知的数据之间具有很大的相关性.为了在无线 传感器网络中进行数据冗余缩减,文中提出了一个基于熵评判的关联支配集构造算法(EECDS),算法首先通过评 价高斯随机变量的熵值来判断网络节点间的数据相关性,然后分布式地构造一个关联图,最后根据关联图信息移 除网络中的冗余节点,构建一个连通关联支配集.基于连通关联支配集的数据采集策略能在密集无线传感器网络 中进行高效的数据冗余缩减,显著降低网络的能量消耗,延长网络的生命周期. 关键词无线传感器网络;信息熵;微分熵;关联图;关联支配集;冗余缩减 TP393 DOI号:10.3724/SP.J.1016.201l_00087 中图法分类号刘 永㈣ Correlation Dominating Set Construction Based upon Entropy Evaluation in 和 Wireless Sensor Networks YU Rui—Yun” WANG Xing—Wei。 LIU Yong—He” (Software College.Northeastern University.Shenyang 110819) (College oJ Information Science and Engineering,Northeastern University,Shenyang 110819) 。 (Computer Science and Engineering Department.the University of Texas at Arlington,TX 760l9,USA) Abstract Wireless sensor networks are usually densely deployed,SO the data sensed from neigh— boring sensor nodes is highly correlated.For redundancy removal in wireless sensor networks, this paper presents an algorithm named entropy evaluation for correlation dominating set con— struction(EECDS).The algorithm first determines the correlation degree between sensor nodes by evaluating the entropy of Gaussian random variables,and then distributively generates a corre— lation graph.Based on the correlation graph,the EECDS algorithm finally constructs a connected correlation dominating set by removing redundant sensor nodes.Data gathering policies with the help of connected correlation dominating sets will greatly reduce data redundancy of dense sensor networks,and therefore result in decrease of energy consumption and prolong lifetime of wireless sensor networkS Keywords wireless sensor networks;information entropy;differential entropy;correlation graph}correlation dominating set;redundancy removal 收稿日期:2008~¨一20;最终修改稿收到日期:2010-12—20.本课题得到国家自然科学基金(61070162,71071028,60802023,70931001)、高 等学校博士学科点专项科研基金(20100042110025,20070145017)、高校基本科研业务费专项资金(N090504003,N090504006, N100417001)和辽宁省博士科研启动基金项目(20101040)资助.于瑞云,男,1974年生,博士,讲师,主要研究方向为无线自组通信、无线 传感器网络、多传感器数据融合等.E mail:yury@mail.neu.edu.el1.王兴伟,男,1968年生,博士,教授,博士生导师,主要研究领域为下 一代互联网、移动Internet和IP/DWDM光Internet等.刘永和,男,1974年生,博士,副教授,主要研究方向为无线组网、传感器网络、安 全、系统集成等. 88 计 算 机 学 报 均衡特性和可扩展性. 1 引 言 2 网络模型 无线传感器网络是由大量具有感知、数据处理 和通信能力的传感器节点组成的网络,并且通过传 感器节点之间的协作,实现对各种现象的监测.由于 具有低功耗、低成本、智能化、分布式、自组织等特 将无线传感器网络模型化为一个单位圆图 G(V,E),其中 表示网络节点集,E为在通信半径 范围内的节点所形成的边的集合.假定网络是密集 点,无线传感器网络在军事、环保、医疗、商业、灾害 预测及救援等领域有着广阔的应用前景. 无线传感器网络通常是密集分布的,因此网络 节点感知的数据之间通常具有很大的冗余性.由于 传感器网络节点是能量受限的,支持冗余缩减的技 术能在很大程度上减少网络的能量消耗,从而能够 延长无线传感器网络的生命周期. 很多文献提出通过冗余缩减的方法减少在网络 中传输的数据量,进行高效数据获取. 文献[1—5]采用编码策略来消除网络中冗余数 据,减少向汇聚节点传输的数据量;文献[6—7]提出 随机树构造算法为单汇聚节点的数据采集应用构造 数据融合树,网络节点感知的数据在向汇聚节点传 送的过程中可以在中间网络节点上进行数据融合; 文献[8—9]提出的方法都是结合无线传感器网络节 点的空间相关度,研究从网络中选取一部分节点向 汇聚节点传输感知的数据,以此消除无线传感器网 络中的冗余数据. 本文在关联图和关联支配集概念的基础上设计 了一个基于熵评判的关联支配集构造算法(Entropy Evalution for Correlation Dominating Set Con— struction,EECDS),构造一个连通关联支配集对剩 余节点进行关联支配,并利用连通关联支配集中的 节点进行数据感知、采集和传输,实现数据冗余缩减 的目的. 文献[8—9]提出的方法与本文类似,但文献[8] 只考虑直接邻居节点之间的相关性.与本文提出的 算法一样,文献[9]也考虑了k跳邻近节点的相关 性,本文提出了一个熵评判(entropy evaluation)方 法,与文献[9]中的方法相比,熵评判方法能更加准 确地度量网络节点之间的数据相关度,另外本文在 构造连通关联支配集时采用了一个能量感知的优先 级策略,能有效地均衡无线传感器网络的能量消耗. EECDS算法首先通过评价随机变量的熵值来 判断g跳网络节点间的数据相关性,然后在网络中 分布式地构造一个关联图,最后借助关联图的信息 构造一个连通关联支配集.EECDS算法能有效缩减 无线传感器网络的数据冗余,同时具有很好的能量 连通的,即集合E具有较大的势,因此相邻网络节 点采集的数据具有较大的相关性. 无线传感器网络所监测的现象大都是空间上分 散的,且符合高斯分布,这样的物理环境通常称为高 斯随机场.因此,我们假设 个网络节点采集的空间 数据向量x具有高斯随机过程的特征,并且符合n 维正态分布G ( ,K),则随机向量x的概率密度函 数为 厂(X)一—_==_二l_—一e一专 卜 (1) ( ̄/2 7c) j KI“ 其中参数 为正态分布的均值,K一(是 ) 为x的 协方差矩阵,k ,= 。e cdPij, ∈{1,2},d 为网络节点 i和 之问的距离,c为调节系数. 协方差矩阵K刻画了网络空间数据的相关度, 节点之问的数据相关度会随着距离的增加而缩减. 为表示无线传感器网络中的数据相关性,本文 借鉴了文献I-9]中提出的关联图(correlation graph) 的概念. 定义1. 给定一个无线传感器网络,传感器节 点集合为R,则关联图定义为以R为顶点集合、以 P(尺)×R的一个子集为有向超边(hyperedge)集合 的有向超图(hypergraph),其中P(R)是集合R的 幂集(power set),该关联图用G (V—R,E P(R)×R)表示. 关联图G 中的一条边(w,“),U W表示节点 “感知的数据与集合w中的节点感知的数据高度相 关,因此节点U的数据可以在一定的误差范围之内由 集合w中的节点推算出,换言之,在给定集合w中 节点感知的数据的基础上,节点U的数据是冗余的. 将集合w定义为关联子集(correlated subset),节点 “定义为关联节点(correlated vertex). 下面在关联图的基础上,给出关联支配集 (correlation dominating set)的概念. 定义2. 关联支配集是图G(V,E)中的顶点集 合SCV,满足对于任何顶点“E( —S),至少存在 一个节点子集W S,且( ,“)为关联图G 中的一 个有向超边.如果集合S的诱导子图是图G的一个 连通子图,则称s为连通关联支配集(connected 1期 于瑞云等:无线传感器网络中基于熵评判的关联支配集构造算法 89 correlation dominating set). 图论中的支配集(dominating set)概念如定义3 所述. 定义3. 支配集是图G( ,E)中的顶点集合 S(二= ,满足对于任何顶点 ∈V,或者 ∈S,或者口 与集合s中至少一个顶点相邻. 与支配集的概念不同,在关联支配集中,非支配 集节点不一定要与支配集中的节点相邻,但是要确 保非支配集中的任何节点都与支配集中的某些节点 具有较高的相关度.相关度的度量方法将在第3节 中进行详细定义. 3 问题定义 基于条件熵评判的关联支配集构造算法 (EECDS)是在给定的无线传感器网络中根据关联 图结构来构造一个最小的连通关联支配集C,通过 收集集合C中节点感知的数据能够以较小的误差 复原网络中所有节点产生的数据.EECDS是通过减 少参与通信的节点数量来消除网络中冗余数据的传 输,能在保证网络数据完整性的基础上,有效地降低 网络节点的能量消耗.另外,EECDS算法还可以对 网络节点进行有效的休眠调度,均衡网络的能量 消耗. 在计算给定图G(V,E)的关联图G 时,我们采 用熵评判机制来判断超边的存在,具体地说,如果节 点U相对于集合w中节点的条件熵小于一个应用 程序定义的阈值时,则关联图G 中就存在一个从 集合W至节点U的有向超边(w, ). 如第2节中所述, 个网络节点采集的数据 具有高斯随机过程的特征,并且符合n维正态分布 G ( ,K),K为x的协方差矩阵.集合 为集合x 的一个子集,假设W一(X X …,X 。),其中i , i。,…,i ∈{1,2,…,n),k 为任意节点ID组合, 集合w符合k维正态分布G ( ,Kw),其协方差矩 阵为K ,KⅣ为协方差矩阵K中与ID值i ,i ,…, i 相关的子矩阵. 假设无线传感器网络节点感知的数据都以同样 的步长地进行量化分级,因此在这里将采用条 件微分熵进行节点数据相关度的评判.假设W一 (X X¨…,X 。)是在较小的步长△下进行量 化分级得到的愚个离散的随机值,根据文献[10], k维正态分布G ( ,Kw)的微分熵为 1 h(G ( ,Kw))一音log(2he) fKlw f (2) 该正态分布的联合熵近似为 H( ( ,Kw))≈^(G ( ,Kw))一klogk 1 === ̄ 1og(2ne) I Kw I--k logA(3) 则在给定集合w节点的数据的基础上,节点 需要 传输的数据率R 即为节点“相对于集合w的条件 熵,其值如式(4)所示,其中W 一WU{U): R乱===H(U,W)一H(W) 1 一一 ̄log(2he) IKⅣ,l一(是+1)logA一 ,1 、 (寺log(2 7ce) IKw k logk) 1 一去(1og(2ne)卜 fKⅣ,I—log(2tee) lKw{)一 厶 logA (4) 根据文献[-10],一个符合正态分布的连续随机 变量的微分熵为 1 h(G(/x, 。))一7。log(2nea ) (5) 则节点 的离散熵的值为 1 H 一h 一logA一9 -log(2 rrea )一logA (6) H 实际上为节点 传送感知数据的数据 率,所以当R 的值小于一个给定的阈值 H , 一0 时,则可以判定节点“与节点集合w高度相关,即 在超图G 中存在有向超边(W,“),其中参数 为 误差系数,由R < H 可得 1 妻(1og(2ne) IKⅣ,I—log(2ne) IKw【)一logA< (寺log(2 7ce )一logA) (7) EECDS算法首先通过熵评判机制构造一个关 联图,然后在此基础上构造一个连通关联支配集.由 于在无线传感器网络中,节点问数据的相关度会随 着节点距离的增加而呈现指数衰减,所以在构造关 联图的时候,每个网络节点只判定与其g跳范围内 节点集的幂集元素的相关性,g通常取1~3,这能 够在很大程度上减少计算的开销. 4 算法描述 4.1,,l跳邻居发现 为均衡无线传感器网络的能量消耗,算法引入 了一个能量感知的优先级策略,节点用二元组 (energy,id)进行优先级分级,其中energy代表节 点的剩余能量值,i 代表节点的ID值. 定义4.设节点“的优先级 一(energy ,id ), 90 计 算 机 学 报 节点 的优先级P =(energy ,id ),则P > ,当 其仅当: (1)energy  ̄energy 或 (2)energy 一energy 且id did {1,2,…,2” s ),令w:P,,计算节点“与节点集合w的 关联关系,如果满足式(7)的约束关系,则将集合 加入到 节点“的关联子集列表CSList中; 2.每个关联节点计算完与其邻接的关联子集信息之 后,向其g跳邻居节点广播CSNOTIFY消息,在消息中包含 显而易见,剩余能量值较低的节点将具有较高 的优先级,在EECDS算法中,此类节点将以较高的 优先级从连通关联支配集中移除,被移除的节点在 数据采集的时候不参与通信,因而减少了能量的消 该节点的ID和CSList信息; 3.当一个节点收到CSNOTIFY消息时,如果该节点ID 出现在CSNOTIFY消息的CSList中的记录中,则将这些记 录保存在关联节点列表CVI ist中,并在CVList中保存相应 耗,延长了节点的生存时间. 在数据采集过程中消耗能量过多的节点会在下 一轮连通关联支配集构造的过程中获得较高的优先 级,因此能够均衡网络的能量消耗. EECDS算法要求传感器网络节点能通过接收 GPS信号或者其它定位方法确定各自的位置信息. 邻居发现阶段通过m轮HELLO消息交换过 程让网络中的每个节点得到其n2跳之内的所有邻 居节点的状态信息,包含节点的ID、剩余能量、位 置、着色(见4.3节)等信息. 在第1轮消息交换过程中,每个节点广播一个 HELLO消息,收到HELLO消息的节点将其一跳 邻居节点的信息保存在邻居列表里,直至它从所有 的一跳邻居处都收到HELLO消息. 在第i∈[2, ]轮消息交换中,每个节点在广播 的HELLO消息中捎带它的i一1跳邻居列表信息, 让该节点的直接邻居节点获取各自的i跳邻居节点 的信息. 经过m轮消息交换后,每个节点都会完成其m 跳邻居节点信息的收集工作,这些邻居节点的信息 存储在邻居列表NBList中. 如第3节中所述,每个网络节点只判定与其g 跳范围内节点集的幂集元素的相关性,通常令g∈ {1,2,3),g的取值要保证在生成关联图时让节点 获得足够的关联邻居节点的信息(见4.2节). 在邻居发现阶段,通常设定跳数 ∈{2,3}且 g,m的取值要保证在构造连通关联支配集时, 节点要有足够的邻居节点信息判断移除该节点后本 地网络的连通性(见4.3节). 4.2生成关联图 EECDS算法通过本地算法构造一个关联图,在 关联图构造完成之后,每个节点成为关联图中的一 个关联节点,并且维护与该节点相邻接的关联子集 的信息以及该节点所在的关联子集的信息. 具体过程如下: 1.假设集合Ng( )为节点 的g跳开放邻居节点集, 对于N (“)的幂集P(N (“))中的每个集合元素P , ∈ 关联节点的信息. 经过上述过程,EECDS算法通过节点的分布式 计算和有限g跳广播构造了一个关联图,每个节点 只掌握其与g跳范围之内的邻居节点构成的局部 关联图信息,其中,与该节点邻接的关联子集的信息 存储在关联子集列表CSList中,包含该节点的关联 子集的信息保存在关联节点列表CVList中. 4.3构造连通关联支配集 连通关联支配集的构造过程是在连通的网络中 分布式移除一些关联节点,在移除这些关联节点的 同时保证网络的正常连通,直至构造一个较小的连 通关联支配集对整个网络进行关联支配. EECDS算法采用一个着色过程(coloring process)完成连通关联支配集的构造,具体实现过 程描述如下: 1.在起始阶段,每个节点都标记为灰色(GRAY); 2.符合以下条件的灰色节点“将自己标记为白色 (WHITE): 2.1.查看邻居列表NBList,假设节点“所有优跳范围 之内的非白色节点集合为z N (“),节点“的优先级 P >P ,Vz ∈Z,五为灰色节点,并且集合z的诱导子图是 连通的; 2.2.检查关联子集列表CSList,在关联图G 中存在一 个超边(W,“),对于节点 ∈W,或者节点 是黑色 (BLACK)的,或者节点 是灰色的且P < ,如果存在多个 满足条件的集合w,选取其中具有最小势的集合; 2.3.检查关联节点列表CVList,对于关联图G 中的 每一个超边(U, ),“∈U,节点 或者为白色,或者为黑色, 或者是灰色的且P <P . 3.当灰色节点tA将自己标记为白色后,向其g跳范围 内的邻居节点发送一个wHITEN消息; 4.集合 中的灰色节点收到节点“发来的wHITEN 消息后,将自己标记为黑色,然后发送一个BLACKEN 消息; 5.其它灰色节点收到一个WHITEN消息或者一个 BI AcKEN消息后,更新邻居列表NBList中发送消息节点 的着色信息,重新测试步2中的条件,如果满足条件,开始另 一轮着色过程; 6.当网络中的灰色节点全部被标记成黑色或白色,或 1期 于瑞云等:无线传感器网络中基于熵评判的关联支配集构造算法 者网络中没有符合步2中条件的灰色节点,算法结束. EECDS算法执行完毕后,所有黑色节点和灰色 节点(如果存在)构成一个连通关联支配集.需要说 明的是,EECDS算法是采用分布式的节点退出机制 构造连通关联支配集,在算法执行的任何时刻,所得 到的关联支配集都是连通的. 5 性能评价 在本节中,我们将通过仿真来分析EECDS算 法的性能,为进行比较,同时对文献[9]中的算法(为 方便表述,用EGCD标记该算法)进行仿真分析. 5.1 协方差矩阵参数分析 为构造关联图,节点需要判断与其邻接的关联 子集是否满足式(7)的条件,式(7)中的协方差矩阵 日 元素k ,一 e cdfj表示节点之间数据的相关度, 为 正态分布的方差,d ,为网络节点i和J之间的距离, 节点之间的数据相关度会随着距离的增加而缩减,口 的值通常取l或2. 当 一1, 一2时,在系数c取不同的值时,两个 节点的数据相关度随距离的变化情况如图1所示,C 值越大,在给定节点距离的情况下,两个节点之间的 数据相关度越低. 币点距禹/m 图1 节点数据相关度随距离的变化 5.2连通关联支配集的大小 在本节中,仿真环境配置为:网络节点的通信半径 y一30m,网络节点随机布置在100mX100m的网络 区域内,节点数量分别取60、80、100、120、140和160. 式(7)中的误差系数 一0.2,微分熵步长△一 2 ,协方差矩阵参数 一1, =2.关联邻居跳数 g一1,通信邻居跳数m一2. 图2显示了在协方差矩阵参数C一0.0001和 c一0.0005时EECDS算法获得的连通支配集大小 以及EGCD算法得到的连通支配集的大小.在网络 密集的情况下,EECDS算法具有较好的性能.当c一 0.0001时,EECDS算法获得较好的性能,但当C一 0.0005时,在节点数为6O和8O时,网络中只有极 少数节点被缩减掉. 图2连通关联支配集的大小 EGCD算法采用一个简单的概率方法确定节点 的关联子集,在仿真中取关联百分比P一0.1,关联 距离 一20 m,当网络密度增大时,EGCD算法能获 得比EEcDS更好的性能,但在网络稀疏时性能相 对较差. 图3显示了在上述配置情况下,节点数量为8O 时连通关联支配集的构造情况,图3(a)为网络的初 始连接,图3(b)为得到的连通关联支配集,其中* (b)连通关联支配集 图3 节点数为8O时连通关联支配集的构造 92 计 算 机 学 报 2011年 号表示EECDS算法缩减掉的网络节点. 5.3各项参数对关联支配集大小的影响 5.3.1误差系数 的影响 在本小节中,仿真环境配置为:网络节点的通信 半径y=30m,网络节点随机布置在100 m×100 m 的网络区域内,节点数量分别取80和100. 微分熵步长A一2 ,协方差矩阵参数 一1, 一2,c:0.0002.关联邻居跳数g一1,通信邻居跳 数 一2. 根据式(7),调整误差系数 将影响熵评判的结 果,增大 将构造一个更大的关联图,因而在构造连 通关联支配集的时候,节点将有更多的关联子集可 供选择,所以将缩减连通支配集的大小.如图4所 示,当误差系数 从0.1调整到0.6时,在8O个节 点的情况下,连通关联支配集的大小从50降到36, 当网络密度增加时,连通关联支配集大小占网络节 点数量的比率会随之降低,如图4中100个网络节 点的情况,当 从O.1调整到O.6时,其连通支配集 大小从61降到39,当 一0.6时,比率值为39 . 误差系数 图4误差系数 对关联支配集大小的影响 5.3.2微分熵步长值△的影响 在本小节中,仿真环境配置为:网络节点的通信 半径y一30 m,网络节点随机布置在100 m x 100 II1 的网络区域内,网络节点数分别取8O和100. 协方差矩阵参数 一1, 一2,f一0.0002,误差 系数 =0.2,关联邻居跳数g=l,通信邻居跳数 一2. 微分熵步长△分别取1/32、1/16、1/8、1/4、 1/2,图5显示了步长△对连通关联支配集大小的 影响. 如式(3)和式(6)所示,k维正态分布的离散熵 为其微分熵与k logA的差值,因此,当△取值越大, k维正态分布变量的离散熵的值越小.由于 的取 值小于1,当步长△增大时,式(7)两端的值都减小, 图5 微分熵步长△对关联支配集大小的影响 但左端值的变化速度要高于右端,其结果是式(7)得 到满足的可能性增加了,也就是说,在构造关联图 时,节点的关联子集数量增多了,因此,获得最优连 通关联支配集的可能性随之提高,如图5所示,当步 长△增大时,组成连通关联支配集的节点数量呈现 出降低的趋势. 5.4算法的能耗特性 5.4.1平均能量消耗 本节的仿真配置为:网络节点的通信半径y一 30m,网络节点随机布置在100m×100m的网络区 域内,节点数量分别取60、80、100、120、140、160. 式(7)中的误差系数 一0.2,微分熵步长△一2_ , 协方差矩阵参数 一1, 一2,f一0.0002.关联邻居 跳数g一2,通信邻居跳数 一2. 假设仿真过程中发送和接收的数据包都具有同 样大小,能耗情况根据文献[11]中的能耗模型给出, 网络节点发送数据包消耗1个单位的能量,接收数 据包消耗0.5个单位的能量,网络节点在空闲状态 下的能耗忽略不计. EECDS算法的能耗主要包括在邻居发现阶段 和连通关联支配集构造阶段发送和接收消息所消耗 的能量以及在生成关联图阶段用于计算的能量开 销.构造关联图时,每个节点计算并比对g跳开放 邻居节点集的幂集元素与其的相关度,该过程的算 法复杂度为O(n。・2 ),其中 为网络节点的g跳开 放邻居节点集的势.对于密集网络,这个计算过程是 非常耗资源的,因此,在实际运算的过程中,每个节 点最多选取与其最相关的s个节点(比如S一12)进 行关联图的构造,假设 s的网络节点生成关联图 所消耗的能量与发送1O个消息消耗的能量相等,则 对于n<s的节点,生成关联图的能耗值等同于发送 l0・(n/s) 2…个消息. 1期 于瑞云等:无线传感器网络中基于熵评判的关联支配集构造算法 EGcD算法的关联图构造过程的算法复杂度为 0(K L ),其中K是为了计算相关度而收集的采样 个数,L为rank值,并且L<K,所以每个节点为计 算关联图而消耗的能量基本相同,假设均与发送10 个消息所消耗的能量相等(文献[9]中假设与发送 4O个消息的能耗相等). 此外,EGCD算法是通过收集邻近节点的采样 数据来判断与邻近节点的数据相关性,在开始构造 关联图之前,每个节点还需要广播收集到i个采样 数据供其它节点进行数据相关性分析. 在不同的网络拓扑结构下连续运行EECDS算 法和EGCD算法各1o次,图6显示了两种算法的 平均能量消耗情况,在每种网络配置下,EECDS算 法的节点平均消耗都要优于EGCD算法. 图6算法的平均能量消耗 5.4.2能量均衡特性 本节的仿真配置为:网络节点的通信半径y一 3Om,80个网络节点随机布置在100 rll×100m的网 络区域内.误差系数 一0.2,微分熵步长△一2 , 协方差矩阵参数 一1, 一2,r-_0.0002.关联邻居 跳数g===2,通信邻居跳数 一2. 每个节点的初始能量值设为1450~1500个单 位之间的随机值.在相同的网络拓扑结构下连续运 行EECDS算法和EGCD算法各5次,在每次执行 过程中,首先构造一个连通关联支配集,然后在此支 配集的基础上随机选择一个节点为根节点构造一个 树状通信结构,并在此通信树结构上运行一个简单 的查询应用程序1O次.该应用程序首先从根节点洪 泛一个QUERY请求消息,然后从每个节点沿着通 信树结构向根节点发回一个数据包. 仿真结束后,网络节点的能耗情况如图7所示. 从图7可以看出,EECDS算法具有很好的能量 均衡性,这是因为EECDS算法采用了能量感知的 耀 ∞ 藻 图7算法的能量均衡性 优先级机制,组成连通关联支配集的节点负责网络 数据的采集和传送,要消耗更多的能量,因而在下一 轮关联支配集的构造过程中将获得较高的优先级, 增大了从网络中移除的可能性. EECDS算法的能量均衡特性对延长无线传感 器网络的生命周期起到了十分显著的作用. 6相关研究与本文结论 文献[1]主要研究单一输入的编码策略,提出了 两种编码方法:外编码和自编码.针对这两种方法, 分别提出了构造数据采集树的最优算法和近似最优 算法,目的是最小化在网络中传输的数据的加权比 特数. 文献E2]提出用数据采集节点跟踪网络节点的 相关性信息,当获得足够的节点相关信息,数据采集 节点通知各个网络节点进行数据编码的比特位数, 从而进行有效地冗余抑制. 文献[3—4]设计了两种编码策略,一种基于条件 熵,另一种基于Slepian—Wolf编码模型[1 ,算法研 究了在两种编码策略下,进行通信结构和节点数据 率分配的联合优化问题,从而在单汇聚节点的树状 通信结构中最小化网络数据传输的能量开销. 文献E5]考虑了以数据采集为背景的传感器网 络节点布置和通信结构的联合优化问题,目的是优 化布置传感器网络节点,使网络节点产生的数据能 在汇聚节点处以较小的失真率进行数据重建,同时 最小化网络通信的能量消耗.文献研究了在满足网 络最大失真和平均失真约束条件下的基于条件熵和 Slepian—wo1f编码的算法设计. 文献E6]提出了一个随机树构造算法为单汇聚 节点的数据采集应用构造数据融合树,网络节点感 94 计 算 机 学 报 知的数据在向汇聚节点传送的过程中,可以在中间 网络节点上进行数据融合,从而减少了在网络中传 输的数据量.该算法对于所有非降的凹聚合函数都 有很好的近似比. Workshop on Foundations of Mobile Computing(DIALM— P0MC’04).Philadelphia,PA,United States,2004:60—66 [2]Chou J,Petrovic D,Kannan R.A distributed and adaptive signal processing approach to reducing energy consumption in sensor networks//Proceedings of the 22nd Annual Joint Con— ference of the IEEE Computer and Communications Societies 在文献[73中,为在传感器网络中构造进行高效 数据采集的数据融合树,作者提出了一个简单的随 机树构造算法,该算法在以栅格图方式布置的网络 中具有常数近似比. (INFoCoM’03).San Francisco,CA,USA,2003:l054— 1062 [3]Cristescu R,Vetterli M.Power efficient gathering of correla— ted data:Optimization,np—completeness and heuristics.SIG— MOBIl E Mobile Computing and Communications Review, 文献Es]根据传感器网络节点的空间相关度,研 究从网络中选取一部分节点向汇聚节点传输感知的 数据,以消除网络中的冗余数据.文献提出的算法采 用一个简单的本地算法选取一些簇头节点,然后选取 一些中间节点将簇头节点连通成一个最短路径树,在 树结构之外的节点将不参与数据采集的通信过程. 文献[9]先从邻近节点收集一定数量的采样数 据,然后根据这些采样数据判断与邻近节点的相关 度,并基于节点相关程度构造一个关联图.接着在关 联图的基础上构造一个连通关联支配集,关联支配 集之外的节点将从数据采集应用的通信结构中 移除. 文献[13—19]研究了在无线网络中构造连通支 配集的算法,但这些算法都是研究通用的连通支配 集构造策略,不是专门基于传感器网络背景的,因而 也没有考虑在无线传感器网络中进行数据冗余缩减 的问题. 文献[2o一22]是从路由的角度设计一些分布式算 法来鉴别在路由过程中节点的冗余性,也就是在满足 网络路由性能要求的前提下,可以在路由通信过程中 排除一些网络节点,这些节点可以被调度休眠,从而 节省网络的能量消耗.但这些策略只是考虑网络节点 的冗余,而没有考虑节点之间数据的相关性. 本文提出了一个基于熵评判的关联支配集构造 算法(EECDS),算法首先在网络中分布式构造一个 关联图,然后结合关联图的信息构造一个连通关联 支配集.通过收集关联支配集中节点感知的数据,能 够以较小的误差复原网络中所有节点产生的数据, 因此EECDS算法能在保证网络数据完整性的前提 下有效地缩减无线传感器网络的数据冗余,减少在 网络中传输的数据量,从而降低网络的能量消耗,延 长网络的生命周期. 参 考 文 献 [1]Von Riekenbaeh P,Wattenho[er R.Gathering correlated data in sensor networks//Proceedings of the 2004 Joint 2003,7(3):31—32 [4] Cristescu R,Beferull—Lozano B,Vetterli M.On network correlated data gathering//Pr0ceedings of the 23rd Annual Joint Conference of the IEEE Computer and Communications Societies(INFoCoM’04).Hong Kong,China,2004:2571— 2582 r5] Ganesan D,Cristescu R,Beferull—Lozano B.Power-efficient sensor placement and transmission structure for data gather— ing under distortion constraints//Pr0ceedings of the 3rd In— ternational Symposium on Information Processing in Sensor Networks(IPSN’04).Berkeley,CA,USA,2004:142—150 [6]Goel A,Estrin D.Simultaneous optimization for concave costs:Single sink aggregation or single source buy-at—bulk. Algorithmica,2005,43(1—2):5-15 [7] Enachescu M,God A,Govindan R,Motwani R.Scale free aggregation in sensor networks//Proceedings of the 1 st In— ternational Workshop on Algorithmic Aspects of Wireless Sensor Networks(Algosensors’04).Turku,Finland,2004: 71 84 [8]Yoon SunHee,Shahabi Cyrus.Exploiting spatial correlation towards an energy efficient clustered aggregation technique (CAG)//Proceedings of the International Conference on Communicat{ons(ICC’O5).Seoul,South Kover,2005: 3307 3313 [9]Gupta H,Navda V,Das S,Chowdhary V.Efficient gather— ing of correlated data in sensor networks.ACM Transactions on Sensor Networks,2008,4(1):l-31 [10]Cover T M,Thomas J A.Elements of Information Theory. New York:John Wiley and Sons,Inc.,1991 [11]Kubisch M,Karl H,wolisz A,Zhong L C et a1.Distributed algorithms for transmission power control in wireless sensor networks//Pr0cee dings of the 2003 IEEE Wireless Communi— cations and Networking Conference(WCNC’03).New Orle— ans,LA,USA,2003:558—563 [123 Slepian D,Wolf J K.Noiseless coding of correlated informa— tion sources.IEEE Transactions on Information Theory, 1973,IT 19(4):471—480 [13]Stojmenovic I,Seddigh M,Zunic J.Dominating sets and neighbor elimination-based broadcasting algorithms in wireless networks.IEEE Transactions on Parallel and Distributed Systems,2002,13(1):14—25 [14]Adjih C,Jacquet P,Viennot L.Computing connected domi— nated sets with muhipoint relays.Ad Hoc and Sensor Net— works,2005,1(1):27-39 于瑞云等:无线传感器网络中基于熵评判的关联支配集构造算法 95 [15] Wu J, H.On calculating connected dominating set for ef ficient routing in ad hoc wireless networks//Proceedings of the 3rd International Workshop on Discrete Algorithms and Methods for Mobile Computing and Communications. Seattle,Washington,United States,1999 [16] Dai F,Wu J.An extended localized algorithm for connected dominating set formation 1n ad hoc wireless networks.IEEE Transactions on Paralle1 and Distributed Systems,2004,i5 (10):908 920 [1 7] Wan Peng—Jun,Alzoubi K M,Frieder O.Distributed con— struction of connected dominating set in wireless ad hoc networks//Proceedings of the 2 1 st Annual Joint Conference of the IEEE Computer and Communieations Societies (INFOCOM’O2).New York,NY,USA,2002:1597 1604 [18] Dai F,Wu J.On constructing connected k—dominating set in wireless networks//Proceedings of the 19th IEEE Interna— tional Symposium on Parallel and Distributed Processing. Denver,CO,USA,2005:10 YU Rui—Yun,born in 1974,Ph.D., lecturer.His research interests include wireless ad—hoc communication,wireless sensor networks,multi—sensor data fu— sion,etc. Background Wireless sensor networks are data—oriented,whose main task is data processing,including sensing,data gathering, transmission,compress,aggregation,and so on.Wireless sensor networks are usually densely deployed in a network area,and generate a great deal of data.Moreover,the daia sensed by neighboring nodes is highly correlated.These all impose great challenges on the design of data gathering algo— rithms.Since the sensor nodes are power—constrained,trans— ferring large amounts of data definitely will shorten the life— time of sensor networks.Therefore,the network perform— ance on energy consumption and stability could be improved through data redundancy remova1. In this paper,an algorithm named the entropy evalua— tion for correlation dominating set construction(EECDS)is presented.The EECDS algorithm exploits the concept of the correlation dominating set.It first determines the correlation between sensor nodes by evaluating the entropy of random variables,and then distributively generates a correlation graph.At last,the algorithm constructs a correlation domi— nating set using the information of the correlation graph.The EECDS algorithm is very efficient on reducing data redundan— cy in wireless sensor networks,and performs wel1 on energy balance and scalability. [19] Thai M T,Zhang N,Ravi T,Xu X.On approximation algo— rithms of connected m dominating sets in disk graphs. Theoretical Computer Science,2007,385(1 3):49—59 [2O] Chen B,Jamieson K,Balakrishnan H,Morris R.Span:An energy— efficient coordination algorithm for topology mainte—— nance in ad hoc wireless networks//Proceedings of the 7th Annual International Conference on Mobile Computing and Networking(MobiCom’01).Rome,Italy,200I [213 Xu Y,Heidemann J,Estrin D.Geography informed energy conservation for ad hoc routing//Pr。cee出ngs of the 7th An— nual Internationa1 Conference on Mobile Computing and Net— working(MobiCom’01).Rome,2001:70—84 E22] Ye F,Zhong G,Cheng J,Lu S et a1.Peas:A robust energy conserving protocol for long—。lived sensor networks//Proceed—— ings of the International Conference on Distributed Compu— ting Systems(ICDCS’03).Providence,RI,United States, 2003.28—37 WANG Xing-Wei,born in 1 968,Ph.D.,professor, Ph.D.supervisor.His research interests include NGI,mo— bile wireless Internet,IP/DWDM optical Internet,etc. LIU Yong—He,born in 1 9 74,Ph.D.,associate profes— sor.His research interests are wireless networking,sensor networks,security,and system integration. This work is supported by the National Natura1 Science Foundation of China under grant Nos.61070162,71071028, 60802023 and 70931001;the Specialized Research Fund for the Doctoral Program of Higher Education under grant Nos.20100042110025 and 20070145017;the Fundamental Research Funds for the Central Universities under grant Nos.N090504003,N090504006 and N100417001;the Doc— tora1 Scientific Research Fund of Liaoning Province under grant No.20101040. Ome of main tasks of the above mentioned projects is vir— tual backbone construction in wireless networks.Some pub— lished papers were focusing on connected dominating set con— struction,and generating connected dominating sets as back— bones for routing,data collection,etc. This paper highly addresses the correlation fact of wire一 1ess sensor networks,and proposes a connected correlation dominating set construction algorithm.The correlation domi— nating set is used for data redundancy removal,and data gathered from the set could recover the network data within a predefined error bound.The entropy evaluation method ex— ploited in the algorithm can leverage data correlation well, and hence guarantee the efficiency of data redundancy remov— a】in wjteless sensor networks.