第22卷第4期 2005年4月 计算机应用与软件 Computer Applications and Software Vo1.22.No.4 Apr.2005 最佳能量小波包技术在海洋水声信号处理中的应用 杨亚菁 彭 宏 (湛江海洋大学海滨学院 广东湛江524005) (华南理工大学计算机工程与科学系 广东广州510640) 摘要 对随机时间序列的特征提取与聚类分析,提出了基于分类距离标准的小波包基能量方法。该方法应用小波包变换提取 信号各子空间的能量,以能量分类距离标准选取最佳小波包基,最佳小波包基上距离系数大的能量作为特征值。实验结果表明此方 法比固定尺度小波包能量法有着更好的分类效果,并且特征值维数低。 关键词 水声信号 分类距离标准 小波包基特征提取 聚类分析 THE APPLICAT【0N oF 1 匝:BEST ENERGY WAVELET PACKET TECHNIQUE D 1 m DISPoS oF UNDE]RWATER ACOUST【C SIGNAL Yang Yajing Peng Hong~ (Haibin College,Zh~ e,Ocean University,Zhan.i~ng Guangdong 524005,China) 。(oct.ofComp.Eng.&Scien.,South China Univ.ofTech.,Guan~.hou Guangdong 510640,China) Abstract A method that perform cluster analysis and contract feature to seldom time
—
series is puts forward,which based on the classification dis—
tance criterion and wavelet packet(WP)bases.It applies WP translate to get energy from subspace and select the best WP bases with classification dis—
tance criterion.The energy has bigger distance coe~cient in best WP bases is the feature.Experiments show that this method has advantage to fiexdso.
ale WP energy me thod and had lower dime nsion offeature value.
Keywords Underwater acoustic Classification distance criterion Wavelet packet bases Feature abstract Cluster analysi
1 前言
特征提取是通过某种映射关系,把高维的原始数据映射到
低维的变换空间,这种映射能够抑制数据中大量的冗余信息,而
突出数据的类别信息。各种特征提取方法的基本思路是在变换
域进行降维,提取时间序列最具特征的值,即类别信息。对高维
的时间序列来说,特征提取是聚类的前提。
对随机时间序列进行特征提取的方法很多,常用的有傅里
叶变换,小波变换,平均值方法等。其中小波变换是一种新型的
变换方法,它的实质是对原始信号的滤波过程,各尺度空间上的
平滑信息和细节信号能提供原始信号的时频局域信息,特别是
不同频段上的信号构成信息。小波分析应用于水声信号的文献
不多,文献[1]将小波变换模极大值法等4种方法应用于回声信
号的特征提取。但水声工程中经常分析的舰船噪声与海洋噪
声,属于随机时间序列,信噪比低并且小波包变换系数在子空间
中也是一个无序的随机序列,应用上述几种方法进行特征提取
均不够理想。
在研究中发现,虽然这类水声信号的小波包分解系数是若
干随机序列,但某些子频带的能量值却是很稳定的,适用小波包
能量法。具有代表性的能量特征值方法如各尺度空间能量
法⋯,3级小波包能量法 等,这些方法均为有效的水声信号特
征提取方法,但应用于低信噪比舰船噪声有时信号特征不明显,
并且特征值维数高。本文提出了“最佳小波包基子空间能量”的
聚类方法,该方法基于分类的距离标准,以最佳小波包基上的几
个能量距离系数最大的能量值作为信号的特征。由于是从整个
小波包基上选取最具分类特征的子空间能量值,所以比上述二
种能量特征提取方法有着更好的分类效果,特别适合分类特征
不明显信号的特征提取。
2 理论依据
2.1 距离分类法
在特征空间 。中,设有c个类( , ,⋯, ), 中包含
个样本,第k个样本由m维的特征值描述,在特征空间中表
示为一个点。不同的类间距离称“类间距”,同一类不同样本间
距离称“类内距”。类间距与类内距之比越大,分类效果越好。
以 “·”表示第i类的第k个样本,有:
‘‘' =( l‘‘' , 2‘ · ,⋯, ‘ ' )
整个特征值系统表示为:
( ‘ ,i=1,2,⋯,C,k=1,2,⋯, )
平均类内距:
d : Σ::,毒 。 Σ 。Σ 。(鼍
:
÷Σi :一c = IΣ量= I 一 1Σ ^=1(” “ ㈤) (”1 )
平均类间距:
收稿日期:2004—04—14。广东省科技攻关项目(编号:A1O2o1∞)。
杨亚菁,女,讲师,主研领域:数据挖掘技术。
计算机应用与软件 2005年
=
C / i
I㈤一 1 2=÷Σ Σ 【f)_ ) 3算 法
(2)
其中:
Ul
C i: ,
Σ0 ’
u
“ l 1Σ厶 ㈦ i ’
分别是所有样本第2维的重心及第i个样本第2维的重心。
显然d目与d 的比值越大,各类之间分类效果越好,特征
也越明显。根据(1),(2)-式,定义距离系数:
:
: (3)
/L .ai:
:。
l Σl!:l。 志M一 1 /L.a :l。(、 一u;)
2.2 基于小波包子空间能量的特征提取
小波变换中的每个系数都是通过输入函数与其中一个基函
数之间的内积所决定的,这些系数表示了输入函数与特定基函
数之间的相似程度。如果基函数是正交的,那么任意基函数之
间内积为零,表明它们完全不相似。信号除了与一个或几个基
函数相似的分量之外,其余系数都将很小,由于小波系数的平方
表示着某种尺度下各点的能量,所以不同分量的能量值有着很
大的差异,可作为原始数据的特征值。
小波包分析较之小波分析能够提供一种更为精细的分析方
法,它对多分辨率分析没有细分的高频部分进一步分解,提取系
统的特征信息,从而实现对不同信号的分类。当一个含有丰富
频率成份的信号作为输入对系统进行激励时,由于此信号对各
频率成份的抑制和增强作用发生改变,因此与原信号相比,相同
频带内信号的能量会有着较大的差别,它使某些频带内信号能
量减小,而使另外一些频带内信号能量增大 。因此在背景噪
声上叠加了某种信号的各频率成份的能量中,包含了丰富的信
号信息,某种或几种频率成份的能量的改变即代表了一种目标
特征。
小波包能量法应用于信号的特征提取最常用的方法是固定
尺度的小波包能量法:先对信号进行若干级小波包分解,在最后
一
级分解的子空间上求各子空间的能量,以最大的几个能量值
作为特征值。对于信噪比较高的情况,此方法是有效的,但对信
噪比较低的信号,效果不佳。原因是方法没有涉及分类的标准,
能量大并不一定是分类的最佳特征。如果在某一分类标准下选
取最佳小波包基及小波包子空间,以这些子空间的平均能量为
特征值作为聚类的重心,可有更好的聚类效果。
2.3 最佳小波包基的选取
时变的非乎稳信号经过采样可得到时域内的随机信号序
列。对序列进行小波包分解,映射为时间尺度域各子空间内的
随机序列,但各子空问的能量值却是一个相对稳定的系数,特别
是当单个样本的长度很长时。定义尺度n下的第P个子空间能
量为 ,将信号样本间能量距离最大的子空间集合定义为最
佳小波包基。
设对信号进行肼层小波包变换,根据pn set z定理,原信号
的能量可分解为各尺度下子频带的能量之和:
f If(£)I =ΣTΣ J ( )J:
各子频带的能量为:
.
历=厶I ( )I =0,1,2⋯,m
c类(V。, ,⋯, ),每类的样本个数为Ni作为训练样本
集,每个样本的维数(即信号的长度)相同,算法如下:
(1)对样本集的每个样本进行5级小波包变换,得到62个
小波包子空间,n尺度第P子空间的能量值没为x ,对应(3)
式在变换域的1个1维空间点,,根据(3)式(m:1)有:
Σi‘=:l。 M一1 Σ ^=l。(一 ,1 ’)~~1
n=1,⋯,5.P=1,:,⋯,32
(4)
显然, 越大,n尺度下的第P个小波包能量值分类效果越
好 .
(2)由(4)式计算所有子空间中的k ’值,最佳小波包基的
选择满足kP >= 。其中 =2p,2p+1 ,
(3)在样本集上计算所有样本在最佳小波基各子空间上的
能量,计算平均值 。取距离系数最大的d个能量值位置
作为信号的聚类重心及特征值。
每个子空间的小波包系数个数与采样数目有关 最佳小波
包基下的目标信息状态最能体现信号的特征,
4 实验
对(4)式取c=3,样本为海洋背景噪声与混有相同海洋背
景噪声的2种舰船噪声,见图1。训练样本数各20个,每个样本
长度lOk。信噪比6db。
图1 上:海洋背景噪声中、下:2种脱船噪声
图2 基于能量距离标准的5级最佳小波包基
根据上述算法,图2为最佳小波包基。在训练样本集上,最
佳小波包基上各子空间中3类噪声能量距离系数最大的前8个
位置及这些位置上的能量距离系数 与相应的能量均值(聚
类重心)显示在表1。
表1 3类信号在训练集上最大的前8个能量距离系数及特征值
3 3 4 4 5 5 5 5
P 5 7 l 4 l 7 l1 27
‘“’ 20
.
7 l1.1 28.4 l】.7 5l 26.O l3.5 l5.O
Featurel 139 248 1735 219 2829 45O 558 130
(下转第55页)
第4期 张强等:CCD光电在线测径仪数据处理系统中两个关键问题的解决 55
DWORD d =Check1)ata.GetSize()*siT~,f(float);
∥获圾测量数据数 的大小
if(dwSize> 0)
{
GlobalFree(m—lronHis.m—Data.m hData);
m lmnHis.m Data.113 hData =G1obalAlloc(GMEM
—
M0、 一
ABLE,dwSize);//分配堆栈
PVO1D pData=Globall~ock(m
—
lmnHis.m
—
Data.Ill—
hData);
∥锁定该堆栈
memcpy(pData,(PVO1D)CheckDa' ta.Get1)a" ta(),dwSize);
∥将数据存入堆栈中
rfl
—
lronHis.SetFieldDirty(&(m—
lmnHis.113 Data),TRUE);
m
—
lronHis.Sef'ieldNull(&(nl
—
lmnHis.H1
—
1)ata),FAISE);
∥刷新纪录集对象的字段内容
m
—
lronHis.m
—
Data .nl
—
dwDataLength=d'~Siz,e;
l
if(m lronHis.Ca~Update())
m
—
lronHis.Update();//刷新纪录集
G1obalFree(m
—
lmnHis.113
一
Data .m
—
hData);
对于从数据库读取数据的过程与之类似。
4 结束语
串口通信和大量测量数据的存放是编写数据处理系统的关
键问题,这两个问题的解决关系到整个软件的编写质量及软件
运行的可靠性和稳定性。对于串口通信编程采用多线程编程具
有通用性,但有些主程序运算量不大,采用单线程技术还是比较
方便的。Visual C++中的ODBC类库可以帮助程序员完成绝大
多数的数据库操作。利用ODBC技术使得程序员从具体的
DBMS中解脱出来,从而可以减少软件开发的工作量,缩短开发
周期,并提高效率和软件的可靠性。限于篇幅,本文只给出部分
关键代码。
整个软件已经在Windows 2OOO环境下编译通过,并且运行
稳定、良好。
参考文献
[1]李现勇,串口通信技术与工程实践[M],北京:人民邮电出版社,
2002.7.
[2]David J.Kruglinsk等,Visual c++6、0技术内幕(第五版)[M],北京:希
望电子出版社,200o.2.
[3]Jdan Ca/tel",数据库设计与编程实例详解[M],北京:电子工业出版
社,2001.2.
[4]樊重理等,“CCD器件在非接触式测径仪中的应用[J]”,《现代科学
仪器>,1994:42~44.
[5]张文阁等,“CCD线材直径自动监测系统[J]”,《检测技术学报》,
1998:47~48.
(上接第22页)
n 3 3 4 4 5 5 5 5
l Feature2 368 658 4797 735 7734 1179 15l1 415
l Feature3 603 1O42 80o9 1250 1O270 1661 2212 787
由距离系数的定义可知,某个小波包子空间下的能量距离
系数越大,说明此小波包子空间下的能量作为信号的特征值可
分性越好。另取3类信号各20个样本作为测试集,在测试集上
的结果显示如下:
图3(上)为二个较大的距离系数 , : 所对应的舰船噪
声与背景噪声的小波包能量值聚类结果;
图3(下)为5级固定尺度小波包能量法取最大2个能量值
的聚类结果(‘*’表明背景噪声,‘O’表示舰船1, ’表示舰船
2)。
图3 上:最大距离小波包能量法分类图
下:小波包能量法分类图
在同样选2个能量值作为特征值的情况下,在最佳小波基
上基于最大距离标准取的特征值具有较好的分类效果,信号的
特征更明显。固定尺度小波包能量法特征值虽较大,但作为分
类特征并不是最佳。
5 结论
由于小波包基比普通小波基具有更强的时频分辨力,更敏
感于不同信号的细微差异,能够提取原始信号中更为精细的时
频局部信息作为目标特征。本文以分类最大距离标准及信号小
波包变换能量为基础,根据能量距离系数构造最佳小波包基,最
佳小波包基上距离系数较大的能量值具有较好的稳定性及分类
性,作为信号的分类标识及特征。基于小波包技术的最佳能量
特征分类方法,虽然本质上与固定尺度小波包能量分类法类似,
但由于是通过设计小波包函数,在整个小波包基子空间选取能
量,使能量值局限于实际分类感兴趣的部分,更着重于分类的频
段能量值,故在相同的特征值维度下,比后者有着更好的分类效
果。在舰船噪声特征提取实验中显示,本方法能够以较小的维
数提取低信噪比信号的特征,与固定尺度小波包能量法相比,在
分类效果与维度的降低方面均有优势。
参考文献
[1]张静远、张冰、蒋兴舟,“基于小波变换的特征提取方法分析[J]”,《信
号处理》,2002.2.(16):156~162.
[2]李蓉艳,水下爆炸信号特征分析方法研究[D],西安:西北工业大学
硕士论文,2001、
[3]Shouyong Wang,Guangxi Zhu,Yuan Y.Tang.Feature Extraction Of l'u~dar
Muhiple—Target Echoes Using Wavelet Packet Trans~oml W The Best Bases
[J].International Joumal Of Pattern Recognition and Artificial Intelligence,
20O3,17(1):127~150.
[4]胡昌华、张军波、夏军等,基于MATLAB的系统分析与设计一小波分析
[M],西安:西安电子科技大学出版社,200o,264~265.