pp1.1图象定义
图象是客观世界能量或状态以可视化形式在二维平面上的投影,是社会生活中最常见的一种信息媒体。它传递着物理世界的能量和事物状态的信息,是人类获取外界原始信息的主要途径。我们在生产、科研或日常生活中看到的场景图象,包含着物体的“大量”的信息,通过感觉、知觉、记忆、认知、搜索、形成概念,直到最终理解和识别视觉刺激。
对于可见光图象,它是外界光源照射能量与物体或场景表面反射特性综合作用的结果。
图象是客观世界的能量或状态以某种方式在二维平面上的投影,转化成一种可视形式.
pp1.2人类视觉
人类视觉是人眼对场景可见光能量在视网膜上形成的一种刺激,通过人脑对刺激信号的处理,获取场景的描述和感知。
通过长期进化,眼睛和神经系统组成人类视觉的功能已经非常完善,尽管视觉机理还不清楚,但它所表现出的特征和能力,给数字图象处理和计算机视觉研究提供了良好的启示和无限的研究课题。人类视觉特征和能力主要表现在视觉的相对性、选择性、整体性、恒常性、组织性、深度感知以及自学习、自适应、记忆、联想和思维决策等。
Pp
人类视觉的弱点:
人类进化过程中,总是把重点放在与生存活动密切相关的方面,视觉功能也不例外。另外,场景图象的复杂性有时也会使人类视觉无能为力。
1. 人只能感觉可见光波段能量,对其它波段不敏感;
2. 人眼视场角固定,空间分辨率和灰度分辨率有限;
3. 人眼有积分效应,对单次图象瞬间变化,快速运动图象分析,存储困难;
4. 准确测量图象参数能力较差;
5. 受知识水平差异的影响,人对同一图象的响应不同;
6. 人是有思想的生物体,视觉受情绪和疲劳程度的影响。
pp图象的数字化处理
图象是人类社会活动中最常用的信息载体,我们总是设法延伸视觉功能,弥补视觉功能的不足,从图象中提取更多的信息。传统的方法如利用光学或模拟电路对图象进行处理,如望远镜、显微镜、眼镜,照相机、电视、录象机等。
数字图象处理实际上是利用计算机(或数字技术)对图象信息进行加工处理,以改善图象质量、压缩图象数据或从图象数据中获取更多信息。随着微机、VLSI、DSP等技术和新的理论、处理方法不断发展,数字图象处理已经成为一门独立的新学科,并有着广泛的应用,正在空间、时间和功能上的扩展人类视觉。
pp数字图象处理的研究目的与研究内容
1.改善视觉效果——图象增强和恢复,图象变换;
2.提高图象传输和存储效率——图象编码,图象变换;
3. 进行图象测量、理解与识别——图象增强,图象分割与描述,图象变换;
4.特殊目的——图象重建。
pp 图象信号数字处理的优缺点
与光学或模拟电信号图象处理方法相比较,数字处理的优点是:
* 处理精度高
* 可靠性高
* 灵活性(时分复用)强
* 便于集成化
* 不需复杂的阻抗匹配
* 抗噪声干扰能力强。
图象信号的数字化处理也存在一些缺点,比如处理速度较慢、系统相对比较复杂、信号量化过程中可能引入噪声、量化时损失的信息无法恢复。
pp1.4数字图象处理的应用
工业交通
数字图象处理技术已经有效地应用于工业生产中的加工、装配、拆卸与质量检查等环节。例如机械手的手眼系统、车型识别、信函分拣工业自动控制,印刷电路板、集成电路芯片掩模板、药片外形、汽车零部件等质量自动检查(逐个检查)。
pp
医学领域
生物医学是数字图象处理应用广泛的领域之一,在诊断、治疗、病理分析和病案管理等方面,使用着大量的数字成象和数字图象处理设备,如X射线层析摄影(CT)、超声成象、血管造影、细胞和染色体自动分类等。这些技术和设备大大提高了治疗诊断水平,减轻了病人的痛苦。
pp
遥感信息处理
卫星遥感和航空测量有大量的图象需要处理,处理有两部分内容,一是图象校正,由于卫星、飞机是空中运动物体,装载的成象传感器受卫星飞机的姿态、运动、时间和气候条件等影响,摄取的图象存在畸变,需要自动校正。第二个内容是通过分析、处理遥感图象,有效地进行资源、矿藏勘探、国土规划、灾害调查、农作物估产、气象预报以及军事目标监视等。
pp
科学研究
数字图象处理作为一个二维或多维信息处理技术,与相关领域知识配合,成为科学研究中学习获取和处理的主要技术手段之一。例如电子显微镜的图象分析和重构,在天文、金相、燃料、生物、流体力学等众多方面都有应用。
pp
通讯广播
数字图象和数字视频在未来通讯广播中扮演主要角色,而且,现在已经进入我们的社会生活中,常见的数字图象和数字视频设备如可视电话、会议电视、卫星电视、数字电视、“画中画”、高清晰度电视、VCD、DVD、多媒体通讯、计算机网络通讯等。
pp
军事国防
数字图象处理是一种高技术,一般来说,高技术总是首先应用军事国防领域,已经有许多战例说明由数字图象信息处理技术作为核心控制部件的精确制导武器的威力,它是被动方式工作,隐蔽性好,抗干扰能力强,智能化程度高,可以无须人工干预,实现“打了不管”,能在复杂背景中精确地控制导弹命中目标。
pp
其它方面
数字图象处理在公安、体育、影视、考古等其它领域也有广泛应用。数字化影视特技可以让我们欣赏到非常壮观的画面;指纹、脸象、手纹、虹膜、耳形、步态、DNA等人体生物统计特征的提取和识别,为公安人员抓获罪犯提供有用的信息。
pp1.5数字图象处理工作本身的特点
图象处理的数据量相当大;
图象成象和信号数字化过程中有一些特殊问题;
图象本身的复杂性和视觉信息处理的针对性;
图象信号在空间、频谱和时间上有相关性,表明图象数据中存在信息冗余;
许多数字图象处理操作具有空间并行性。
pp1.6数字图象处理新的研究趋势
多学科领域交叉综合;
新理论新方法不断出现;
视觉机理研究深入;
实现技术研究进展迅速;
应用实用化。
pp
图象是周围世界在二维平面上的映象,而周围世界是一能量场,因此,图象可表示为:
x x表示图象宽度的坐标;
y y表示图象高度的坐标;
E (x, y, z,λ, t) z z表示图象深度的坐标;
λ λ表示记录能量的波长;
t t表示记录图象的时限。
Pp
设图象I是对E 一次摄象的结果. 其中x、y、z、λ和t总是处于一定范围的,即
x1
y1
I(x, y,λ)= c E (x, y, z,λ, t) z1
λ1
t1
上式中c是响应强度,为非负量,t为拍摄时间,当单次拍摄时t为快门时间,而连续拍摄时t为一个时间段,如果波长固定为一定值,连续拍摄可得到序列图象
{I1,I2,………,It}
pp
2.1取样
取样过程是一个模拟电信号的空间离散化过程,我们希望取样的空间离散图象能无失真地代表原模拟图象。设图象f(x,y)为一连续的,空间频谱具有一定截止频率fx和fy的波形。
所谓取样是对F(x,y)乘以空间取样函数
Pp
取样使原图象频谱在采样点上进行复制,当频域取样点间隔过小,就会引起复制后的原图象频谱部分重叠,造成数字化后的图象失真,无法恢复原图象f(x,y)。因此,当f(x,y)是有限带宽的,uc和vc为频谱宽度(截止频率),这时只要取样间隔△x、△y满足条件 2uc≤1/△x 和2vc≤1/△y ,相邻取样点频谱不会重叠,可以采用低通滤波器滤除无效频谱,再通过反变换,可以再求得f(x,y)。
通常称△x≤1/2uc 和△y≤1/ 2vc 为 Nyquist 条件。
Pp
2.2幅值量化
取样是空间离散化,而量化是幅值离散化。所谓量化是将f(x,y)的连续分布的值域划分成若干个子空间,在同一子空间内的不同灰度值都用这个子空间内某一个确定值代替,形成一个有限可列数值序列。
Pp
子区间的个数称为量化等级数,子区间的各分点称为分层灰度,而确定的代替灰度值称为等级灰度。以有限个离散值近似表示无限多个的连续值,一定会产生误差,这种误差称为量化误差,由此产生的信号失真称为量化失真。量化分层越多,误差越小,通常等级数是事先取定的。如何划分子区间,使量化误差最小,是量化所要研究的问题。量化可分为均匀量化(线性量化)和非均匀量化。均匀量化是一种最简单的量化方式,它将灰度值域划分成若干个等长的子区间,并用子区间的中点对应的灰度作为它的等级灰度。
pp
非均匀量化是一种最佳量化。一般说来,均匀量化引入较大的误差,我们希望在量化等级数给定的情况下,根据图象象素灰度分布概率密度函数,确定分层灰度和等级灰度,使量化后图象与原图象的均方误差最小。
经推导可以得到结论,当f(x,y)的灰度分布概率密度函数不为常数时,密度较大的地方量化等级的区间间隔要小,而概率密度较小的区间间隔要大些,这样的量化方式引入的误差最小。
这种处理方法也可用于取样过程,根据图象局部特征进行非均匀取样和非一致量化。
Pp
图象信号的数字化过程和结果:
pp
pp §3 数字图象基本特征(描述)
3.1数字图象的基本形态(我们怎么看图象的)。
1.数字图象并不是杂乱的象素数据的组合。它通常包含我们所希望得到的确定性成分和采集过程中所得到的随机成分。尽管图象的每个象素的灰度随坐标的不同而不同,而且各点灰度还随时间的变化而变化,称图象是空间坐标和时间的随机场,但它的变化并不是完全随机的,是在确定性成分的约束下变化。完全的随机模型的统计特性,往往不能确切的描述一幅图象或序列图象。
pp
2.数字图象度量单位可以有多种,例如整幅画面(帧,场),局部画面(窗口,块),行,列,象素,频率等。
3.图象作为信息的载体,对不同的用途,所关心的图象信息的含义或感兴趣的图象基元不同。比如,远距离红外小目标检测研究时,我们关心的只是目标周围小区域内的信噪比,或图象的信息量等;人脸识别时,可能关心的就是五官的形状和位置关系,至于脸色就不是很重要。
pp
3.2图象特征类型
上述图象形态并不一定很完全,但就以上所涉及的图象模型或特点,再加上对某个图象加工处理的目的不同,各种类型传感器接受客观世界的能量和状态的不同,所采用的处理方法不同,使得对图象的度量,描述是一件非常复杂的工作,从不同的角度看一幅图象会有不同的结果,要根据实际工作需要,进行研究选择。
常用的图象特征类型包括:
pp
1.象素灰度分布
图象信号数字化得到一个数值矩阵,其中每一个元素称之为象素,象素的灰(亮)度值(也包括色彩)是最基本、最原始的测量值和特征,由它可以组成更大基元的特征。单幅图象的所有象素或不同区域象素的灰度分布,代表了图象总体或局部的能量强度分布。表征灰度分布的特征描述有总体或局部的均值、方差等。
pp
2. 纹理特征
图象纹理是象素灰度分布宏观上呈现周期性的结构特征,它是图象中某些结构单元按某种规则排列而成的规则图案,反映图象纹理基元灰度周期性重复变化的规律。因此,纹理基元的大小(或重复变化的周期长短)和重复构成的方向是基本特征。常用的纹理特征描述方法有共生矩阵、等灰度行程长度、区域纹理基元参数、傅立叶频谱、随机场模型、相关长度等。
pp
3.图象的频谱特性
与一维时间函数波形类似,图象也有空间频率的概念,如果图象是一个灰度按一定周期变化,相当于周期函数,它的频率就是在某一坐标轴方向上一个单位长度的距离内,周期函数重复出现的次数,周期表示在同一方向上图象波形重复出现的最小距离。而且,图象的傅立叶变换也有明确的物理意义。
pp
4.图象灰度变化的梯度特征
图象灰度的梯度反映图象内物体边缘处灰度变化的情况,它描述了图象灰度分布的总体特征。例如,用图象象素灰度的一阶差分(梯度)的总和表示图象的对比度等。
pp
5. 图象中物体形状特征
物体的形状特征是人或机器识别的重要特征之一,在图象中可以采取图象分割的方法,将感兴趣的物体、区域或基元与背景区分开来,然后对它们的外形进行描述,常用的形状特征有面积、周长、圆度、长宽比、矩、边心距、傅立叶描绘子、偏心率和凹度等。
pp
6.图象中三维特征
图象是三维空间场景能量在二维平面的投影,二维图象中蕴含着场景中物体的三维信息。比如,多面体的各个面光强的差异表现出的立体感,一个球体不会看成平面的圆。图象的三维通常用物体表面的法线方向描述。
pp
7. 图象的运动特征
动态图象或序列图象是我们最常见的、需要快速处理并作出反应的场景图象,“时间”将作为它的另外一个变量。序列视频图象中包含着物体或目标的运动参数如速度、加速度、方向、姿态、到传感器的距离等变化信息。常用的方法用局部瞬时速度场(光流场)、特征点匹配、小平面分析和运动分割等。
pp
8.图象距离特征
距离图象是一种通过主动成象方式获取的场景三维立体信息,与场景亮度无关。目标图象距离特征对于目标图象识别有着特殊的意义,可以不受天气、伪装、复杂背景等条件的影响,全天候工作,抗干扰能力强。
pp
9. 图象信息描述
图象中包含的信息量是最关心的图象度量参数,可以想象所有象素灰度都为同一个数值,我们看到的是一张白纸,获取不了更多的信息,而一幅场景图象却有着丰富的内容,只要你认真去看,将会有无限的信息。信息论中的“熵”可以作为图象信息含量的一种描述,尽管它并不完美。图象的信息度量是复杂的,它与图象的应用目的、观察图象的人或系统的知识、性能有关。
pp
10. 图象有用和无用成分之比
图象中并不是只包含有用的信息,我们总是在图象中提取感兴趣的所谓目标部分信息,而滤除所有不关心的信息。感兴趣的目标信息与所有不关心的信息成分的比率或差别越大,提取就越容易。典型的度量指标是信噪比,即目标信号幅度除以背景信号的标准差。
pp
3.2 图象的象素灰度分布特征
象素灰度是图象各离散点量测幅度的样本值,在图象处理、识别工作所采用的所有图象特征中,它是最基本、最原始的特征数据。象素灰度分布包含着图象总体的特征,它可以在图象的特定象素点上或其邻域内测定。
对于尺寸为N*N的图象,常用的灰度分布特征有
图象灰度均值--------图象包含的平均能量。
pp
图象灰度方差(标准差)-----象素灰度分布的分散程度。
图象的对比度
pp
图象灰度一阶统计量。
最常用的描述图象灰度分布状况是一阶灰度直方图, 它实际上是图象灰度的一阶概率分布.(所谓一阶是单个象素统计,与其它象素无关.)
对于灰度为0∽(L-1)的L级图象,N(i)为具有第i级灰度的象素个数,M为图象总象素个数,则定义直方图或灰度分布概率密度函数为
灰度直方图是常用的图象灰度特征度量,它的形状和位置分布可以提供许多信息。
pp
图象灰度直方图的统计过程:
1、初始化直方图统计函数h(z),对于所有(x,y), 令 0 h [f(x,y)];
2、对于所有(x,y),计算h[f(x,y)]= h[f(x,y)]+1。
灰度直方图的包络线反映了图象灰度分布情况,直方图可以用均值、方差、偏度、峰度、能量和熵等参数描述。
与之类似还有图象灰度的二维直方图,设(I,j)、(k,l)为两个任意象素,其灰度分别为f(I,j)=a,f(k,l)=b,它们之间距离为r,二者连线与水平线夹角为θ,则有二维直方图
h(a,b)=N(a,b)/M
其中N(a,b)为图象中在θ方向上间距为r的象素对f(I,j)=a,f(k,l)=b出现的次数,M为象素总数。
pp
小结:
图象是一个复杂的信息载体,精确地描述图象是困难的。只用简单的几个统计量来描述复杂的客体,会带来一些不完整、不充分的地方,比如上述灰度特征并没有考虑象素灰度的空间分布,同样的均值、方差或直方图,其图象可以完全不同。因此,在分析处理图象时,应根据实际情况有针对性地研究图象的特征描述。
pp
§4数字图象处理系统
数字图象处理系统的模型为
g(x,y)=S[f(x,y)]
一般来说,数字图象处理系统的输入、输出是图象,这也是它与图象分析和模式识别的差别,后二者通常输出的是特征描述和类别。数字图象处理系统S包括硬件和软件两部分,硬件一般包含计算机、图象输入输出设备、图象存储和传输设备等,而软件除系统程序外,还应有专用的图象处理标准程序等。
pp
数字图象处理系统按照应用目的可分为通用和专用两种类型。下图为通用型系统框图,主要用于方法研究、大型计算、多媒体技术研究、视频制作等。
专用型处理系统处理任务单一,但对系统体积、重量、处理速度、功耗、成本等有特定的要求,结构与上图类似,删除不必要的部件,计算机通常选DSP。
pp
专用型数字图象处理系统设计过程:
1.任务描述:透彻了解特定任务场景图象和任务目的,分析任务中的难点和技术关键,建立算法概念模型。
2.方案论证:确定总体设计方案,在通用图象处理系统上进行算法模拟试验,验证设计方案的技术可行性。
3.硬件设计:选择确定元器件,设计逻辑图、电路图、印制版布线图,加工、装配和调试硬件电路。
4.软件设计:根据系统硬件资源进行程序软件设计,编制应用程序和调试程序。
5.系统联调:在硬件、软件分系统组装调试完成后,进行系统整体调试、检验系统技术指标、测试系统性能。
Pp
参考书目
1.《数字图象处理》 冈萨雷斯,科学出版社
2.《数字图象处理》 余松煜等,电子工业出版社
3.《计算机图象处理》 荆仁杰等,浙江大学出版社
4.《Computer Image Processing & Recognition》 Hall
5.《Digital Image Processing》 大学计算机教育丛书(影印版) 清华出版社
图象信号的数字化过程和结果: