http://journal.shouxi.net/upload/pdf/21/1922/105488_2378.pdf
数据场在信息表征中的应用
戴晓军1 ,2 , 刘常昱1 ,2 , 韩 旭1 ,2 , 李德毅3
(1. 解放军理工大学通信工程学院南京 210016 ; 2. 武汉大学软件工程国家重点实验室,武汉 430072 ;
3. 中国电子系统工程研究所,北京 100039)
摘 要: 思维、想象和知识发现过程,实际上是在不同粒度上认识数据、概念和图像,是发现状态空间在不同抽
象层次上的知识表现,是从高维数据和图像空间降维的过程,也就是丢舍不太重要的特征数据,留下主成分后的
发现状态空间的知识表现. 并认为数域空间中的每个数据点通过某种作用力而相互影响形成数据场. 此外,阐述
了数据场的主要思想并从数据场在图像数据挖掘中的应用出发,试着对形象思维的信息表征作了一些有益的尝
试.
关键词: 数据场; 发现状态空间; 形象思维; 图像数据挖掘
中图分类号: TP 391 文献标识码: A
从人工智能的角度,我们认为人类智能可以分为数学计算(computing) 、逻辑思维(logical thinking) 和
形象思维(thinking in images) . 比如人类如何认识数和进行数的计算称之为计算智能;如何抽象,如何建
立公理系统、符号系统和推理机制的智能称之为逻辑思维能力;通过直觉感知对象的图像,进行想象、类
比、联想或顿悟的智能称之为形象思维能力. 回顾人工智能近50 年的发展我们发现人工智能实现了如下
智能:数学运算的机械化,比如计算尺、机械计算器、电子计算机等计算器(computer) ;体力劳动的机械化,
比如机器手(人) (robot) ;以及逻辑思维的形式化和程序化,比如包含了符号系统,谓词演算,知识基,推理
引擎的专家系统(expert system) . 对形象思维的智能化目前研究的比较少,也就是通过直觉感知对象的图
像,进行想象、类比、联想或顿悟的智能. 本文试着从数据场在图像数据挖掘中的应用出发在形象思维的信
息表征方面做一些尝试.
1 数据场
物理学中研究的问题往往涉及分布在一定空间区域中的物理量,通常称之为”场”,如引力场、电场等.
描述场的属性的物理量通常是一个以空间位置(坐标) 为自变量的矢量函数或标量函数,物理学中分别称
之为矢量场和标量场. 势场是一种重要的标量场,势函数是质点位置的函数,物理学中通常用等势线或等
势面来描述势函数在空间中的分布,如等高线、等温面.
我们将以上物理学中场的概念推广到数域空间,认为数域空间中每个数据对象都相当于一个点电荷
或质点,其周围存在一个作用场,位于场中的任何其他数据对象都将受到影响,因此,整个数域空间就构成
一个数据场.
在描述数据场的属性时,我们引入标量函数———势函数. 势函数是位置或距离的函数,可以叠加,因
此,数域空间中每一个数据对象对场中任何一点的势都有贡献,且贡献的大小与两者间的距离平方成反
比. 直观上,数据密集区应有较大的势,而数据稀疏区的势也相对较小.
X 收稿日期: 2004205212
基金项目: 国家自然科学基金资助项目(60375016 ;60496323)
作者简介: 戴晓军(1979 —) ,男,硕士研究生;李德毅(1944 —) ,男,中国工程院院士.
数据场中任何一点x 上的势函数被定义为所有数据点的影响之和. 给定n 个数据点,距离D =
{ d1 , . . . , dn} ,在x 上的势函数定义为:
f ( x) = 6n
i =1
ρi
e-
( d ( x , di
) )
2
2σ2 , (1)
其中d ( x , di) 表示x 到数据点di 的距离,ρi 为该点数值的大小,σ为辐射因子.σ的变换将直接影响等势
线的间距,σ越小单个数据点的影响范围越小,等势线越密;σ越大单个数据点的影响范围越大,等势线越
稀. 如图1 所示.
图1 不同σ下的数据场
Fig. 1 Data field with differentσ
单个对象的势函数显然在距离为零处的势最大,为1 ,空间无穷远处的势最小,趋于零. 事实上,根据
正态分布的“3σ规则”,当距离大于等于3σ时,势函数的取值已经近似于零;因此,场中每个对象的影响半
径可以近似为: r≈3σ. 此定义在大数据集时,可以明显地降低运算的复杂度1 .
2 数据场在信息表征中的应用
人脑的成像和计算机成像技术能不能关联? 现代思维理论认为:“形象思维”是先于“逻辑思维”而存
在于人脑的,以“形象”为主的直觉思维方式被许多人认为是思维中最主动、最具有创造力的方式. 以图像
信息的获取、传输、存储、变换、显示、理解与综合利用为核心的图形图像处理被认为是对人类形象智能的
最直接、最基本的模拟. 图形图像技术与形象思维的模拟是相辅相成的,一方面,图形图像技术的突破将为
形象思维模拟的研究提供更坚实的技术支撑,另一方面,形象思维模拟研究的进展将为图形图像技术的深
入研究提供新的起点,事实上,很多技术发展也逐步验证了这一点3 . 2003 年度医学奖获得者、劳特布尔
发现利用磁场出现梯度变化来形成二维影像的可能性,导致磁共振成像技术,成为医学诊断的一大突破.
当代计算机成像技术应该能够为模拟人脑的形象思维做出贡献.
2. 1 形象思维与图形图像技术
直觉和想象力离不开视觉、形象和形象思维;视觉、形象在大脑中残留形成一个形象思维的空间,与形
象思维关系极为密切的基本信息元———心象(mental image) 是一个富有特色的心理过程,亦称意向、表象,
包括通常所说的记忆心象和想象心象. 它是在过去对同一事物或同类事物多次感知的基础上形成的,具有
一定的间接性和概括性. 我们借鉴物理学中的场,来描述形象思维空间各个心象之间的相互作用. 广言之,
人自身的认知和思维过程,从数据到信息到知识,也可以用场来描述.
图像数据进入数据场后就从离散状态进入了连续状态,我们可以在不同的层面上对数据场进行运算,
实现很多在原始图像数据中不能实现的效果. 我们认为人类的认知过程是对复杂对象关系的中观、宏观的
知识发现过程,是对象所在的特征空间的微观数据通过用自然语言表述的不同抽象度概念的非线性相互
作用下涌现(突现) 的自组织特性. 因此无所谓数据挖掘或知识发现,仅仅是观察距离或观察角度不同而
已. 用如下例子说明我们的观点.
934 复旦学报(自然科学版) 第43 卷
2. 2 数据场与信息表征
图形图像处理就是按特定的目标,用一系列特定的、能导致预期结果的操作来“改造”图形图像. 所谓
特定的目标,可以是使图像更清晰、更适合于人的观察和识别以及由计算机自动识别和理解图像,也可以
是从图像中提取某些信息.
图2 用数据场方法处理的图像
Fig. 2 Images processed by data field
(a) 32 3 32 像素图; (b) 64 3 64 插值图; (c) 平滑图
图2 为数据场方法处理图像的例子. 由图可以看出,图像数据进入数据场后我们可以在数据场空间中
对数据进行拉伸、压缩、变形、插值、平滑等操作实现传统的图像处理效果.
记忆是人脑对过去经验中发生过的事物的反映,是心理在时间上的连续,也是新获得行为的保持. 它
是人类反应机能的一个基本方面. 有了记忆,人类的先后经验才能联系起来,心理活动也才能成为一个统
一的、发展的过程,从而使得心理发展、知识积累和个性形成得以实现.
用数据场方法实现形象思维的从感知到印象到记忆. 我们通过调整记忆因子sigma 的值改变时间粒
度,图3 体现了大脑从感知到印象到记忆的过程. 伟大的爱因斯坦那深邃的双眼给我们留下了深刻的印
象,而曾经风起云涌的萨达姆随着时间的流逝也就只剩下那动人的黑胡子了.
图3 记忆的连续性
Fig. 3 Continuity of memory
格式塔心理学( Gestalt Psychology) 始于德国“, 格式塔”在德语里是“形状”、“形态”的意思. 格式塔心
理学主要探究知觉意识的心理历程. 它的主要特点是认为整体直觉与其各部分引起的知觉有根本的区别,
整体大于各部分之和. 格式塔心理学代表人物韦特海默提出脑历程的交互影响的场论,认为脑内有一中心
位置受了刺激时,便有一定大小的神经波传播出去像投石于水时所引起的涟漪一样. 考夫卡认为,我们自
然而然地观察到的经验,都带有格式塔的特点,它们均属于心物场和同型论. 以心物场和同型论为格式塔
的总纲,由此派生出若干亚原则,称作组织律. 在考夫卡看来,每一个人,包括儿童和未开化的人,都是依照
组织律经验到有意义的知觉场的. 我们试着用数据场方法解释这些组织律. 这些良好的组织原则包括如下
方面.
a) 接近性和连续性. 某些距离较短或互相接近的部分,容易组成整体. 例如,距离较近而毗邻的两线,
自然而然地组合起来成为一个整体. 连续性指对线条的一种知觉倾向. 图4 (a) (见第936 页) 上是许多圆
点组成的阵列,它的横向和纵向距离不等. 我们一眼望去自然而然的觉得这些点排成四列. 图4 (a) 下为经
第5 期 戴晓军等:数据场在信息表征中的应用935
过数据场调整后的图,视觉效果更明显了. 这个原理在格式塔心理学中称为连续性.
图4 数据场与格式塔心理学
Fig. 4 Data field and Gestalt Psychology
(a) 连续性; (b) 完整性; (c) 相似性
b) 完整和闭合倾向. 知觉印象随环境而呈现最为完善的形式. 彼此相属的部分,容易组合成整体,反
之,彼此不相属的部分,则容易被隔离开来. 完整和闭合倾向在所有感觉中都起作用,它为知觉图形提供完
善的定界、对称和形式. 图4 (b) 上我们看到的是一对对的方括号,知觉喜欢组成有闭合性的图形,图4 (b)
下是用数据场处理的图形,可以看出视觉效果更明显了. 这在格式塔心理学中称作完整性.
c) 相似性. 如果各部分的距离相等,但它的颜色有异,那么颜色相同的部分就自然组合成为整体. 这说
明相似的部分容易组成整体. 图4 (c) 上,我们觉得两个黑色圆一组,两个空心圆一组,图4 (c) 下为经过数
据场调整后的图,下面的视觉效果更明显了. 知觉总是把相似的事物联系在一起,这在格式塔心理学中称
为相似性.
思维、想象和知识发现过程,实际上是在不同粒度上认识数据、概念和图像,是发现状态空间在不同抽
象层次上的知识表现;是从高维数据和图像空间降维的过程,也就是丢舍掉不太重要的特征数据,留下主
成分后的发现状态空间的知识表现4 ,5 . 在物理学中常常会遇到这样的情况,在高维空间中的两个物体是
不同的,但是把它们投影到低维空间,看上去就是一样的了.“看上去是一样的”,有时被称为简并,或归约.
形象思维也可以借助物理学的方法,进行归约. 我们从数据场在图像信息表征中的应用出发,试着对形象
思维问题作一些有益的解释,我们的研究是初步的也是具有开拓性的,希望能为有识之士提供一个新的思
路.
参考文献:
1 吕辉军. 基于数据场的人脸识别研究Z . 南京:解放军理工大学, 2002.
2 鲁道夫·阿斯海姆. 视觉思维M . 腾守尧译. 北京:光明日报出版社,1986.
3 陆汝钤. 世纪之交的知识工程与知识科学M . 北京:清华大学出版社,2001.
4 李德毅,王 晔,吕辉军. 知识发现机理研究A . 见:钟义信编. CAAI29 (全国第九届人工智能年会) 论文
集《中国人工智能进展:2001》C . 北京:北京邮电大学出版社,2001. 3142324.
5 李德毅. 发现状态空间理论J . 小型微型计算机系统, 1994 , 15 (11) :126.