《《模式识别》试题库共享.docx》由会员分享,可在线阅读,更多相关《《模式识别》试题库共享.docx(24页珍藏版)》请在第一文库网上搜索。
1、模式识别试题库一、基本概念题U模式识别的三大核心问题:是:、O1.2、模式分布为团状时,选用聚类算法较好。1. 3欧式距离具有O马式距离具有O(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性1.4 描述模式相似的测度有:=(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度1.5 利用两类方法处理多类问题的技术途径有:(1);(2);(3)。其中最常用的是第个技术途径。1.6 判别函数的正负和数值大小在分类中的意义是:,1.7 感知器算法=(1)只适用于线性可分的情况;(2)线性可分、不可分都适用。1. 8积累位势函数法的判别界面一般为o(1)线性界面;(2)非
2、线性界面。1.9基于距离的类别可分性判据有:oSBSB(1) 1,”咒(3)110作为统计判别问题的模式分类,在()情况下,可使用聂曼-皮尔逊判决准则。1.11确定性模式非线形分类的势函数法中,位势函数K(x,XQ与积累位势函数K(X)的关系为()O1.12用作确定性模式非线形分类的势函数法,通常,两个n维向量X和Xk的函数K(x,xD若同时满足下列三个条件,都可作为势函数。();();K(x,xk)是光滑函数,且是X和珏之间距离的单调下降函数。1.13散度J”越大,说明。类模式与类模式的分布()。当。类模式与题类模式的分布相同时,Jij=()o1.14若用ParZen窗法估计模式的类概率密度
3、函数,窗口尺寸h1过小可能产生的问题是(),h1过大可能产生的问题是CIO1. 15信息炳可以作为一种可分性判据的原因是:O1.16 作为统计判别问题的模式分类,在()条件下,最小损失判决规则与最小错误判决规则是等价的。1.17 随机变量1)=p(列e1)p(列做),1(玉)又称似然比,则E1(力|做=()。在最小误判概率准则下,对数似然比Bayes判决规则为()01.18影响类概率密度估计质量的最重要因素是(JOJH:尸(四3)1ogP03)1.19基于炳的可分性判据定义为,越(),说明模式的可分性越强。当p(d力=()(i=1,2,,C)时,JH取极大值。1. 20Kn近邻元法较之于Par
4、zen窗法的优势在于1.1 2上述两种算法的共同弱点主要是()。1.21 已知有限状态自动机Af=(,Q,8,qO,F),=0,1;Q=qO,q1):8:8(q0,0)=q1,5(q0,I)=q1,8(q10)=q0,8(q11)=q;q=q;F=(qO),现有输入字符串:(a)OOO11IO1O11,(b)1100110011,(C)101100111000,(d)0010011,fR,用Af对上述字符串进行分类的结果为()。1.22 句法模式识别中模式描述方法有:=(1)符号串(2)树图(4)特征向量1. 23设集合X=a,b,c,d上的关系,R=(a,a),(a,b),(a,d),(b,
5、b),(b,a),(b,d),(c,c),(d,d),(d,a),(d,b),则a,b,c,d生成的R等价类分别为(aR=,bR=,cR=,dR=九1.24如果集合X上的关系R是传递的、()和()的,则称R是一个等价关系。1. 25一个模式识别系统由那几部分组成?画出其原理框图。1.26 统计模式识别中,模式是如何描述的。1.27 简述随机矢量之间的统计关系:不相关,正交,独立的定义及它们之间的关系。1.28 试证明,对于正态分布,不相关与独立是等价的。1.29 试证明,多元正态随机矢量的线性变换仍为多元正态随机矢量。1.30 试证明,多元正态随机矢量文的分量的线性组合是一正态随机变量。第二部
6、分分析、证明、计算题第二章聚类分析2. 1影响聚类结果的主要因素有那些?2.26 马氏距离有那些优点?2.27 如果各模式类呈现链状分布,衡量其类间距离用最小距离还是用最大距离?为什么?2.28 动态聚类算法较之于简单聚类算法的改进之处何在?层次聚类算法是动态聚类算法吗?比较层次聚类算法与C-均值算法的优劣。2. 5ISoDATA算法较之于C-均值算法的优势何在?2.6 简述最小张树算法的优点。2.7 证明马氏距离是平移不变的、非奇异线性变换不变的。2. 8设,类、气的重心分别为“丸,它们分别有样本、个。将和气合并为勾,则有=4+I个样本。另一类乃的重心为条。试证明力与勾的距离平方是2.9(1
7、)设有M类模式i=1,2,.,M,试证明总体散布矩阵&是总类内散布矩阵&与类间散布矩阵SB之和,即St=Sw+Sbo(2) 设有二维样本:x1=(1Q)T,x2=(01)T,x3=(0,0)r,x4=(2,0)和x5=(0,2)试选用一种合适的方法进行一维特征特征提取yi=Wxi要求求出变换矩阵W,并求出变换结果火,(i=123,4,5)(3) 根据(2)特征提取后的一维特征,选用一种合适的聚类算法将这些样本分为两类,要求每类样本个数不少于两个,并写出聚类过程。2. 10试给出C-均值算法的算法流程图;亨)(2) 试证明C-均值算法可使误差平方和准则M最小。其中,k是迭代次数;知是9的样本均值
8、。2 .11现有2k+1个一维样本,其中k个样本在x=-2处重合,另k个样本在X二0处重合,只有1个在X二a0处。若a=2(k+1),证明,使误差平方和准则JC最小的两类划分是X=O处的k个样本与x=a处的1个样本为一类,其余为另一类。这里,CNjJc=ZZ(xi-nij)2j=1i=1其中,c为类别数,Nj是第j类的样本个数,XifCOj,i=1,2,.,Nj,mj是第j类的样本均值。3 .12有样本集(八1八时(4),(5),(6),试用谱系聚类算法对其分类。已-氐_泸.)2.13设有样本集S=M,X2,“,X3,证明类心Z到S中各样本点距离平方和,=i为最2=-?.曰2.14假设S为模式
9、矢量集*上的距离相似侧度,有丫*0,5&,)0且当0,dxfy)=a1sxfy)证明d是距离差异性测度。2.15证明欧氏距离满足旋转不变性。提示:运用MinkoWSki不等式,对于两矢量x=Xi,XT和7SS(SS、1SS(SS、7ss(SS、1SS(SS、(、C4-min,omin.,maxInaXUaygJavg,meaf,oJGQ/1 Up1UP11/p4J)O,s(x,y)。,那么对于KaMSay)+a也是类X上的距离测度。(b)如果d是类X上的距离差异性测度,那么对于V0,d+a也是类X上的距离差异性测度2.17 假设f:夫夫,是连续单调递增函数,满足f(1)+f(y)+y)*yed
10、是类X上的距离差异性测度且。证明也是类X上的距离差异性测度。2.18 假设S为类X上的距离相似侧度,有Vx,yo,s(x,y)o,7是连续单调递增函数,满足f(X)+,6NVx,yR*证明f(X)是X上的距离相似侧度。2.19证明:对于模式矢量集X上任意两个矢量玉和亍有J8(元刃元刃VJ(元刃力*2. 20(a)证明公式,=1中0,刃的最大最小值分别是和U.D/。I/S;=(!(,%)1)(b)证明当qT+。时,公式i1中Sf(xS)=max()qS(Xj,V)2.21 假设d是模式矢量集X上的差异性测度,F是相应相似测度。S:*,Cf-QX,CuX证明PSIPWps其中S吗和a-是分别根据,
11、和d所定义的。的定义来自于下面公式,其中第一个集合只含有一个矢量。提示:平均亲近函数口Dj,其中和也分别是集合9和。/的1fPr1ri势。即使中是测度,显然g不是测度。在公式中,U和,中的所有矢量都参与计算。2.22 假设X,yeJ。证明2(珞y)=JdH5g(s)k/max尸小广力,定义距”“为Jt刁3y).尤一y,+,(/2)dX1),这个距离曾被提议作为欧氏距离的近似值。(a)证明是距离。(b)比较d”和的计算更杂度。2.24若定义下列准则函数人二3一叫)TS(x-4)=xeXj其中V是Xi中M个样本的均值向量,Sr是总散布矩阵,(1)证明“对数据的非奇异线形变换具有不变性。(2)证明把
12、X,中的样本转移到X,中去,则使七成变为=J-E(f_a,yS;(-a,J-vJ-(f-zn/S?(x-zn.)(3)写出使最小化的迭代程序。2.25证明对于C-均值算法,聚类准则函数满足使算法收敛的条件。(即若(1)试用感知器算法求判别函数gi(x),使之满足,若XiEtoi则gi(x)0,i=1,2,3;(2)求出相应的判决界面方程,并画出解区域的示意图。给定校正增量因子C=I,初始值可以取:Wi(I)=(4,-9,-4),W2(1)=(4.1.-4,),W3(1)=(-4,T,-6)To3.5 已知co1:(0,0),(2:(IJ)T),ffi3:(-1J)To用感知器算法求该三类问题的判别函数,并画出解区域。3.6 试证明:(1)从云到超平面亦)=讦仔+印。=的距离F11是在8代)=的约束条件下,使一*达到极小的解。-g(D-(2)元在超平面上的投影是111。3.7设有一维空间二次判别函数gW=5+7x+9x2,试将其映射成广义齐次线性判别函数g(x)=a。3.8对二维线性判别函数g(力=+2X2-2(1)将判别函数写成Se=Ux+彩