用身高和体重数据进行性别分类的实验报告.docx

上传人:lao****ou 文档编号:145511 上传时间:2023-04-16 格式:DOCX 页数:14 大小:163.70KB
下载 相关 举报
用身高和体重数据进行性别分类的实验报告.docx_第1页
第1页 / 共14页
用身高和体重数据进行性别分类的实验报告.docx_第2页
第2页 / 共14页
用身高和体重数据进行性别分类的实验报告.docx_第3页
第3页 / 共14页
用身高和体重数据进行性别分类的实验报告.docx_第4页
第4页 / 共14页
用身高和体重数据进行性别分类的实验报告.docx_第5页
第5页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《用身高和体重数据进行性别分类的实验报告.docx》由会员分享,可在线阅读,更多相关《用身高和体重数据进行性别分类的实验报告.docx(14页珍藏版)》请在第一文库网上搜索。

1、实验一用身高和/或体重数据进行性别分类姓名:学号:姓名:学号:一、实验目的1)加深对Bayes分类器原理的理解和认识2)掌握Bayes分类器的设计方法二、实验内容1)用FAMALE. TXT和MALE. TXT的数据作为训练样本集,建立Bayes分类器;2)用测试样本数据test2, txt对该分类器进行测试;3)调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。三、实验步骤1)应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决

2、策规则,将该分类器应用到测试样本,考察测试错误情况.在分类器设计时可以考察采用不同先验概率(如0.5对0. 5, 0. 75对0.25,0.9对0.1等)进行实验,考察对决策规则和错误率的影响;2)用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如 0. 5 vs. 0. 5, 0. 75 vs. 0. 25, 0. 9 vs. 0. 1 等)进行实验

3、,考察对决策和错误率的影响;3)自行给出一个决策表,采用最小风险的Bayes决策重复上面的某个或全部实验。四、原理简述、程序流程图及相应结果(一)、实验一在正态分布假设下,利用最大似然法估计分布密度函数,具体过程如下:1、原理(1)、一维情况:n=1对于每个学习样本只有一个特征(取身高为特征)的简单情况:2Xk61)0 = 41,仇=. log P(Xk )=log(2=62)-n an ilog P(Xa I 夕)=Z(Xla) = 0&=1 3 1hl 02n anZ 短。gp(x&i)=2k=l。仇hl202、2(Xk-伍丁2俄=0学习样本的算术平均样本方差的最大似然估计(2)、最小错误

4、率Bayes分类器多元正态概率型下的最小错误率贝叶斯判别函数(一般情况)。判别函数:&(X)= 一;(X 一Z:(X 一 4)一 :In IZ, | + In (外)=xTWtx + 叱0叱=一3汇;(*矩阵)叱.维列向量)叱0 = 一!M 一In, I + In P(外)决策规则:&(x)= /叱叱0=X3j=max xTW.x + w1 j x e 69;.2、具体步骤:a.算出各类别特征值的均值b.求出特征值的协方差矩阵C.将第二步所得矩阵代入判别函数(X)、g2(X)d.将待测试样本集数据依次代入处(才)一32(才),若由(王)一32(才)。,则判断其为第一类,反之为第二类。3、程序流

5、程图4、实验结果及分析A)假设身高与体重相关(以训练样本建立判别函数)表3.身高和体重相关情况下男女判错统计表女生先验概率P(l)男生先验概率P(2)训练样本判错个数训1练样本错误率H,测试样本1判错个数N,测试样本错误率h2测试样本2判错个数N,.测试样本错误率h30.50.51212%12. 9%3210. 7%0. 250. 751616%38. 6%144. 7%0. 10.92424%411.4%175. 7%由表可知:对于训练样本,当女生先验概率为0.5时,判别错误率最小;对于测试样本,当女生先验概率为0.5时,测试样本1判别错误率最小;为0.25时,测试样本2判别错误率最小;故可

6、推测用最小错误率Bayes决策假设身高与体重相关当女生先验概率等于待测样本中女生样本占待测样本的概率时,错误率最小,且越远离此概率,错误率越大。最佳决策:当女生先验概率为0.5时,判别错误率较小。B)假设身高与体重不相关(以训练样本建立判别函数)表4.身高和体重不相关情况下男女判错统计表女生的先验概率P(l)男生的先验概率P(2)训练样本判错的个数Ni训练样本的错误率Hi测试样本1判错的个数n2测试样本的错误率h2样判个|3式2的 Nnlji本错数测试样本的错误率h30.50.51212%12.9%299.7%0.250.751414%12.9%196.3%0.10.91919%38.6%16

7、5.3%由表可知:对于训练样本,当女生先验概率为0.5时,判别错误率最小;对于测试样本,当女生先验概率为0.25或0.5时,测试样本1判别错误率最小;为0.1时; 测试样本2判别错误率最小;故可推测用最小错误率Bayes决策假设身高与体重不相关时当女生先验概率等于待测样本中女生样本占待测样本的概率时,错误率最小,且越远离此概率,错误率越大。最佳决策:当女生先验概率为0.25时,判别错误率总体来说较小。(三)、实验三1、原理(1)在已知先验概率P)和类条件概率密度尸凶叼),尸1,,c及给出带识别的x的情况下,根据Bayes公式计算后验概率:P(*)仆(叼)1c,一 I, ,Cp(x/9)P)z=

8、l其中先验概率P(叼)根据自行输入O(2)利用后验概率及决策表,计算条件风险R(q./x):cR (ajx) = Z % (%/叼)尸(叼 /x),,= 1,2,,q/=1(3) H(&/x) = minA(4/x),处 就是最小风险 Bayes 决策。i=L M)E (x-w) -(4)类条件概率密度:P(x/叼)二尸(x)二本实验为二维二类,故d=2, (2)中决策表自行输入(如下表)。决铲女生男生判为女生04判为男生302、程序流程图3、实验结果及分析假设身高与体重相关,贝IJ:表5.身高和体重相关情况下男女判错统计表女生的先验概率P(l)男生的先验概率P(2)训练样本判错的个数训练样本

9、的错误率H.测试样本1判错的个数n2测试样本的错误率测试样本2判错的个数测试样本的错误率0.50.53131%514. 3%8026. 7%0. 250. 754444%12. 9%4615. 3%0. 10.95757%25. 7%279%由表可知:对于训练样本,当女生先验概率为0.5时,判别错误率最小;对于测试样本,当女生先验概率为0.25时,测试样本1判别错误率最小;为0.1时,测试样本2判别错误率最小;故可推测用最小风险决策假设身高与体重相关当女生先验概率等于0. 25时有最小风险决策。五、心得与体会本次大作业我们首先对之前学过的知识复习一下,加深对贝叶斯最小错误率的理解。对于最大似然估计法,虽然老师上课有专门讲解过,但是具体操作的时候还是概念不太清晰,为此我们参考网络已有的资料又重新学习了一下,在先验概率的选择方面,我们之前选择的男生先验概率为0.5,虽然十分接近正常情况下的男女比例,但是我们得到的结果错误率较大,我们认为可能原因是我们的贝叶斯决策规则采用基于类条件概率密度函

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服