用身高和体重数据进行分类实验.docx

上传人:lao****ou 文档编号:145496 上传时间:2023-04-16 格式:DOCX 页数:3 大小:9.15KB
下载 相关 举报
用身高和体重数据进行分类实验.docx_第1页
第1页 / 共3页
用身高和体重数据进行分类实验.docx_第2页
第2页 / 共3页
用身高和体重数据进行分类实验.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《用身高和体重数据进行分类实验.docx》由会员分享,可在线阅读,更多相关《用身高和体重数据进行分类实验.docx(3页珍藏版)》请在第一文库网上搜索。

1、用身高和体重数据进行分类实验用身高和体重数据进行性别分类的实验报告一、基本要求:1.用famale. txt和male. txt的数据作为训练样本集,建立bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。二、具体做法:(1)单特征实验:以(a)身高或(b)体重数据为特征,在正态分布假设下,使用最大似然法或贝叶斯估计法估计分布密度参数,建立最小错误率贝叶斯分类器,编写决策规则,将分类器应用于测试样本并调查测试错误。在分类器设计中,我们可以使用不同的先验概率(如0. 5到0. 5、0. 75到0.

2、25、0. 9到0.1等)进行实验,以研究对决策规则和错误率的影响。(2)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0. 5vs. 0. 5, 0. 75vs. 0. 25, 0. 9vs. 0. 1等)进行实验,考察对决策和错误率的影响。(3)自己做一个决策表,用最小风险的贝叶斯决策重复上述一个或所有实验。三、原理简述及程序框图基于高度的最

3、小错误率贝叶斯分类器(1)第一步求出训练样本的方差和期望第二步是利用一元正态分布公式计算条件概率。第三步是将前两步的值引入贝叶斯公式第四步若pf=pm,则判断其为第一类,反之,第二类(2-1)假设身高与体重无关令协方差矩阵次对角元素为零判别函数可以简化为GI?十、xtwix?维克斯? wiO1 其中 wi?i?l, wi?l?i211? IwiO? ?美国犹他州? U在里面我inp? ?我H22具体算法步骤如下:第一步将训练样本集数据转为矩阵fa, mao第二步是分别计算FA和Ma的协方差? 1. 2.使协方差矩阵次对角元素为零,平均值?1,?2并输入先验概率p?l?,p?2?第三步是将第二步

4、得到的值代入判别函数表达式,得到G1?十、g2?十、第四步将待测样本集数据转为矩阵t,将t中数值依次代gl?x?g2?x?如果是G1?十、g2?十、0,判断为第一类,否则判断为第二类。(2-2)假设身高与体重相关判别函数可以简化为GI?十、xtwix?维克斯? wiO1 其中 wi?i?l, wi?l?i211? lwiO? ?美国犹他州? U在里面我inp? ?我I2i2具体算法步骤如下:第一步将训练样本集数据转为矩阵fa, mao第二步是分别计算FA和Ma的协方差? L平均2分? L 2,输入先验知识概率 p?l?, p?2?第三步是将第二步得到的值代入判别函数表达式,得到G1?十、g2?

5、十、第四步将待测样本集数据转为矩阵t,将t中数值依次代gl?x?g2?x?,如果G1?十、g2?十、0,判断为第一类,否则判断为第二类。最小风险bayes分类器(1)给定一个先验概率p? ? J类条件概率密度P?十、J当J=1时,。给出了具有识别的C和X,后验概率根据Bayes公式计算:p?jx?p?x?j?p?j?p?x?p?iii?lc, j?l, ?, c(2)使用后验概率和决策表,条件风险r?艾克斯?r?ix?i?j?p?jx?, i?l, ?, a我lc (3) r? akx? ?明儿?艾克斯AK是最小风险贝叶斯决策。其中,(1)中的先验概率为p? ? J根据自我输入,类条件概率密度

6、p?x?j?=p?x?l?2?d2?12t?l?exp?x?u?l(x?u) ?,本实验? 2.它是二维的,第二类,所以d=2。决策表可以自己输入。四实验结果及分析总结误差率最小的贝叶斯决策(1)基于身高身高(300个测试样本)女孩误判测试样本的先验概率为0. 90. 750. 50. 250. 1(2-1)身高与体重不相关(300个样本)女孩误判测试样本的先验概率为0. 90. 750. 50. 250. 1(2-2)假设身高与体重相关(300个测试样本)数字 0. 10. 250. 50. 750. 9574427158 1124880. 7%85%90. 3%93 7%94 7%正确率数

7、字0. 10. 250. 50. 750.91476423104 02410135设78%9设93. 3%94. 3%正确率性别:女性性别:男性性别:男性性别:男性误算女性先前误算概率测试样本数:0.90.750. 50. 250.1(2)用最小风险的bayes决策什么时候做出决定的个数正确率 0. 10. 250. 50. 750. 99759318411161267. 3%80%89. 3%95. 3%94. 7%女生 02男生30判为女生判为男生身高体重相关(300个测试样本)女孩误判测试样本的先验概率为0. 90. 750. 50. 250. 1结论:当女生先验概率等于待测样本中女生样本占待测样本的概率时,准确度,离这个概率越远,准确度越小。0. 10. 250. 50. 750. 980462063 的个数 11491673%84. 3%92%95%93. 7%正确率

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服