载波片图像分类模型解答数学建模 第3页
其具体过程如下:
1)从已知类别第1类(即Tea_Orange类)的容量为 (在Tea_Orange中 =99)的训练样本中,剔除其中一个样品,用剩余的 的训练样本和其他类别的所有个训练样本一起建立判别函数;
2)用1)得到的判别函数判定提出的类别中的样本应该属于那一类
3)将1)中剔除的样本返回到原类中继续作为训练样本
4)重复1),2),3),对第一类的 个样本进行判定,并得出
表示对第一类中所有的训练样本通过我们的判定方法得出的将本来属于第一类的样本判定为其他类别的个数
5)按照1),2),3),4)的处理,依次计算出
通过上面的分析,我们得到下面的交叉确认估计矩阵:
分析该矩阵可以得出我们判定方法的误判率求解公式为:
将上面描述的流程转化为matalab程序我们得到如下结果
1)使用欧氏距离判定法的误判率
交叉确认矩阵: P 9.9%
2)使用兰氏距离判定法的误判率
交叉确认矩阵: P 9.6%
对两种判定方法进行分析,可以发现两种判定方法的误判率并不大,因此,在精度要求不太高的情况下,我们可以采用这两种判定方法。
5.2.6对欧氏距离和兰氏距离判定结果的分析
通过上面对两种判定方法的检验后,我们编写了matlab程序分别计算样本与已知类别中心点的欧氏距离和兰氏距离,并按距离最短原则将待判定样本进行分类,最终得到如下结果:
属于第一类的待判定样本10个为:(2、3、6、8、9、14、17、18、20、21)
属于第二类的待判定样本5个为:(1、7、10、11、15)
属于第三类的待判定样本5个为:(12、22、26、28、29)
属于第四类的待判定样本7个为:(19、23、25、27、31、32、33)
于两种用距离分析法对样本序号为(4、5、13、16、24、30)的样本判定结果不一致所以我们将其归为不确定类:
问题3:样本反应时间模型:
5.3.1,时刻中心点的求取
对于每一个类别来说,我们都做了11次实验(除了第一类物质没有第0分钟的第3次实验的样本、第三类物质多了一个在0分钟以前的样本和一个在180分钟以后的样本)。每次实验中图片拍摄的时间都是相同的。例如:第一类物质拍摄的时刻为:(0、1、5、30、60、90、120、180、240)min。而对于每一个拍摄时刻它有11的样本。所以我们在此求出对于不同的类别不同的时刻求出它的中心点 (第i类物质在t时刻的中心店向量)。方法与求取每一类物质的中心的方法一直。
例如,对于第一类样本在5分钟时的中心点,我们就是对在5分钟时的11个样本求平均,得到它的中心点向量。所以对于第1类物质,它有9个中心点,第2类6个中心点,第3类8个中心点,第4类8个中心点。
5.3.2 反应时间模型
由于问题2解答的解答过程中,我们已经得到待测样本所属类别。基于此点我们只需要将待测样本在所属类别内个时刻的中心点求距离,估计样本的反应时间。由于待测样本与每个中心点的距离不一定为0,所以我们不能把与它最近的中心点的时间看作它的反应时间。对于此,我们利用线性插值方法估计它的反应时间。基于假设3:待测样本的拍摄时刻不能超出240分钟和模型假设5:假设颜色的三个指标R、G、B在两个时刻间均匀变化。对于待测样本来说,他的时间总是处于两个拍摄时间之间,例如待测样本在第163分钟时间拍摄的,它处在120分钟和180分钟间或者更大的范围。所以我们建立以下模型:
:第i个待测样本的反应时间; :第i个待测样本在所属类别内与他最近的中心点的距离;
:第i个待测样本在所属类别内与它距离他其次的中心点的距离;
:第i个待测样本在所属类别内与他最近的中心点的反应时间;
:第i个待测样本在所属类别内与它距离其次的中心点的反应时间;
我们利用线性插值在欧氏距离的情况下对每个样本的反应时间做出估计,在matlab中编程实现,结果如下: