载波片图像分类模型解答数学建模 第2页

载波片图像分类模型解答数学建模 第2页
五:模型建立及求解
问题1:图片数据的提取:为了便于问题的说明,我们随机抽取了一张图片:“JH.1.6.Tea_sweet.varies.110904.KSS311004.P1.120min.jpg”作为例子来讲述图片数据的提取过程。为了校正图像在扫描时的角度偏差,我们首先对原始图片在“CorelDRAW”软件中进行校正旋转(图2所示),接着在“画图”工具中进行简单切割,去掉图像区外的边框,杂色等的干扰(图3所示),通过对图3进行“底版变黑”处理(图4所示)可初步把载波片中的目标图像从背景图像中分离出来。
图1:处理前的图像                                  图2:旋转后的图像
由于每张图片上都包含36个分离的圆斑,所以不能直接对目标图像(各个圆斑)的色度特征进行提取。必须先对卡片内的每个目标图像进行定位即先求解出每个圆斑的中心点坐标再去求其色度向量。为此我们接着对图4进行反色处理(图5所示),以排除各个圆斑颜色各异的干扰,并过滤掉背景图像。
图3:简单切割去外围边框后的图像                       图4:底版变黑处理后的图像
图5:反色处理后的图像              图6:利用搜索出像素点坐标绘制的特征图
然后利用搜索方法利用MATLAB编程搜索图中各个圆斑内的特征像素点的坐标,据搜索出的坐标绘制出图形(图6所示),结果表明从每个圆斑内采集到的特征像素点都聚集在一定区域,根据聚类分析原则中的最短距离分析法,将所有的点分成36类(每个圆斑即为一类)。再据分类结果求出每一类的中心点坐标,据坐标绘制出中心点,反映在各自特征像素点图像上的效果如图7所示
图7:中心点的图像分布(中心红色圆所示)       
从图7看出:所求中心点位置很好的标识了各个圆斑的中心位置。但由于在聚类分析过程中把圆斑的顺序打乱,导致数据在降维为一维时,从圆斑提取的数据位置与真实位置相异。所以,我们必须对每一个中心点,进行定序,以保证提取得每一个数据在位置上的对应。例如:
由于程序得到的中心点的序列是不规则的,所以我们有必要将中心点排序
1)将原来的36个中心点坐标b的两个坐标分别在其方向上分为六类,并计算出每一类的均值
2)将1)中得到的x方向的六个均值和y方向的六个均值组合,这样即可得到36个标准的中心点坐标
                                   图
                               图9:中心点定序示例图
3)将原来的36个中心点与本程序得到的标准的中心点进行比较,如果中心点与标准的中心点之差距离相差小于某个值,就把中心点的序号定为与其对应的标准点的序号

基于模型假设1:每张载波片上的每个圆斑的颜色近似看作一种颜色,所以对于每个中心点我们以之为圆心,取一个相对较小的半径2画圆,取这个圆内所有特征像素点的色度(R,G,B)的平均值,可以有效表征该圆斑的颜色信息。即每张卡片上的每个圆斑都能通过一个色度向量来代替。如此得到与该图片包含的有效信息基本等量的36个色度向量,按照公式1的放置格式得到如表1所示的色度数据形成108  1的向量。
         (公式1)
 
如此遵循图8所示的图像数据提取流程,参照上述样例的具体操作过程完成题目中所有图像的数据提取过程。为接下来的模型建立及求解准备好数据资源。
问题2:分类模型的构造及判定
  5.2.1:四个已知类别的编号
为了便于算法描述,程序执行我们对已知的四个类别分别进行编号如下表2
                       表2:四个已知类别编号
类别名 Tea_Orange Tea_orangespice Tea_spiced_chai Tea_sweet
对应编号 1 2 3 4
  5.2.2:各个类别中心点的求解
为了便于待判定样本分类模型的建立以及后续模型的求解,我们需要知道每个样本到各个类别的距离。而对于到类别的距离,我们采取待判定样本到每个已知类别的中心点的距离来计算,所以基于以上情况,我们需定义一个求解各个已知类别中心点的算法,如公式2所示:
                                                     (公式2)
 为第i类样本的中心点,为 的向量。
在matlab中把此算法编程实现,求解出各个类别的中心点。
5.2.3 欧氏距离求解
     由于我们提取后的数据,是一个降维为一维存放的向量,我们可以采用公式(3)来计算待判定数据和已知类别的数据之间的距离:
 通过matlab编程,即可求出第 个待判定样本与第 类数据的空间距离。
最后比较 , , , 的大小即可判别第 个待判定数据的类别。
5.2.4  兰氏距离求解: 
同理对于利用兰氏距离,运用同样的方法,编程实现其算法再次对待测样本进行分类。
5.2.5  分类模型科学性检验
通过分析可以发现,欧氏距离和兰氏距离侧重点各不相同,为了以后分析的正确性,与科学性,我们用交叉确认估计分析法分别对两种判定方法的误判率进行求解。
5.2.5.1 交叉确认估计分析法的过程
    交叉确认估计分析法的核心是通过对已知类别的再次判定,与已知的类别结果进行比较,来计算判定方法的的误判率

上一页  [1] [2] [3] [4] [5] 下一页

Copyright © 2007-2012 www.chuibin.com 六维论文网 版权所有