我们可以知道 原始矩阵X的一个最优p列解。经过奇异值分解后,LSI将一个文本 投影到一个低维特征空间,如下:

                                        (2)

其中 是文本 (i=1,2,,n.)的潜在语义索引。 是将文本投影到潜在语义空间的投影矩阵。 是一个对角矩阵,它用于在潜在语义空间重新标度文本的特征。对于一个给定的从资料库中提取信息的要求q,它是通过下式来投影到潜在语义空间:

                                (3)

在传统的信息检索任务中,文件是根据它们在潜在语义空间的要求q的相似性来进行排列的。一个常用的相似性度量方法是余弦相似度的度量,如下:

        (4)

其中 代表向量之间的内积, 表示一个向量的Frobenius范数。下面的定理1将经典LSI重构为一个优化问题:

定理1:令 ,经典LSI可以按以下方式重构为优化问题:源.自/吹冰·论\文'网·www.chuibin.com/

          

s.t.  W=I, W          (5)

在这里, 表示的是所有对角线元素的总和,即矩阵 的迹。

2.2.2  LSI下的特征选择(FSLSI)的实现

线性降维问题一般来说可以被定义为寻找一个最佳线性函数f: (通常p d),使得向量 可以通过关系式: 投影到一个维度更低的特征空间,其中W 是投影矩阵。传统的降维方法大致可以分为两类,特征提取和特征选择算法。根据一般的降维框架,这两类算法都可以看作是根据一定的目标函数J(W)来寻找最佳的W。

上一篇:JAI相机图像采集程序实现和参数选取研究
下一篇:彩色图像融合客观评价指标研究

遥感影像自动变化检测技术中的样本选择研究

局部特征匹配的一致性评估方法

MAG3110无线智能停车平台中...

Wireshark的P2P文件共享中的行为提取软件设计

C语言在计算机中的应用探讨

电子商务中的移动支付安全问题研究

Python广告投放分类问题中的特征提取方法

新疆农林高校學生昆虫生...

淮安市高校足球运动损伤问卷调查表

大淘宝网的虚假交易研究

发酵米粉优势菌株的发酵特性研究

肢体语言在小学英语教学中的应用浅谈

日语论文中日酒文化对比研究

激光模拟训练器材国内外研究现状

2021年什么行业赚钱,适合...

个案管理茬老年糖尿病患...

浅谈农村大气环境保护的制度构建【1868字】