10
3。2 研究的过程 12
3。2。1 研究的分析阶段 12
3。2。2 数据识别 12
3。2。3 样本选择阶段 14
3。2。4 数据建模阶段 15
3。2。5 产品类别推荐 15
4 结论与分析 15
4。1 建模结果及模型分析 15
4。2 实验过程遇到的问题 18
4。3 研究结果的产品推荐 18
4。4 结论与分析 20
5 个性化的实际应用 22
结论 24
致谢 25
参考文献 26
图1流程图 11
图2空值图 13
图3无效图 13
图4省份统一图 13
图5类型不符图 14
图6随机森林图 16
图7重要指标图 17
图8决策树图1 17
图9决策树图2 18
图10产品匹配图 19
1 绪论
1。1 背景及意义
随着IT技术不断发展,通讯技术不断提高,社会已逐步进入了信息时代。在这个时代中,信息数量巨大,信息类型多样,信息内容杂乱。用户作为信息的拥有者和需求者,如何从海量的数据中获取自己想要的信息,如何从看似毫无关联的数据中寻找自己感兴趣的内容,这已成了信息时代一个明显的需求特征。
个性化推荐作为一个新兴的信息过滤技术,它利用用户信息与产品信息的关系,通过分析历史数据,采用相似性原理以及匹配原理,从大量数据中过滤出用户感兴趣的内容,并以一定的方式呈现在用户面前。这样,用户就不用为了找到自己感兴趣的内容而寻找大量的数据,提高效率,节省时间,电子商务网站也能通过个性化推荐提高用户的忠诚度、网页的使用效率以及用户对网站的粘性。
事实上,个性化推荐系统是当今时代最为流行的信息过载处理的工具,在电子商务上有着广泛的应用,在历史上已经有着长足的发展。从个性化推荐系统发展至今,已经提出了好几种推荐方法,其中,最为流行的是协同过滤算法。这是一种基于相似性原理进行匹配的算法。通过用户对各类产品进行评分,最终得出用户之间的相似性,对相似性高的用户进行相关的处理,最后把产品推荐给用户。除了协同过滤算法,还有基于内容的个性化推荐算法,基于用户统计信息的个性化推荐算法,基于关联分析的个性化推荐算法。论文网
本文采用基于用户统计信息的个性化推荐系统来进行研究,原因如下:研究的数据来源于新一站保险网,保险网的产品购买具有临时性和长久性,很多保险类产品在一段时间中只被少数购买甚至不购买,不适合现下比较流行的个性化推荐算法;其次,新一站保险网的信息很多是用户的个人信息,信息涉及到用户的隐私,适合基于用户统计信息的个性化推荐算法;新一站的数据主要描述的是用户信息,用户对产品的感兴趣程度没有很明显的展示出来,所以也不适合流行的个性化推荐算法。 R语言基于用户行为分析B2C网站个性化推荐方法研究(2):http://www.chuibin.com/jisuanji/lunwen_98002.html