《推荐算法学习.pptx》由会员分享,可在线阅读,更多相关《推荐算法学习.pptx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、常用算法传统协同过滤基于商品的协同过滤关联规则聚类第1页/共19页常用算法传统协同过滤基于商品的协同过滤关联规则聚类第2页/共19页传统协同过滤算法第3页/共19页传统协同过滤算法介绍1.用mn的矩阵表示用户对物品的喜好情况,一般用打分表示用户对物品的喜好程度,分数越高表示越喜欢这个物品,0表示没有买过该物品。2.图中行表示一个用户,列表示一个物品,Uij表示用户i对物品j的打分情况。3.CF分为两个过程,一个为预测过程,另一个为推荐过程。预测过程是预测用户对没有购买过的物品的可能打分值,推荐是根据预测阶段的结果推荐用户最可能喜欢的一个或Top-N个物品第4页/共19页基于用户的协同过滤例子第
2、5页/共19页基于用户的CF算法简介1.基本思想:基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户2.计算方法:将一个用户对所有物品的偏好作为一个向量 来计算用户之间的相似度,找到 K 邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。第6页/共19页常用算法传统协同过滤基于商品的协同过滤关联规则聚类第7页/共19页基于商品的协同过滤例子第8页/共19页基于商品的CF算法简介1.基本思想:与基于用户的CF类似,计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用
3、户的历史偏好,推荐相似的物品给他2.计算方法:所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度,得到物品的相似物品后,根据用户历史的偏好预测当前用户还没有表示偏好的 物品,计算得到一个排序的物品列表作为推荐第9页/共19页基于用户与基于商品的比较计算复杂度 适用场景推荐的多样性和精度第10页/共19页计算复杂度对电子商务网站,用户数远大于商品数,而且商品数据相对稳定,因此计算物品的相似度计算量相对小,而且不用频繁更新,而且计算工作可以离线进行对于新闻,博客,微博的推荐系统,物品数量往往是海量的,更新更频繁第11页/共19页适用场景非社交网络的网站中,内容内在的联系是很重要的推荐原则,
4、它比基于相似用户的推荐原则更加有效,比如购书网站amazon社交网络的网站,基于用户的CF是更好的选择第12页/共19页推荐的多样性和精度研究推荐引擎的学者们在相同的数据集合上分别用 User CF 和 Item CF 计算推荐结果,发现推荐列表中,只有 50%是一样的,还有 50%完全不同。但是这两个算法确有相似的精度,所以可以说,这两个算法是很互补的。精确度,基于用户的更好覆盖率coverage,是指一个推荐系统是否能够提供给所有用户丰富的选择,基于商品的更好第13页/共19页常用算法传统协同过滤基于商品的协同过滤关联规则聚类第14页/共19页关联规则推荐1.根据商品的营销记录,挖掘出商品
5、中的一些关联规则比如“A-B”然后,然后根据关联规则进行推荐。2.如果“A-B”是一个关联规则,那么对于购买了商品A的用户,我们给他推荐商品B第15页/共19页聚类推荐对用户进行细分,分成不同的类,相似的客户被分配到同一个类中计算当前用户,与各个类的相似程度,找出这个用户最相似的一个或者几个类根据用户所属的类,推荐相应的物品给用户第16页/共19页Slope OneMahout的推荐算法简单容易实现高效精确度高第17页/共19页Slope One 基本原理1.用户X,Y都购买了item1和item2,而且都有评分,A购买了Item1,也给了评分,那么A会给Item2多少评分?4-(5-3)+(4-3)/2=2.52.考虑评分的权重第18页/共19页感谢您的观看!第19页/共19页