我的研究心得

推荐系统技术 基于内容的建议


基于内容的方法在信息检索方面有其基础,并且基于用户更喜欢项目的想法,这些项目类似于他们之前表达过的项目。基于内容的推荐系统分析项目描述以识别对用户特别感兴趣的项目,并且他们关注项目的特征。

项目的相似性通过测量其特征的相似性来确定。实际上,推荐系统试图推荐与给定用户过去喜欢的项目类似的项目。这样的系统分析用户先前已经评级的项目的一组特征,并基于该用户评定的项目的特征构建用户兴趣的模型或简档。例如,可以通过决定用户是否对特定网页感兴趣来使用这种模型来过滤搜索结果。

这种推荐的一个例子是特定酒店根据其星级数或价格水平或是否提供户外服务的推荐。用于酒店推荐的基于内容的过滤算法可以在概念上描述如下:

系统收集一组特征以及每个用户喜欢每个特征的概率。为了确定用户最可能喜欢的酒店,系统执行该特征集与系统中的各种酒店之间的比较。比较可以包括启发式或简单的相似性计算,例如基于余弦的计算。然后系统返回代表最符合用户偏好的酒店。当大量的描述性数据可用于项目时,基于内容的过滤非常有用。这些数据可以被编码并在内部表示为特征的本体,从而提供适用于相对于用户偏好的相似性计算的域的详细描述。不过,为了有用,除了根据本体对项目进行分类的能力之外,基于内容的方案必须具有这样的本体。因此,当使用计算机算法稀疏或难以解释每个项目可用的信息时,基于内容的过滤可能是有问题的。此外,基于内容的推荐只能基于关于特定项目的可用显式信息。

在基于内容的过滤的高级架构中存在若干组件,例如项目表示,用户简档和学习用户模型的能力; 这些组件将在下面详细说明。


 


ETC注销ETC充值ETC客服ETC扣费查询


ETC发行合作