【研究分享】基于矩阵分解的用户建模方法研究

澄怀观道ABC 发表于 2018-08-25 19:35:10 | 打印



《闻歌前沿研究讲坛》第四期,邀请来自中科院自动化所互联网大数据研究中心、中科闻歌核心技术研发团队成员王灿,为我们带来《基于矩阵分解的用户建模方法研究》


摘要

本次分享活动介绍了基于矩阵分解的用户建模方法方面的研究成果。针对传统矩阵分解模型提出两方面的改进。一方面,用户兴趣与内容文本语义关联紧密相关,在传统矩阵分解模型中融入文本语义,提出融合文本语义的用户兴趣预测方法,全面刻画用户兴趣;另一方面,用户兴趣会随时间发生变化,且用户兴趣会受到与其有关联关系的其他用户的影响,在传统矩阵分解模型中融入时间信息和用户关联关系信息,提出融合时间与用户关系的用户兴趣预测方法,捕获用户兴趣变化,协助快速定位用户感兴趣的内容。




随着信息技术的发展,人们已经进入信息过载时代,基于用户的历史行为,通过用户兴趣挖掘,构建用户兴趣模型,从而帮助用户在海量信息中快速获取感兴趣的内容。



1、 经典矩阵分解用户兴趣预测

 

通过历史用户-内容交互矩阵,学习用户以及内容的潜在表示。




2、 融合文本语义的用户兴趣预测


传统矩阵分解方法只考虑用户的点击、浏览行为,忽略了内容文本间的语义关联信息对用户兴趣的影响。例如新闻推荐场景下,用户兴趣与新闻内容语义紧密相关,用户倾向于浏览相关或相似内容。因此,我们提出一种融合文本语义的用户兴趣预测方法。


具体来说,文本间具有多种语义关联相似性:

a)      共现相似性:语义相关联的内容通常会共同出现在同一个用户的行为中;

b)      语义相似性:语义相关联的内容之间的文本语义通常相近;

c)      社交相似性:同一个用户发布的内容通常具有语义关联性;


该模型首先根据用户与内容的历史交互记录构建用户-内容矩阵,同时根据内容间的共现相似性、语义相似性、社交相似性构建内容-内容语义关联矩阵,进而对用户-内容矩阵、内容-内容矩阵进行协同分解,学习得到用户与内容的潜在空间表示,预测用户未来的行为兴趣。



3、 融合时间与用户关系的用户兴趣预测


实际中,用户的兴趣会随着时间而发生演变。在新闻推荐场景中,由于新闻内容更新频繁,用户的兴趣也会随时间发生大的改变。同时,随着社会媒体的兴起,用户间的链接关系为辅助用户兴趣挖掘提供了丰富的信息来源。针对社会媒体信息更新频繁和社会媒体中用户关联紧密的特点,提出了一种融合时间信息与用户链接关系的用户兴趣预测方法,协助快速定位用户感兴趣的内容。



该模型首先根据时间将用户不同时间段的历史记录表示成用户兴趣集合,并将用户间的链接关系表示成用户关联矩阵,然后基于概率矩阵分解技术和时间衰减函数,将不同时间段的用户兴趣矩阵与用户关联矩阵相融合,协同分解,学习得到用户潜在空间的兴趣分布向量,最后预测用户未来兴趣。


4、 未来工作


针对媒体大数据中,用户行为模式多样、用户交互平台多样的特点,如何建模多异质、多平台信息是我们未来要解决的挑战性问题,具体来说我们将从以下两个方面展开研究:





对本次主题内容感兴趣的小伙伴可以在本公众号对话框直接回复关键词“前沿讲坛第四期”,即可获得本期讲座课件。





>> 了解更多中科闻歌的消息,请阅读:

1、自动化所党委书记牟克雄考察中科闻歌

2、【媒体报道】中国青年网:十年领跑智媒体大数据 中国合伙人不讲商业故事

3、【研究分享】基于认知激活的文本隐含语义分析与增强表示

4、自动化所所领导战超书记莅临中科闻歌指导工作

5、【干货分享】风口下的医疗大数据价值发现与思考







本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

国内网站建设费用联盟

© 2017-2018 cqydfl.com