第一作者:朱振峰(1974—),男,黑龙江鸡西人,教授,博士. 研究方向为计算机视觉、机器学习、图像/视频分析与理解等. email:zhfzhu@bjtu.edu.cn.
在基于关系图约束的推荐方法中,引入用户图(项目图)约束的目的是保持原始的高维用户表征空间(高维项目表征空间)与低维的隐性用户表征空间(隐性项目表征空间)之间用户关系(项目关系)的一致性.不同于传统的基于关系图Laplacian矩阵的一致性约束,本文提出一种基于关系图邻接矩阵逼近的推荐模型,从相似性空间一致性角度进行约束,在保持高维表征空间与低维隐性空间的一致性关系的同时,可以一定程度上避免局部过拟合问题.在EachMovie与MovieLens数据集上的实验结果验证了本文算法的有效性.
In graph based recommendation methods, the goal of the graph constraint is to preserve the consistency of user relationships (item relationships) between high dimensional user representation space (item representation space) and low dimensional latent user representation space. Instead of applying the traditional Laplacian matrix based consistency constraint, a graph adjacency matrix approximation based recommendation model is proposed. In essence,the matrix approximation plays a role of directly imposing a consistency constraint on the different similarity metric spaces. Thus, not only the consistency of the user relationships (the item relationships) from different representation spaces can be well preserved, but also, the local over-fitting problem can be avoided to some extent. Experimental results on EachMovie and MovieLens datasets show the effectiveness of the proposed method.
网络技术的发展给用户带来了大量信息, 但同时也产生了信息过载[1], 为解决这一问题, 研究人员提出了搜索引擎、推荐系统[2]等方法.其中, 推荐系统在帮助用户发现有效信息的同时, 也使得信息更精准地推送给指定用户, 因此得到了广泛关注和长足发展.其中较为典型的应用如电商网站Amazon[3]的书籍推荐系统, 以及网易的云音乐推荐系统等.
经过多年研究和发展, 现有推荐技术主要包括基于内容[4]协同过滤[5, 6, 7]和混合式推荐等方法.其中, 应用最广泛且最成功的是协同过滤推荐, 它通过整合用户的历史行为信息来发现用户间或项目间的关系, 再根据这些关系将未知项目推荐给活跃用户.同时, 协同过滤推荐又分为基于内存[8]和基于模型的推荐算法, 后者也是目前推荐领域的研究重点, 其中经典的算法包括图模型和矩阵因子分解等.
基于矩阵因子分解的方法最早可追溯到由文献[9]提出的基于奇异值分解的推荐模型, 通过矩阵分解降低原始数据维度, 减少了计算量和内存占用, 但同时面临过拟合问题.文献[10, 11]提出规范化矩阵分解模型, 通过加入惩罚项, 提高了推荐准确率.由于预测评分中存在负值.文献[12]提出了非负矩阵分解方法, 将特征矩阵限制为非负矩阵, 增强了推荐内容的可解释性.
在矩阵因子分解的基础上, 研究表明:通过引入关系图约束, 可以保持高维表征空间与低维隐性空间之间用户(项目)关系的一致性, 从而改善推荐性能.文献[13]提出了融合项目关系图的非负矩阵分解算法, 揭示了隐含语义并保持了固有几何结构, 提高了推荐性能.文献[14]提出了一种基于交互式图传递模型的方法, 在评分信息空间中通过图模型交互传递用户关系和项目关系, 实现用户关系和项目关系的有效融合; 而不同于GNMF(Graph Regularized Non-negative Matrix Factorization)中的非负约束.文献[15]采用了正交约束, 达到了消除低维隐性表征空间的信息冗余的目的.
上述方法中为保持关系一致性, 图约束均以与关系图邻接矩阵对应的Laplacian矩阵的二次型的形式予以体现.但不足之处在于, 它只考虑了局部关系的一致性, 易于导致过拟合问题, 因而影响推荐性能.据此, 本文作者提出了基于关系图邻接矩阵逼近的模型, 不仅更好地保持了空间一致性关系, 而且一定程度上避免局部过拟合.本质上, 基于Laplacian矩阵关系图约束方法是以保持表征空间的一致性为出发点间接约束了高维显性空间向量和低维隐性表征空间的一致性, 而本文方法则以保持相似性空间的一致性为出发点, 利用关系图邻接矩阵的逼近直接对表征空间的一致性进行约束, 从而使推荐精确性得到进一步提升.
令
此外, 对于由n个节点构成的无向图
矩阵因子分解将稀疏且高维的评分矩阵分解为两个低维隐性表征矩阵, 进而可用重构的低维矩阵预测用户对项目的评分.研究表明:若引入关系图约束, 可以有效保持高维显性表征空间与低维隐性表征空间用户结构关系(项目结构关系)的一致性, 从而可提高推荐性能.
1.2.1 基于用户图的图传递模型
关系图是反映用户之间或者项目之间关系的图, 而对某一项目表现出相同兴趣度的用户很可能在其他项目上也有相似的兴趣度, 因此, 引入关系图可以保持原始评分矩阵中的结构, 给出更精准的推荐.以基于用户图的模型[14]为例, 根据原始评分矩阵抽取出的用户评分向量, 构建用户关系图
式中:
式中:
通过对式(2)优化求解, 得到
基于上述预测矩阵
1.2.2 基于规范化图的非负矩阵分解
现有的NMF方法[7]是在欧氏空间实现对原始评分矩阵的低秩拟合, 不能很好地保持数据信息的固有几何结构, 据此, 文献[13]提出了基于规范化图的非负矩阵分解方法(GNMF), 基于局部不变性假设, 构建数据节点间的近邻关系图, 保持了数据信息固有的几何结构.本质上, GNMF整合了NMF和Laplacian特征映射的特点, 其模型为
式中:
推导可得
式中:
1.2.3 应用半监督多标签学习的推荐模型
引入关系图可以显著提高推荐性能, 但同时也存在信息单一的问题.为此, 文献[16]提出了一种基于用户图和项目图联合图传递的半监督多标签学习算法(Semi-supervised Multi-label Learning by Solving a Sylvester Equation, SMSE), 并应用于推荐系统中.该联合图传递模型为
式中:
进一步, 令
式中:
1.2.4 基于图约束的矩阵分解模型
不同于文献[13]提出的GNMF模型中的非负约束, 文献[15]提出了一种基于正交约束的图规范化因子分解模型(Orthogonal Graph-Regularized Matrix Factorization, OGRMF).采用正交约束的目的是消除低维隐性表征空间的信息冗余.OGRMF模型的具体形式为
式中:
前述介绍的基于图模型约束的推荐方法中, 引入用户图(项目图)约束的目的是保持原始的高维用户表征空间(高维项目表征空间)与低维的隐性用户表征空间(隐性项目表征空间)之间用户关系(项目关系)的一致性.为保持关系的一致性, 用户图或项目图约束均以与关系图邻接矩阵对应的Laplacian矩阵的二次型的形式予以体现.但利用Laplacian矩阵的二次型进行一致性约束的不足之处在于, 它只考虑了局部关系的一致性, 易于导致过拟合问题, 因而影响推荐性能.
不同于基于关系图Laplacian矩阵的一致性约束, 本文提出了一种基于关系图邻接矩阵逼近(Graph Adjacency Matrix Approximation, GAMA)的方法更好地保持高维显性空间与低维隐性空间的一致性关系, 同时在一定程度上可避免上述的局部过拟合.
图1所示为本文提出的基于关系图邻接矩阵逼近的推荐框架.其中,
本文提出的基于关系图邻接矩阵逼近的推荐模型可形成如下最小化问题
为在低维的隐性用户表征空间(隐性项目表征空间)构建用户关系图邻接矩阵
式(9)可转化为
其中,
对于由式(10)给出的针对
令
式中, γ 为表示学习率的常数.具体优化求解过程如表1所示.
3.1.1 数据集说明
本文采用两个公开的真实数据集来演示所述模型的推荐效果:MovieLens和EachMovie, 这也是研究协同过滤推荐算法常用的数据库.其中, MovieLens数据集收录了943个用户对1 682部电影的10万条评分信息, EachMovie数据集收录了74 424个用户对1 682部电影的260万条评分信息.为避免冷启动的影响, 两个数据集中均舍弃了被评分少于5次的电影, 特别地, 对于EachMovie数据集, 抽取了1 000个用户的评分数据进行实验.数据集的细节描述信息见表2.
实验中, 对数据集进行随机划分, 按照9∶ 1的比例把用户随机划分为训练集和测试集, 对于测试集中的每个用户, 将该用户已评分的记录划分为观测集和隐藏集, 观测集用来推荐隐藏集中的对象, 通过比较可以检验推荐效果.
3.1.2 评价标准及参数设置
为了评价各推荐模型的效果, 采用常用的F1评价指标
其中, R与P分别表示召回率与准确率.F1值综合反映了召回率与准确率评估指标.显然, F1值越大, 推荐效果越好.
实验中, 对于EachMovie与MovieLens数据集, 由式(13)和式(14)给出的学习率分别设置为
为验证本文算法性能, 实验中, 本文与其他一些相关的因子分解或引入关系图的推荐方法进行了性能比较, 这些方法包括:正规化矩阵分解RMF、非负矩阵分解NMF、基于图约束的非负矩阵分解GNMF、基于项目图的传递模型IG[14](Item Graph)、基于用户图传递模型UG[14](User Graph)、项目近邻法IN[14](Item Neighbor)、用户近邻法UN[14](User Neighbor)、基于用户-项目联合图的传递模型UIG[14](User-Item united Graph)、以及基于用户图-项目图交替传递模型UIIG[14](Interactive User-Item Graph)等, 每种方法的细节描述信息见表3.
表4列出了各方法在两个数据集上的F1性能比较.可以观察到, 利用用户信息的方法(如UN, UG)明显优于利用项目信息的方法(如IN, IG); 而综合利用两类信息的方法(如UIG, UIIG)又显著优于分别利用两类信息的方法; 此外, 利用了关系图辅助信息的方法表现更优.与此同时, 在EachMovie数据集上, 本文提出的GAMA方法比已有方法中最优的UIIG方法仍高出了1.52%; 而在MovieLens数据集上, 本文提出的方法相较于已有方法中最优的RMF方法也高出了0.31%.
本文提出的基于关系图邻接矩阵逼近的推荐模型中, 涉及的参数包括:低维隐性表征空间维度k, 量纲平衡系数β , 以及平衡因子α u和α v, 见式(10).为减少参数选择的复杂性, 在实验中, 本文设置α u = α v.
图2、图3分别是在MovieLens与EachMovie数据集上低维表征维度
对于平衡因子
此外, 对于量纲平衡系数
实验中采用MAE(Mean Absolute Error)值对算法的收敛性进行了分析.如图8所示, 对于EachMovie和MovieLens数据库, 算法在经过大约10次迭代后均达到收敛状态.这表明:由算法1给出的交替迭代求解能够保证算法的收敛.
1)为保持关系的一致性, 用户图或项目图约束均以与关系图邻接矩阵对应的Laplacian矩阵的二次型的形式予以体现.但利用Laplacian矩阵的二次型进行一致性约束的不足之处在于, 它只考虑了局部关系的一致性, 易于导致过拟合问题, 因而影响推荐性能.
2)不同于基于关系图Laplacian矩阵的一致性约束, 本文作者提出一种基于关系图邻接矩阵逼近的方法, 从相似性空间上更好地保持上述高维显性空间与低维隐性空间的一致性关系.同时, 在一定程度上可避免上述的局部过拟合问题.
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|