传统的single-target CDR只能提升一个域的推荐效果,用稠密的域去提升稀疏域的效果。dual-target则要同时提升两个域的推荐效果。并不是单纯的“Richer to Sparser” 或“Sparser to Richer”.
存在问题有:
- 如何利用丰富的数据生成更好的单域user和item表示
- 如何在两个域上都实现推荐效果的提升
方法:
- 提出Graphical and Attentional framework for Dual-Target Cross-Domain Recommendation, called GADTCDR
- 对于第一个问题,构建异构图,不仅考虑user-item关系还考虑item-item、user-user
- 对于第二个问题,采用element-wise attention mechanism,从两个域学习信息。
模型结构
- Input Layer:输入user-item共线矩阵,此外,还有content端包括一些item和user的属性
Graph Embedding Layer:构建异构图、Node2Vec得到embeddings。具体分为
- Document Embeddings:聚合user端的信息、聚合item端的信息 采用Doc2Vec生成document embedding
- Graph Construction:通过user和item之间的交互关系构建图,生成user-item边的概率为R/max(R),生成user-user或item-item边的概率为
$$ P(i,l)=\alpha\cdot sim(UC_i,UC_l) $$
alpha用于控制采样概率
- Output,生成user embedding矩阵 U和item embedding矩阵V
- Feature Combination Layer:结合两个域的embedding生成新的embedding,传统方法都是做两个域的embeddings做一些简单组合,如average-pooling, concat,该论文采用注意力机制,也就意味着稀疏度高的embedding贡献率可能较低,提取信息公式
$$ U_i^{\alpha} = W^{\alpha}\odot U_i^{\alpha}+(1-W^{\alpha}\odot U_i^b) $$
- Neural Network layers: MLP学习非线性关系
- Output Layer:输出归一化求点积