以下文章来源于浙大KG ,作者叶橄强
介绍浙江大学知识图谱相关方向的最新学术成果、开放资源及创新应用实践
为了使会话推荐系统预测模型能够感知用户的当前状态以及对话和项目之间的关系,引入了基于预训练会话知识图谱的用户状态和对话交互表示,并提出了K-DCN模型。在K-DCN模型中,通过深度交叉网络融合用户状态表示、对话交互表示和其他常规特征表示,从而给出候选项的推荐等级。
接收会议:
ICDE2021 (International Conference on Data Engineering)
论文链接:
https://arxiv.org/abs/2104.14899
传统的点击率预测模型通常用于对候选项进行排序,但大多数会话推荐系统仍然需要解决样本较少和数据稀疏的问题。这篇文章提出了知识增强的深度交叉网络(Knowledge-enhanced Deep Cross Network, K-DCN),能够通过预训练和微调两个步骤,构建会话推荐系统预测模型并推荐合适的商品。该模型引入了基于预训练会话知识图谱的用户状态和对话交互表示,使会话推荐系统预测模型能够感知用户的当前状态以及对话和项目之间的关系,并通过深度交叉网络融合多种信息提供推荐商品。该模型在阿里巴巴真实业务场景中得到了验证。
本文首先从用户、项目和会话的信息中构造出一个十亿规模的会话知识图谱(Conversation Knowledge Graph, CKG),然后引入知识图谱嵌入方法和图卷积网络对会话知识图谱进行预训练,分别对语义信息和结构信息进行编码。为了使会话推荐系统预测模型能够感知用户的当前状态以及对话和项目之间的关系,引入了基于预训练会话知识图谱的用户状态和对话交互表示,并提出了K-DCN模型。在K-DCN模型中,通过深度交叉网络融合用户状态表示、对话交互表示和其他常规特征表示,从而给出候选项的推荐等级。
传统的会话推荐系统(Conversational Recommender Systems, CRSs)主要关注于点击率(Click-Through Rate,CTR),多个相关模型都进行了实验验证并取得了良好的效果。但是这些模型主要依赖于用户对商品的丰富行为记录,而在电商平台真实场景,用户与只能聊天机器人的交互有限,导致这类数据往往非常稀少,最终导致模型产生过拟合问题。
因此本文提出的K-DCN模型主要解决样本较少和数据稀疏的问题,模型将用户、商品和会话信息考虑在内,因为用户的会话中可能会表达用户本人对某种商品的某种偏好。
这篇文章提出的方法包括两部分:第一,会话知识图谱的构建和预训练,对结构和语义信息进行编码;第二,基于常规特征和预训练好的知识图谱表示特征对知识增强的深交叉网络K-DCN模型进行微调,其中包括用户状态表示和对话交互表示。
1. 会话知识图谱构造
这篇论文中,将知识图谱作为一种编码与会话推荐系统相关的各种信息的方法,并从用户与聊天机器人会话的真实场景中构造会话知识图谱。
会话知识图谱中包含一下三种信息:
(1)关于用户的信息:每个用户都有一个标签列表,例如性别、购物历史等,这有助于抓住用户的兴趣。基于这些数据,以(user, has, user_tag)这样的三元组形式对会话知识图谱中的标签信息进行编码。
(2)商品信息:平台包含丰富的商品信息,如商品的类别和卖家,以及商品的属性如颜色、品牌等。对于类别和卖家信息,分别以(item, belong_to, category)和(seller, has, item)的形式构建了三元组;而对于属性和值,构建了两种类型的三元组(item,has,value)和(property,has,value)。这些信息可以极大地帮助映射和挖掘用户的兴趣。
(3)会话信息:在聊天机器人中,用户与机器人聊天时会创建许多会话,会话中的意图和关键字有助于更准确地理解用户的意图。因此可以根据会话历史构建四种类型的三元组:(user,created,session),(session,relate to,seller),(session,has,intention)和(intention,has,keywords)。
K-DCN模型是在本文作者构建的私有数据集上从头开始进行预训练和微调的。这些数据集来自阿里电商客服机器人的对话,包含了从十个类别中取样了九十万条记录数据,如表1所示。而预训练会话知识图谱模型是基于十亿规模的知识图谱进行训练的,其中包含五亿个实体和六十亿个三元组。
本文中将K-DCN模型与5个基线模型进行了比较,包括深度交叉网络(Deep & Cross Network,DCN)、广度深度网络(Wide & Deep Network,WDN)、深度神经网络(Deep Neural Network,DNN)、梯度增强决策树(Gradient Boosted Decision Trees,GBDT)和逻辑回归(Logistic Regression,LR),结果如表2所示。从表格数据中可以看出,本文中提出的K-DCN模型在所有的数据集中都优于所有的基线模型。
怀念不如相见!🙋
10.16晚18:00
将门-TechBeat将在上海与大家一起围炉夜话
ICCV线上线下嘉宾连线交流
分享AI道路上的故事集、经验贴
还不知道本次活动详情?
请点击本链接或“阅读原文”查看更多活动信息😏
扫码观看!
本周上新!
关于我“门”
▼