表示样本预测值与真实值偏差大小的函数。
神经网络的求解过程,即将损失函数最小化的过程。
总损失函数由两个损失函数以按一定比例\alpha相加得到:
其中:
Lnet为属性网络利用深度转码器
转码为嵌入矩阵时的损失函数。
式中的X^i为第i商品的
属性网络
转码重构后的矩阵。首先利用转码后的嵌入矩阵X^i和实际Xi相减,表示转码后与实际数值间的差距。bi为一个很大的系数,以放大转码后的预测与实际值偏差的程度(对错误值进行惩罚)。取模,对所有商品求和后,即得到数值形式的损失函数Lnet。优化取其最小值,即得到与实际最为接近的深度转码后商品的嵌入矩阵。
Lrank为用户预测部分的损失函数。
其中,(如前文所述),h_u,i为第u个用户对第i个物品的用户物品评分。首先,利用同一个用户对两个不同商品的评分,采用减法、取模,计算得到两个物品间的相似程度。
负采样:在计算Lrank采用了负采样的方法,即选择一个商品作为负采样样本,在初始化时就避免其进入属性网络。于是,一个用户任意两商品间的相似程度必大于与负采样样本间的相似程度。在计算某商品与另一商品间的相似程度后,减去该商品与负采样样本的相似程度;这样可以避免运算时神经网络陷入局部最优,得到更优秀的损失函数形式。
依次对每个用户的每件商品负采样优化后的相似程度进行加和,即得到用户预测部分的损失函数Lrank。