这个是对连续特征比较好用哈
问题是我的数据包含很多离散特征,所以首先用了onehot,但是维数比较高需要用embedding降维,之后再做类似这种cos的距离计算。我现在卡在降维这里了……
【 在 hgoldfish 的大作中提到: 】
: from sklearn.metrics.pairwise import cosine_similarity
: import pandas as pd
: import numpy as np
: ...................
--
FROM 117.136.0.*