物品推荐-Pandas-Python数据分析(22)

数据

具体数据和代码在网盘:链接:  https://pan.baidu.com/s/1qYyAyvi密码: rnbj

相关文件: 01_user_goods_score.data。

数据中有3个字段分别使用逗号(,)隔开,如下:

获得有多少个唯一的商品

使用源数据(01_user_goods_score.data), 通过MRJob计算出唯一的商品。

MRJob代码(pandas_01_goods.py)

执行

注意: 上面输出的结果其中后面的 1 是没有用的

获得有多少个唯一的用户

方法和计算出唯一的商品是类似的, 同样也是使用(01_user_goods_score.data)中的数据通过MRJob分析得出

MRJob代码(pandas_01_user.py)

执行

计算用户推荐商品

思路:

  1. 将商品(pandas_01_goods.data)转化成 key value 对(其中value是矩阵的下角标),如下:

  1. 将用户(pandas_01_user.data)转化成 key value 对(其中value是矩阵的下角标),如下:

  1. 这边通过读取(02_user_goods_score_record.data)中的数据, 并且计算出商品的购买矩阵。

这边使用了 Python 的数据分析框架 scipy

在生成矩阵的时候使用的是 goods_dict 中的值来代替的, 到了最后在替换回来

  1. 通过读取(01_user_goods_score.data)中的数据, 并且计算出用户商品评分矩阵(用户只购买评分过的商品)。

在生成矩阵的时候使用的是 user_dict 中的值来代替的, 到了最后在替换回来

  1. <商品购买矩阵> X <用户商品评分矩阵> = <每个用户每个商品评分矩阵>
  2. 将 <每个用户每个商品评分矩阵> 结合 Pandas、goods_dict、user_dict 得出最终结果

计算物品推荐代码(pandas_02_final.py)

执行与结果

从最后的结果可以很容易的看出用户相关商品的得分是多少, 从而可以得到需要推荐的商品(剔除用户购买评分过的商品)。

 

昵称: HH
QQ: 275258836
ttlsa群交流沟通(QQ群②: 6690706 QQ群③: 168085569 QQ群④: 415230207(新) 微信公众号: ttlsacom)
感觉本文内容不错,读后有收获?
逛逛衣服店,鼓励作者写出更好文章。

HH
teakki

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: