原创教程 Pandas、MRJob实战Python数据分析(汇总) 本系列文章由TTLSA兄弟HH精心打造 选择Init – Python数据分析(1) 选择每日PV-MRJob-Python数据分析(2) 选择每日PV-Pandas-Python数据分析(3) 选择... 11月30日Pandas、MRJob实战Python数据分析(汇总)已关闭评论 收藏 阅读全文
HDFS 物品推荐-Pandas-Python数据分析(22) 数据 具体数据和代码在网盘:链接: https://pan.baidu.com/s/1qYyAyvi密码: rnbj 相关文件: 01_user_goods_score.data。 数据中有3个字段... 11月29日物品推荐-Pandas-Python数据分析(22)已关闭评论 收藏 阅读全文
python 真实IP对应区域-Pandas-Python数据分析(20) 1.1. Pandas分析步骤 载入日志数据 载入area_ip数据 将 real_ip 请求数 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 2752... 11月14日真实IP对应区域-Pandas-Python数据分析(20)已关闭评论 收藏 阅读全文
python 真实IP对应区域-MRJob-Python数据分析(19) 1.1. 前言 由于我们这边没有使用 M/R join的方法来实现 IP对应的区域,我们是使用M/R结合Pandas来实现。 我们计算每日PV经过这四个步骤: Mapper: 将以行数据解析成 key... 11月13日真实IP对应区域-MRJob-Python数据分析(19)已关闭评论 收藏 阅读全文
python CDN_IP对应地址-Pandas-Python数据分析(18) 1.1. Pandas分析步骤 载入日志数据 载入area_ip数据 将 CDN_IP请求数 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 275258... 11月12日 3 收藏 阅读全文
python CDN_IP对应地区-MRJob-Python数据分析(17) 1.1. 前言 由于我们这边没有使用 M/R join的方法来实现 IP对应的区域,我们是使用M/R结合Pandas来实现。 我们计算CDN IP对应地区经过这四个步骤: Mapper: 将以行数据解... 11月11日CDN_IP对应地区-MRJob-Python数据分析(17)已关闭评论 收藏 阅读全文
python Join实现-MRJob-Python数据分析(16) 1.1. 前言 前面我们解析出了CDN IP 和 用户真实IP 的访问次数,但是我们要如何知道该IP是来自哪个地区呢?这时候我们就需要用到在area_ip.csv 中的数据了。 这时候就需要使用 M/... 11月10日Join实现-MRJob-Python数据分析(16)已关闭评论 收藏 阅读全文
python 真实IP请求-Pandas-Python数据分析(15) 1.1. Pandas分析步骤 载入数据 将 真实IP请求 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 275258836 ttlsa群交流沟通(QQ... 11月09日真实IP请求-Pandas-Python数据分析(15)已关闭评论 收藏 阅读全文
python 真实IP请求数-MRJob-Python数据分析(14) 1.1. 前言 我们计算真实IP经过这四个步骤: Mapper: 将以行数据解析成 key=real_ip value=1的形式 Shuffle: 通过Shuffle后的结果会生成以 key 的值排序... 11月08日真实IP请求数-MRJob-Python数据分析(14)已关闭评论 收藏 阅读全文
python CDN_IP请求数-Pandas-Python数据分析(13) 1.1. Pandas分析步骤 载入数据 将 CDN_IP请求数 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 275258836 ttlsa群交流沟通... 11月07日CDN_IP请求数-Pandas-Python数据分析(13)已关闭评论 收藏 阅读全文
python CDN_IP请求数-MRJob-Python数据分析(12) 1.1. 前言 我们计算CDN IP请求数经过这四个步骤: Mapper: 将以行数据解析成 key=cdn_ip value=1的形式 Shuffle: 通过Shuffle后的结果会生成以 key ... 11月06日CDN_IP请求数-MRJob-Python数据分析(12)已关闭评论 收藏 阅读全文
python 浏览工具排名-Pandas-Python数据分析(11) 1.1. Pandas分析步骤 载入数据 将 浏览工具排名 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 275258836 ttlsa群交流沟通(QQ... 11月05日 1 收藏 阅读全文
python 浏览工具排名-MRJob-Python数据分析(10) 1.1. 前言 我们计算浏览工具排名经过这四个步骤: Mapper: 将以行数据解析成 key=浏览工具 value=1的形式 Shuffle: 通过Shuffle后的结果会生成以 key 的值排序的... 11月04日 3 收藏 阅读全文
python 外链点击数-Pandas-Python数据分析(9) 1.1. Pandas分析步骤 载入数据 将 外链点击数 进行 COUNT。类似如下SQL: 1.2. 代码 运行统计和输出结果 昵称: HH QQ: 275258836 ttlsa群交流沟通(QQ群... 11月03日外链点击数-Pandas-Python数据分析(9)已关闭评论 收藏 阅读全文
python 外链点击数-MRJob-Python数据分析(8) 1.1. 前言 我们计算外链点击数经过这四个步骤: Mapper: 将以行数据解析成 key=外链点击数 value=1的形式 Shuffle: 通过Shuffle后的结果会生成以 key 的值排序的... 11月02日外链点击数-MRJob-Python数据分析(8)已关闭评论 收藏 阅读全文