数据
具体数据和代码在网盘:链接: https://pan.baidu.com/s/1qYyAyvi密码: rnbj
相关文件: 01_user_goods_score.data。
数...
真实IP对应区域-Pandas-Python数据分析(20)
1.1. Pandas分析步骤
载入日志数据
载入area_ip数据
将 real_ip 请求数 进行 COUNT。类似如下SQL:
SELECT inet_aton(l....
真实IP请求数-MRJob-Python数据分析(14)
1.1. 前言
我们计算真实IP经过这四个步骤:
Mapper: 将以行数据解析成 key=real_ip value=1的形式
Shuffle: 通过Shuffle后的结果会生成以 k...
CDN_IP请求数-Pandas-Python数据分析(13)
1.1. Pandas分析步骤
载入数据
将 CDN_IP请求数 进行 COUNT。类似如下SQL:
SELECT cdn_ip,
count(*)
FROM log...
CDN_IP请求数-MRJob-Python数据分析(12)
1.1. 前言
我们计算CDN IP请求数经过这四个步骤:
Mapper: 将以行数据解析成 key=cdn_ip value=1的形式
Shuffle: 通过Shuffle后的结果会生...
浏览工具排名-Pandas-Python数据分析(11)
1.1. Pandas分析步骤
载入数据
将 浏览工具排名 进行 COUNT。类似如下SQL:
SELECT browser,
count(*)
FROM log
...
浏览工具排名-MRJob-Python数据分析(10)
1.1. 前言
我们计算浏览工具排名经过这四个步骤:
Mapper: 将以行数据解析成 key=浏览工具 value=1的形式
Shuffle: 通过Shuffle后的结果会生成以 ke...
外链点击数-Pandas-Python数据分析(9)
1.1. Pandas分析步骤
载入数据
将 外链点击数 进行 COUNT。类似如下SQL:
SELECT reference_url,
count(*)
FROM ...
外链点击数-MRJob-Python数据分析(8)
1.1. 前言
我们计算外链点击数经过这四个步骤:
Mapper: 将以行数据解析成 key=外链点击数 value=1的形式
Shuffle: 通过Shuffle后的结果会生成以 ke...
URL请求数-Pandas-Python数据分析(7)
1.1. Pandas分析步骤
载入数据
将 请求的URL 进行 COUNT。类似如下SQL:
SELECT request_url,
count(*)
FROM l...
时刻PV-Pandas-Python数据分析(5)
1.1. Pandas分析步骤
载入数据
将 access_time 的日期进行 COUNT。类似如下SQL:
SELECT DATE_FORMAT(access_time, '...
时刻PV-MRJob-Python数据分析(4)
1.1. 前言
这边我们使用Python的M/R框架MRJob来分析.
1.2. M/R步骤
Mapper: 将以行数据解析成 key=hh value=1的形式
Shuffle: 通过S...