1.1. Pandas分析步骤
载入数据
将 CDN_IP请求数 进行 COUNT。类似如下SQL:
SELECT cdn_ip,
count(*)
FROM log...
排序
日期
更新
热评
热门
点赞
随机
CDN_IP请求数-MRJob-Python数据分析(12)
1.1. 前言
我们计算CDN IP请求数经过这四个步骤:
Mapper: 将以行数据解析成 key=cdn_ip value=1的形式
Shuffle: 通过Shuffle后的结果会生...
浏览工具排名-Pandas-Python数据分析(11)
1.1. Pandas分析步骤
载入数据
将 浏览工具排名 进行 COUNT。类似如下SQL:
SELECT browser,
count(*)
FROM log
...
浏览工具排名-MRJob-Python数据分析(10)
1.1. 前言
我们计算浏览工具排名经过这四个步骤:
Mapper: 将以行数据解析成 key=浏览工具 value=1的形式
Shuffle: 通过Shuffle后的结果会生成以 ke...
外链点击数-Pandas-Python数据分析(9)
1.1. Pandas分析步骤
载入数据
将 外链点击数 进行 COUNT。类似如下SQL:
SELECT reference_url,
count(*)
FROM ...
外链点击数-MRJob-Python数据分析(8)
1.1. 前言
我们计算外链点击数经过这四个步骤:
Mapper: 将以行数据解析成 key=外链点击数 value=1的形式
Shuffle: 通过Shuffle后的结果会生成以 ke...
URL请求数-Pandas-Python数据分析(7)
1.1. Pandas分析步骤
载入数据
将 请求的URL 进行 COUNT。类似如下SQL:
SELECT request_url,
count(*)
FROM l...
URL请求数-MRJob-Python数据分析(6)
1.1. 前言
我们计算URL请求数经过这四个步骤:
Mapper: 将以行数据解析成 key=请求的URL数 value=1的形式
Shuffle: 通过Shuffle后的结果会生成以...
时刻PV-Pandas-Python数据分析(5)
1.1. Pandas分析步骤
载入数据
将 access_time 的日期进行 COUNT。类似如下SQL:
SELECT DATE_FORMAT(access_time, '...
时刻PV-MRJob-Python数据分析(4)
1.1. 前言
这边我们使用Python的M/R框架MRJob来分析.
1.2. M/R步骤
Mapper: 将以行数据解析成 key=hh value=1的形式
Shuffle: 通过S...
每日PV-Pandas-Python数据分析(3)
1.1. 前言
这边我们使用内存分析框架Pandas来分析每日PV。
1.2. 对Pandas的好评
其实个人对Pandas这个模块是颇有好感。本人用Pandas完成可许多的日常实用的小工具,如...
每日PV-MRJob-Python数据分析(2)
1.1. 前言
这边我们使用Python的M/R框架MRJob来分析
1.2. M/R步骤
M/R分析数据步骤一般有 3 步:
Mapper => Shuffle => Red...
Init – Python数据分析(1)
1.1. 前言
由于公司业务的发展,在一些产品的功能上面不再满足于哪些简简单单的功能性的主要功能了。也开始考虑一些为产品增添色彩的功能(数据统计)。
当然,产品中的一些基本的统计功能,使用关系...
MySQL开启命令自动补全功能(auto-rehash)
mysql命令行工具自带这个功能,但是默认是禁用的。想启用其实很简单,打开配置文件找到no-auto-rehash,用符号 # 将其注释,另外增加auto-rehash即可。
[mysql]
#n...
git 命令自动补全的方法
只需要完成下面两部,就可以实现在mac osx 下git 命令自动补齐,自动补全之后可以不用记住那么多命令了。
首先下载自动补齐脚本,使用curl命令如下:
curl https://raw....
113