大数据

fluentd收集日志文件

Fluentd是一个收集日志文件的开源软件,目前提供数百个插件可用于存储大数据用于日志搜索,数据分析和存储。 Fluentd适用于以下场景。 收集多台服务器的访问日志进行可视化...
阅读全文
大数据

fluentd 大数据采集平台

在大数据采集平台中,有这样一个特殊的平台,它的各部分均是可定制化的,你可以通过简单的配置,将日志收集到任何地方。这是一个目前非常火热的大数据采集平台,被众多企业所应用,所以本期就为大家介绍这个特殊的平...
阅读全文

FastDFS 部署(1)

FastDFS -- 开源的分布式文件系统 由阿里巴巴开发 工作原理 1. FastDFS服务端有2个角色 分别是tracker(跟踪器(或说是调度器会更合适)) 和 storage...
阅读全文
hbase

MySQL分区表和HBase永结连理

啰哩八嗦 时常都会有人问MySQL分区表要如何使用,MySQL分区表的和Oracle的差远了,该不该用MySQL分区表。其实该不该用,我也不能给予很好的建议。还是那句话,觉得适合自己才是最好的。觉得...
阅读全文
大数据

riak中的CAP理论

在 Riak 这样的分布式key-value数据库中,CAP理论是怎么起作用的。 Nodes/Writes/Reads 首先还是让我们来明确几个概念。 N odes 需要"最终"包含正...
阅读全文
大数据

hadoop家族介绍

Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据Google公司发表的Ma...
阅读全文
FastDFS

FastDFS 使用经验分享

经验一:FastDFS文件下载恢复原始文件名 应用背景 文件被上传到FastDFS后Storage服务端将返回的文件索引(FID),其中文件名是根据FastDFS自定义规则重新生成的,而不是原始文...
阅读全文