Apache Hadoop是一款支持数据密集型分布式应用并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。Hadoop是根据Google公司发表的Ma...
LinkedIn数据架构剖析
LinkedIn是当今最流行的专业社交网站之一,本文描述了LinkedIn是如何管理数据的。如你对文中的观点有异议亦或文中有遗漏的部分请随时告诉我。
LinkedIn.com数据用例
下面...
别老扯Hadoop蛋了,你的数据根本不够大
本文原名“Don't use Hadoop when your data isn't that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过...
Zookeeper分布式集群部署
部 署完成Hadoop/Hbase集群之后,开始测试Sleuthkit,结果发现tpkickoff.sh运行时不断提醒zookeeper的连接错 误:Session 0x0 for server。网上...
关于Flume-ng那些事(四)
最后一章了,flume-ng的手册总是慢半拍,一些实例可以参考下手册总的图,会很有收获。http://flume.apache.org/FlumeUserGuide.html 还是1.4版本,有些参...
关于Flume-ng那些事(一)
前言
落群好久,一直潜水,实在抹不开了,为ttlsa做点贡献。这个群是我见到所有技术群里扯淡最少的群。支持下,谢谢群主默北和管理员白开水为我们开辟一块学习的净土。希望ttlsa走的更远,各位同学...
关于Flume-ng那些事(二)
继续我们的测试。
编辑flume.conf配置文件
# Define a memory channel called ch1 on agent1
agent1.channels.ch1.ty...
关于Flume-ng那些事(三)
agentA (10.1.124.197)agentB(10.1.124.196)agent(10.1.124.198)
测试一
agentA = > agentB 从客户端推送数据到 ...