用于处理高速、大型数据流的分布式实时计算系统。为Hadoop添加了可靠的实时数据处理功能。
Home link: http://storm.apache.org/
Download link: http://storm.apache.org/downloads.html
Setup
- Java
CentOS 自带 JDK 1.7,此处可以忽略该步骤。
- Zookeeper
Home link: http://zookeeper.apache.org/releases.html
-
下载安装包并上传解压
http://mirror.bit.edu.cn/apache/zookeeper/stable/
1tar -xf zookeeper-3.4.6.tar.gz -
配置Zookeeper
1 2 3 4 5 6 7 8tickTime=2000 dataDir=/var/zookeeper/ clientPort=2181 initLimit=5 syncLimit=2 server.1=zookeeper1:2888:3888 server.2=zookeeper2:2888:3888 server.3=zookeeper3:2888:3888 -
启动Zookeeper
1bin/zkServer.sh start -
测试
1bin/zkCli.sh -server 127.0.0.1:2181 -
依赖库安装
-
Java
自带。
-
Python
自带。
-
Storm
-
下载安装包,上传并解压
解压命令:
1tar -xf apache-storm-0.9.5.tar.gz -
配置Zookeeper地址,在
storm.yaml中配置该目录1 2storm.zookeeper.servers: - "127.0.0.1"创建并配置workdir
1storm.local.dir: "/home/admin/storm/workdir"备注:
storm.local.dir是Nimbus和Supervisor进程用于存储少量状态(如jars、confs等)的本地磁盘目录,需要提前创建该目录并给予足够的访问权限。1nimbus.host: "127.0.0.1"1 2 3 4 5supervisor.slots.ports: - 6700 - 6701 - 6702 - 6703 -
启动Storm的所有服务
Nimbus
1bin/storm nimbus >/dev/null 2>&1 &Supervisor
1bin/storm supervisor >/dev/null 2>&1 &UI
1bin/storm ui >/dev/null 2>&1 &Logview
1bin/storm logviewer > /dev/null 2>&1
访问Storm UI
