Volantis
文档
帮助
示例
社区
博客
源码
我们将运行1.13.0版本的Flink,其scala环境为2.12
1
git clone https://github.com/fightinggg/flink-src-study.git --recursive
在这个项目中,笔者把flink源码作为了一个git submodule放置于文件夹flink中,用来临时查看,当然我个人不建议看这些代码,因为这个文件夹太大了,IDE都不能很好的处理他。
然后就可以直接运行了
https://www.elastic.co/guide/en/elasticsearch/reference/current/elasticsearch-intro.html
impala提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点。
你为什么要使用集群? 如果一个问题可以在单机上解决,那就使用单机的方法,在使用分布式解决问题前,要充分尝试别的思路,因为分布式系统会让问题解决变得复杂
并行、容错、通信、安全/孤立
hadoop = common+hdfs+mapreduce+yarn
工具、rpc通信
分布式文件系统,一个文件分成多个128Mb的文件,存储在多个节点,为了保证分区容错性,存有备份,默认为3。主从架构。