在EC2上部署Apache Druid的一种简单方法,以便从任何来源加载数据。
介绍
目前,实时分析起着很大的作用,并且是技术领域竞争力的象征,因为数据量呈指数增长,而各种各样的工具则相同,因此,我想向您展示我们如何使用其中一个调用Apache Druid以及如何在EC2实例上进行部署,例如快速的方式。
Apache Druid
DRUID是一个高性能的实时分析数据库。德鲁伊的主要价值添加是减少洞察力和行动的时间。
druid专为工作流程而设计,在这些工作流程中,快速查询和摄入确实很重要。 Druid擅长为UIS供电,运行(临时)查询或处理高并发性。将Druid视为各种用例的数据仓库的开源替代品。 design documentation解释了关键概念。
逐步部署:
- 转到AWS EC2控制台
- 创建一个新的EC2实例
- 安装apache druid
- 在您的浏览器上运行并打开Druid
开始了!
在启动EC2实例之前,您要牢记这个Quickstart documentation,因此我们必须考虑使用16 GIB RAM的虚拟服务器,因此我们将选择A t2.xlarge 使用 4 vcpus &16 ram(gib)。
创建一个新的EC2实例
我们准备创建一个EC2实例,如下:
- sosðubuntu22.04 li>
- 实例类型ðt2.xlarge
- 创建一个使用图像中指示的入站规则的安全组
- 启动实例
安装Apache Druid
现在,我们将连接到最近从ssh创建的实例,并使用此小逐步配置:
1) sudo apt update -y
2) sudo apt install openjdk-8-jdk -y
3) wget https://dlcdn.apache.org/druid/24.0.0/apache-druid-24.0.0-bin.tar.gz (Last updated version)
4) tar -xzf apache-druid-24.0.0-bin.tar.gz
5) cd apache-druid-24.0.0
6) export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
7) export DRUID_HOME=/home/ubuntu/apache-druid-24.0.0
8) PATH=$JAVA_HOME/bin:$DRUID_HOME/bin:$PATH
运行Apache Druid
最后,我们可以使用命令
从EC2实例运行Apache Druid./bin/start-micro-quickstart
Apache Druid在行动ð
现在,您可以打开浏览器,以便在URLð AWS公共IPv4地址中查看Web控制台:8888
概括
您可以看到,在EC2实例上部署Apache Druid是如此容易,另一方面,是通过免费应用简单的SQL查询来实时从KAFKA主题实时分析数据的最佳方法之一,因为是开源的。 。
感谢您阅读本文。如果您觉得这篇文章有用,则喜欢并分享本文。有人也可以发现它有用,为什么不邀请我喝咖啡。