首先需要注意的是,本文即将提到的 Druid,并非阿里巴巴的 Druid 数据库连接池,而是另一个大数据场景下的解决方案:Apache Druid。
Apache Druid 是一个用于大数据实时查询和分析的高容错、高性能开源分布式时序数据库系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid 仍能够保持 100% 正常运行。创建 Druid 的最初意图主要是为了解决查询延迟问题,当时试图使用 Hadoop 来实现交互式查询分析,但是很难满足实时分析的需要。而 Druid 提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性能而采取了特殊的存储格式。
目前 Druid 广泛应用在国内外各个公司,比如阿里,滴滴,知乎,360,eBay,Hulu 等。
本文 作者 Mohan Garadi 披露了 eBay 如何使用 Druid 进行监控的技术细节。
在 eBay 中,我们将监控技术栈从传统的本地架构转换为基于 Druid 的实时监控系统。在本文中,我们将讨论如何过渡到新技术栈,以及它为我们带来了什么好处。
eBay 每天要支撑数百万用户进行电子商务交易。随着支持不同产品的各种应用所产生的数据爆炸式增长,用户数量也在大幅增长。日志是应用程序的核心,用于决定应用程序执行哪些操作。随着应用程序大小的增长,日志变得很难进行可视化。我们还有一个集中式日志存储来处理所有日志,要直接从日志中获取有用的信息非常困难,而且从日志中实时获取有用信息的想法也不可行。在 eBay 中,监控团队以不同的方式对问题进行可视化。解决问题的更好 *** 是:从日志中提取有用事件并通过数据管理处理这些事件。
事件的数量直接与根据当前系统的流量生成的日志数量相关。一些应用程序可能会生成数百到数千个事件,而其他应用程序可能会生成数百万个事件。我们的兴趣是基于从日志中提取的事件来监控各个应用程序的执行情况,以及在系统中出现太多错误或异常行为时提醒用户的能力。
应用程序事件包括错误状态代码、url 事务、命令执行以及在不同主机上的应用程序项目的构建 ID 等。这些事件都有不同的目的。
应用程序开发人员和网站可靠性管理(Site reliability engineering,SRE)团队都会对这些事件感兴趣,因为他们可以实时监控应用程序的性能。它们能够将系统中发生的错误数量以可视化的形式呈现,通过命令执行对这些错误进行切片和切块,并构建导致这些错误的程序,然后根据可能影响应用程序性能的错误阈值设置警报。
当应用程序开发团队必须在生产中部署应用程序的新项目时,这些信息提供了关键的洞见。他们将能够在一小部分主机上进行代码的抽样部署(sampled rollout),并可视化实时仪表盘,以确定新代码在生成错误方面的行为,然后将实时数据与历史数据进行比较,从而提供一定程度的可信度。
作为DEF CON CHINA 1.0的重头戏之一,BCTF百度网络安全技术对抗赛在今年将迎来升级。 百度安全事业部总经理马杰透露,2019年DEF CON CTF官方组织者Overfl...
作为老牌的线上教育机构,沪江网校的各类外语课程一直是被我们熟知的。 除了各种外语的课程,其实沪江网校也推出了针对于中小学教育的各类课程。最近,有家长也和我提到它的大语文课程。 新麦大语文是...
能找黑客帮忙盗个QQ号相关问题 网上有黑客说追款的可靠吗相关问题 唐人街探案2女黑客最后一句话什么意思 黑客破解外汇平台是真的吗(黑客接...
蜂蜜是大自然的营养品,不仅是良药还是上等的饮料,在古希腊时代古希腊人将其看做是“天赐的礼物”。蜂蜜富含多种维生素以及微量元素,如今已经成为了健康的食品之一,更是夏季最佳饮料。然而在蜂蜜品牌市场上有着许...
在你手机上里的总流量便是你的,在我手机里的总流量是我的,在他人服务平台上的总流量便是他人的,实际上一个人会另外变成好多个几十个甚至几十个人眼里的总流量。总流量的实情,既就是我的,也就是你的,但说到...
哎,这个问题问的很不专业,但是我来专业的回答你你的问题是”10kv高压柜的上pt,有两个绕组,一个100v,一个220v,外接。 可以呀,摄像头电源一般为12Ⅴ,所以配一组电池,或蓄电池,12V电压。...