当前位置:首页 > 科技  > 软件

OpenTelemetry 实践指南:历史、架构与基本概念

来源: 责编: 时间:2024-05-21 09:06:36 234观看
导读历史发展早在 OpenTelemetry 诞生之前可观测性这个概念就一直存在了,我记得我最早接触到这个概念是在 16 年当时的公司所使用的一个产品:pinpoint现如今这个项目依然比较活跃。图片依然还记得当时通过它可以直接看到项

历史发展

早在 OpenTelemetry 诞生之前可观测性这个概念就一直存在了,我记得我最早接触到这个概念是在 16 年当时的公司所使用的一个产品:pinpointsZI28资讯网——每日最新资讯28at.com

现如今这个项目依然比较活跃。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

依然还记得当时通过它可以直接看到项目调用的拓扑图,在时间坐标上框出高延迟的点就能列出这些请求,同时还能查看此时的运行日志。sZI28资讯网——每日最新资讯28at.com

这样强大的功能对于一个刚工作一年的小白来说冲击力实属太大了一点。sZI28资讯网——每日最新资讯28at.com

后来才了解到 pinpoint 属于 APM 这类产品,类似的产品还有:sZI28资讯网——每日最新资讯28at.com

  • Apache SkyWalking
  • 美团的 CAT 等

他们都是可以用于性能分析和链路追踪的产品,到后来公司的运维层面也接入过 Zabbix、open-falcon 之类的产品:sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

17之后全面切换到 spring boot 时,也用过社区提供的 spring-boot-admin 项目:sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

这就是一个简单的可以监控 spring boot 应用的产品,用于展示 JVM 指标,或者自己也可以定义一些健康指标。sZI28资讯网——每日最新资讯28at.com

再之后进入云原生体系后可观测性的技术栈稍有变化。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

日志使用 Sidecar 代理的方式通过 Agent 将数据写入 ElasticSearch 中。 具体日志采集方式可以参考之前的文章:sZI28资讯网——每日最新资讯28at.com

  • 在 kubernetes 环境下如何采集日志

而链路追踪则是使用的 skywalking,在 trace 这个领域 skywalking 还是非常受大家喜爱的。sZI28资讯网——每日最新资讯28at.com

不过最近也从 skywalking 切换到了我们本文所讲到的 OpenTelemetry,具体可以看之前的文章:sZI28资讯网——每日最新资讯28at.com

  • 实战:如何优雅的从 Skywalking 切换到 OpenTelemetry

指标采集使用的是自然也是 Prometheus 的那一套技术栈,只是 Prometheus 换为了与它完全兼容的 VictoriaMetric 目前是为了更省资源。sZI28资讯网——每日最新资讯28at.com

客户端使用则是直接使用 Prometheus 的库进行指标暴露:sZI28资讯网——每日最新资讯28at.com

<dependency>    <groupId>io.prometheus</groupId>    <artifactId>prometheus-metrics-core</artifactId>    <version>1.0.0</version></dependency><dependency>    <groupId>io.prometheus</groupId>    <artifactId>prometheus-metrics-instrumentation-jvm</artifactId>    <version>1.0.0</version></dependency><dependency>    <groupId>io.prometheus</groupId>    <artifactId>prometheus-metrics-exporter-httpserver</artifactId>    <version>1.0.0</version></dependency>

最终通过配置抓取策略,由 VictoriaMetrics 的 scrape 程序来抓取指标最终写入到它自己的存储中:sZI28资讯网——每日最新资讯28at.com

apiVersion: operator.victoriametrics.com/v1beta1  kind: VMPodScrape  metadata:    name: kubernetes-pod-scrape    namespace: monitoring  spec:    podMetricsEndpoints:      - scheme: http        scrape_interval: "30s"        path: /metrics        relabelConfigs:          - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]            separator: ;            regex: "true"            replacement: $1            action: keep          # 端口相同          - action: keep_if_equal            source_labels: [ __meta_kubernetes_pod_annotation_prometheus_io_port, __meta_kubernetes_pod_container_port_number ]          # 过滤INIT容器          - action: drop            source_labels: [ __meta_kubernetes_pod_container_init ]            regex: "true"          - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]            separator: ;            regex: (.+)            target_label: __metrics_path__            replacement: $1            action: replace          - source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]            separator: ;            regex: ([^:]+)(?::/d+)?;(/d+)            target_label: __address__            replacement: $1:$2            action: replace          - separator: ;            regex: __meta_kubernetes_pod_label_(.+)            replacement: $1            action: labelmap          - source_labels: [__meta_kubernetes_namespace]            separator: ;            regex: (.*)            target_label: kubernetes_namespace            replacement: $1            action: replace          - source_labels: [__meta_kubernetes_pod_name]            separator: ;            regex: (.*)            target_label: kubernetes_pod_name            replacement: $1            action: replace        vm_scrape_params:          stream_parse: true    namespaceSelector:      any: true

以上是 VM 提供的 CRDsZI28资讯网——每日最新资讯28at.com

OpenTelemetry 诞生

到此铺垫完成,不知道有没有发现在可观测性中关键的三个部分:日志、指标、trace 都是使用不同的开源产品,从而会导致技术栈较多,维护起来自然也是比较麻烦的。sZI28资讯网——每日最新资讯28at.com

这么一个软件领域的核心能力自然需要提供一个完整方案的,将以上的不同技术栈都整合在一起,更加的方便开发者使用。sZI28资讯网——每日最新资讯28at.com

在这之前也有两个社区想要做类似的事情:sZI28资讯网——每日最新资讯28at.com

  • OpenTracing
  • OpenCensus

不过他们并没有统一整个可观测领域,直到 2019 年 CNCF 社区宣布成立 OpenTelemetry,并且将上述两个社区进行合并共同开发 OpenTelemetry。sZI28资讯网——每日最新资讯28at.com

背靠 CNCF 云原生社区加上许多知名厂商的支持(Google、Amazon、Redhat 等),现在已经正式成为 CNCF 的顶级项目了。sZI28资讯网——每日最新资讯28at.com

OpenTelemetry 架构介绍

图片图片sZI28资讯网——每日最新资讯28at.com

但我们打开 OpenTelemetry 社区的 GitHub 首页时,会看到有许多项目;第一反应应该是比较蒙的,下面我会着重介绍一些比较重要的项目。sZI28资讯网——每日最新资讯28at.com

在开始之前还是先简单介绍下 OpenTelemetry 的一些基础组件和概念:sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

整个 OpenTelemetry 系统其实可以简单分为三个部分:sZI28资讯网——每日最新资讯28at.com

  • 客户端
  • OTel collector
  • 数据存储

第一个客户端很好理解,也就是我们的业务应用;如果是 Java 应用只需要挂载一个 agent 就可以自动采集系统的指标、链路信息、日志等上传到 Collector 中。sZI28资讯网——每日最新资讯28at.com

也就是上图的左边部分。sZI28资讯网——每日最新资讯28at.com

之后就是非常关键的组件 collector,它可以通过 OTLP 协议接收刚才提到的客户端上传的数据,然后再内部进行处理,最终输出到后续的存储系统中。sZI28资讯网——每日最新资讯28at.com

Collector

 collector 的架构图 collector 的架构图sZI28资讯网——每日最新资讯28at.com

由于 OpenTelemetry 设计之初就是要做到厂商无关,所以它就得做出更高层级的设计。sZI28资讯网——每日最新资讯28at.com

关键点就是这里的 Receiver 和 Exporter 都是模块化的设计,第三方开发者可以基于它的标准开发不同组件从而兼容不同的产品。sZI28资讯网——每日最新资讯28at.com

Receiver:用于接收客户端上报的数据,不止是自己 agent 上报的数据,也可能会来自不同的厂商,比如 kubernetes、Kafka 等。sZI28资讯网——每日最新资讯28at.com

Exporter:同理,可以将 receiver 收到的数据进行处理之后输出到不同的组件中;比如 Kafka/Pulsar/Promethus/Jaeger 等。sZI28资讯网——每日最新资讯28at.com

比如我们可以使用 Nginx Receiver接收来着 Nginx 上报的数据。sZI28资讯网——每日最新资讯28at.com

使用 MySQL Receiver接收来自 MySQL 的数据。sZI28资讯网——每日最新资讯28at.com

当然通常我们使用最多的还是 OTLP Receiver,这是官方的 OTLP 协议的接收器,可以接受官方的一些指标,比如我们只使用了 Java Agent 进行数据上报时。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

https://github.com/open-telemetry/opentelemetry-collector-contrib/tree/main/receiversZI28资讯网——每日最新资讯28at.com

在这里是可以看到目前支持的所有第三方的 Receiver。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

OpenTelemetry 所支持的 Exporter 也很多,比如一些常见的存储:sZI28资讯网——每日最新资讯28at.com

  • clickhouse exporter
  • elasticsearch exporter
  • pulsar exporter
  • prometheus exporter
  • otlp http exporter

Exporter 的使用场景很多:如果是指标相关的数据可以直接写入 Prometheus,如果是日志数据也可以直接写入 ElasticSearch。sZI28资讯网——每日最新资讯28at.com

如果还有其他的特殊需求(删减属性等)则可以写入消息队列,自行处理完之后再发往 collector 进行后续的处理。sZI28资讯网——每日最新资讯28at.com

可能你已经发现了,由于 collector 非常的灵活,所以我们可以像搭积木一样组装我们的 receiver 和 exporter,它会以我们配置的流水线的方式进行调用,这样我们就可以实现任意可定制的处理逻辑。sZI28资讯网——每日最新资讯28at.com

而这些流水线的组装对于客户端来说都是透明的,也就是说 collector 的更改完全不会影响到业务;业务只需要按照 OTLP 的格式上报数据即可。sZI28资讯网——每日最新资讯28at.com

在之前的从 Skywalking 切换到 OpenTelemetry 的文章中有人问为什么要切换到 OpenTelemetry?sZI28资讯网——每日最新资讯28at.com

从这里也能看得出来,OpenTelemetry 的灵活度非常高,借助于 Exporter 可以任意的更换后端存储,或者增加/删减一些不需要的指标数据等。sZI28资讯网——每日最新资讯28at.com

当然我们也可以统一的在这里进行搜索,可以列出所有的第三方集成的组件: https://opentelemetry.io/ecosystem/registry/。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

OpenTelemetry 项目介绍

opentelemetry-java

介绍完基本的概念后,我们可以看看  OTel 社区的一些主要开源项目。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

这里我们还是以刚才的那个架构图从作往右讲起,也就是主要分为客户端和 collector 端。sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

目前官方支持的客户端语言已经非常齐全了,大部分的版本都已经是 Stable 稳定版,意味着可以进入生产环境。sZI28资讯网——每日最新资讯28at.com

这里我们以 Java 客户端为例:sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

其中我们重点关注下 opentelemetry-java 和 opentelemetry-java-instrumentation 这两个项目。sZI28资讯网——每日最新资讯28at.com

我们用的最多的会是 opentelemetry-java-instrumentation,它会给我们提供一个 java agent 的 JAR 包:sZI28资讯网——每日最新资讯28at.com

java -javaagent:path/to/opentelemetry-javaagent.jar /     -jar myapp.jar

我们只需要在 Java 应用中加上该  agent 就可以实现日志、指标、trace 的自动上报。sZI28资讯网——每日最新资讯28at.com

而且它还实现了不同框架、库的指标采集与 trace。sZI28资讯网——每日最新资讯28at.com

在这里可以查到支持的库与框架列表:sZI28资讯网——每日最新资讯28at.com

图片图片sZI28资讯网——每日最新资讯28at.com

https://github.com/open-telemetry/opentelemetry-java-instrumentation/blob/main/docs/supported-libraries.md#libraries--frameworkssZI28资讯网——每日最新资讯28at.com

总之几乎就是你能想到和不能想到的都支持了。sZI28资讯网——每日最新资讯28at.com

而 opentelemetry-java 我们直接使用的几率会小一些,opentelemetry-java-instrumentation 本身也是基于它创建的,可以理解为是 Java 版本的核心基础库,一些社区支持的组件就可以移动到 instrumentation 这个库中。sZI28资讯网——每日最新资讯28at.com

比如我在上篇文章:从一个 JDK21+OpenTelemetry 不兼容的问题讲起中涉及到的 HostResourceProvider 资源加载就是从 opentelemetry-java 中移动到了 opentelemetry-java-instrumentation。sZI28资讯网——每日最新资讯28at.com

具体可以参考:https://github.com/open-telemetry/opentelemetry-java/issues/4701sZI28资讯网——每日最新资讯28at.com

collector

之后就是 collector 的组件了,它同样的也有两个库:OpenTelemetry Collector 和 OpenTelemetry Collector ContribsZI28资讯网——每日最新资讯28at.com

其实通过他们的名字也可以看得出来,他们的作用与刚才的 Java 库类似:sZI28资讯网——每日最新资讯28at.com

  • opentelemetry-collector:由官方社区维护,提供了一些核心能力;比如只包含了最基本的 otlp 的 receiver 和 exporter。
  • opentelemetry-collector-contrib:包含了官方的 collector,同时更多的维护了社区提供的各种 receiver 和 exporter;就如上文提到的,一些社区组件(pulsar、MySQL、Kafka)等都维护在这个仓库。

而我们生产使用时通常也是直接使用 opentelemetry-collector-contrib,毕竟它所支持的社区组件更多。sZI28资讯网——每日最新资讯28at.com

总结

因为 OpenTelemetry 想要解决的是整个可观测领域的所有需求,所以仓库非常多,社区也很开放,感兴趣的朋友可以直接参与贡献,这么多 repo 总有一个适合你的。sZI28资讯网——每日最新资讯28at.com

后续会继续讲解如何安装以及配置我们的 OpenTelemetry。sZI28资讯网——每日最新资讯28at.com

参考链接:sZI28资讯网——每日最新资讯28at.com

  • https://github.com/pinpoint-apm/pinpoint
  • https://github.com/codecentric/spring-boot-admin
  • https://github.com/open-telemetry/opentelemetry-java
  • https://github.com/open-telemetry/opentelemetry-java-instrumentation
  • https://github.com/open-telemetry/opentelemetry-java/issues/4701

本文链接:http://www.28at.com/showinfo-26-89552-0.htmlOpenTelemetry 实践指南:历史、架构与基本概念

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 在 ASP.NET Core 中优雅地处理多接口实现

下一篇: 基于单元的架构综合指南

标签:
  • 热门焦点
  • 容量越大越不坏?24万块硬盘故障率报告公布 这些产品零故障

    8月5日消息,云存储服务商Backblaze发布了最新的硬盘故障率报告,年故障率有所上升。Backblaze发布的硬盘季度统计数据,其中包括故障率等重要方面。这些结
  • 如何正确使用:Has和:Nth-Last-Child

    我们可以用CSS检查,以了解一组元素的数量是否小于或等于一个数字。例如,一个拥有三个或更多子项的grid。你可能会想,为什么需要这样做呢?在某些情况下,一个组件或一个布局可能会
  • 十个简单但很有用的Python装饰器

    装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大&ldquo;烤&rdquo;之下的除了众生,还有各大企业发布的ESG报告。ESG是&ldquo;环境保
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 三星Galaxy Z Fold5官方渲染图曝光:13.4mm折叠厚度依旧感人

    据官方此前宣布,三星将于7月26日在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy Z Flip 5、
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top