实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

文库吧

文库吧用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

文库吧 > IT > 软件开发 > 后端开发 > Java

分布式链路追踪- SkyWalking使用手册

Java 更新时间：2024-05-10 10:20:25 发布时间：638天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

1. 模块介绍

仪表盘：监控全局、服务、实例、endpoint几个维度的运行状态。
拓扑图：以拓扑图的方式展现服务直接的关系，并以此为入口查看告警、调用链、服务状态等信息
追踪：以接口列表的方式展现，追踪接口内部调用过程，可以通过traceid查询，进行分布式集群的日志查看及问题排查。
性能剖析：单独端点进行采样分析，并可查看堆栈信息。
日志：包括了browser与service日志集合。
告警：触发告警的告警列表，包括实例，请求超时等。

2. 仪表盘

第一栏：监控、数据库、容器、vm
第二栏：可以选择某个维度展示不同服务/实例/端点的数据
第三栏：展示的不同维度，全局、服务、实例、端点的面板。

2.1 APM

2.1.1 Global

**Services load(CPM-callsperminute)**：服务平均每分钟请求数。
**Slow Services(ms)**：慢响应服务，单位ms。
**Un-Health services(Apdex)**：Apdex性能指标，1为满分。
**Slow Endpoints(ms)**：全局维度的慢响应端点(API)。例如一个接口，是全局TopN的数据，通过这个可以观测平台性能情况。
**Global Response Latency(percentileinms)**：全局响应延迟百分位数统计，单位ms。

表示采集样本中某些值的占比，Skywalking有**P50、P75、P90、P95、P99**一些列值。
图中的**P99:950**表示**99%**请求的响应时间在**950ms****以内。**而99%一般用于抛掉一些极端值，表示绝大多数请求。

**GlobalHeatmap**：服务响应时间热力分布图，根据时间段内不同响应时间的数量显示颜色深度

可译为热力图、热度图都可以，图中颜色越深，表示请求数越多，这和GitHubContributions很像，commit越多，颜色越深。横坐标是响应时间，鼠标放上去，可以看到具体的数量。通过热力图，一方面可以直观感受平台的整体流量，另一方面也可以感受整体性能。

2.1.2 Service

**Service Apdex****(数字)：**当前服务的评分
**Service Apdex****(折线图)：**一段时间内Apdex评分
**Service Avg Response Times(ms)**：平均响应延时，单位ms
**Service Response Time Percentile**：百分比响应延时，参考GlobalResponseLatency(percentileinms)
**Successful Rate****(数字)：**请求成功率
**Successful Rate****(折线图)：**一段时间的请求成功率
**Servce Load(CPM/PPM)****(数字)：**每分钟请求数，
**Servce Load(CPM/PPM)****(折线图)：**不同时间的每分钟请求数
**Service Throughput(Bytes)****：**该指标只适用于TCP服务。当前服务的吞吐量。
**Servce Instances Load(CPM/PPM)****：**每个服务实例的每分钟请求数
**Show Service Instance****：**每个服务实例的最大延时
**Service Instance Successful Rate****：**每个服务实例的请求成功率

2.1.3 Instance

**Service Instance Load(CPM/PPM)****：**当前实例的每分钟请求数
**Service Instance Throughput(Bytes)****：**该指标只适用于TCP服务。当前服务实例的吞吐量。
**Service Instance Successful Rate(%)****：**当前实例的请求成功率
**Service Instance Latency(ms)****：**当前实例的响应延时
**JVM CPU(Java Service)**：jvm占用CPU的百分比
**JVM Memory(Java Service)**：JVM内存占用大小，单位m，包括堆内存，与堆外内存(直接内存)
**JVM GC Time(ms)**：JVM垃圾回收时间，包含YGC和OGC
**JVM GC Count**：JVM垃圾回收次数，包含YGC``和``OGC
**JVM Thread Count**：JavaService
其他参数为.net的东西

2.1.4 Endpoint

**Endpoint Load in Current Service(CPM/PPM)**：每个端点(API)每分钟请求数
**Slow Endpoints in Current Service(ms)**：每个端点(API)的最慢响应请求时间，单位ms
**Successful Rate in Current Service(%)**：每个端点(API)的请求成功率

某个端点：

**Endpoint Load**：当前端点每个时间段的请求数据
**Endpoint Avg Response Time**：当前端点每个时间段的请求行响应时间
**Endpoint Response Time Percentile(ms)**：当前端点每个时间段的响应时间占比
**Endpoint Successful Rate(%)**：当前端点每个时间段的请求成功率

2.2 Database

**Database Avg Response Time(ms)**：当前数据库事件平均响应时间，单位ms
**Database Access Successful Rate(%)**：当前数据库访问成功率
**Database Traffic(CPM：CallsPerMinute)**：当前数据库每分钟请求数
**Database Access Latency Percentile(ms)**：数据库不同比例的响应时间，单位ms
**Slow Statements(ms)**：前N个慢查询，单位ms
**All Database Loads(CPM：CallsPerMinute)**：所有数据库中请求量排序
**Un-Health Databases**：所有数据库不健康排名，请求成功率排名，失败最多的请求在最上。

3. 拓扑图

**AllGroups****：**选择服务组
**AllServices****：**选择服务
**CreateGroup****：**创建新的服务组
**服务引用拓扑图：**展示服务之间的调用关系，以及服务器的健康状态。

3.1 实例信息面板

当前服务：可选择具体服务
当前端点：可选择具体端点
当前深度：可以选择展示的调用深度
平均响应时间
平均吞吐量
平均SLA
相应百分比

2-告警面板
3-追踪信息面板
4-服务实力性能状态面板
5-Endpoint(API)面板

4. 追踪

5. 性能剖析

6. 日志

未启用

7. 告警

服务的平均响应时间在最近10分钟内有3分钟超过1秒
服务的成功率在最近10分钟内有2分钟低于80％
实例的平均响应时间在最近10分钟内有2分钟超过1秒
数据库的平均响应时间在最近10分钟内有2分钟超过1秒
端点的平均响应时间在最近10分钟内有2分钟超过1秒
服务在最近10分钟内有2分钟超过1秒平均响应时间超过1秒并且成功率低于80％

8. 名词解释

**CPM/PPM****：**对于HTTP1/2、gRPC、RPC服务，这意味着每分钟调用数(CPM：CallsPerMinute)，对于TCP服务，这意味着每分钟包数(PPM：PacketsPerMinute)
**Endpoint****：**表示具体的服务，例如一个接口或一个定时任务。
**标签：**我们可以通过core/default/searchableTracesTages中配置标记。

9. 特殊说明

如果监控平台正常启动，监控项目也接入，但是就是没有数据，请看看是否是时区问题。

转载请注明：文章转载自 www.wk8.com.cn

本文地址：https://www.wk8.com.cn/it/1040418.html

上一篇 Java基础(8.7笔记)

下一篇物联网消息队列客户端-MQTT-基本功能实现

Java相关栏目本月热门文章

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号：晋ICP备2021003244-6号