9个版本
新 0.11.0-alpha.9 | 2024年8月21日 |
---|---|
0.11.0-alpha.8 | 2024年8月15日 |
0.11.0-alpha.7 | 2024年7月31日 |
0.11.0-alpha.6 | 2024年6月28日 |
#245 in 调试
247 每月下载量
485KB
9K SLoC
emit_otlp
通过OpenTelemetry协议(OTLP)发送诊断事件。
此库直接向某些远程OTLP接收器发送导出请求。如果您需要将emit
与OpenTelemetry SDK集成,请参阅emit-opentelemetry
。
lib.rs
:
通过OpenTelemetry协议(OTLP)发送诊断事件。
此库提供Otlp
,一个发送导出请求直接到某些远程OTLP接收器的emit::Emitter
。如果您需要将emit
与OpenTelemetry SDK集成,请参阅emit-opentelemetry
。
工作原理
┌────────────────────────────────────────┐ ┌─────────────┐ ┌─────────────────────────────┐
│ caller │ │ channel │ │ background worker │
│ │ │ │ │ │
│ emit::Event─┬─*─►is trace?──►Span──────┼──┼──►Trace─────┼─┐ │ ExportTraceServiceRequest │
│ │ │ │ │ │ │ │
│ ├─*─►is metric?─►Metric────┼──┼──►Metrics───┼─┼──► ExportMetricsServiceRequest │
│ │ │ │ │ │ │ │
│ └─*─────────────►LogRecord─┼──┼──►Logs──────┼─┘ │ ExportLogsServiceRequest │
└────────────────────────────────────────┘ └─────────────┘ └─────────────────────────────┘
* Only if the logs/trace/metrics signal is configured
发射器基于异步、批量通道。诊断事件通过以下关键步骤从emit::emit!
传递到远程OTLP接收器
- 确定事件属于哪种信号
- 如果事件携带
emit::Kind::Span
,并且已配置跟踪信号,则将其视为跨度。 - 如果事件携带
emit::Kind::Metric
,并且已配置了度量信号,则将其视为度量。 - 在其他任何情况下,如果已配置了日志信号,则将其视为日志记录。
- 将事件序列化为目标格式(JSON/protobuf)的OTLP数据结构。
- 将序列化的事件放入通道。每个信号在通道中都有自己的内部队列。
- 在后台工作线程中,通过将事件组合成OTLP导出请求并使用目标协议(HTTP/gRPC)发送它们来处理通道中的事件。
此库基于hyper
的HTTP和rustls
的TLS以及ring
。这些依赖项不可配置,也不能替换为替代实现。
入门指南
将emit
和emit_otlp
添加到您的Cargo.toml
[dependencies.emit]
version = "0.11.0-alpha.9"
[dependencies.emit_otlp]
version = "0.11.0-alpha.9"
在main.rs
的开始处使用OTLP发射器初始化emit
fn main() {
let rt = emit::setup()
.emit_to(emit_otlp::new()
// Add required resource properties for OTLP
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
// Configure endpoints for logs/traces/metrics using gRPC + protobuf
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4319"))
.traces(emit_otlp::traces_grpc_proto("https://127.0.0.1:4319"))
.metrics(emit_otlp::metrics_grpc_proto("https://127.0.0.1:4319"))
.spawn()
.unwrap())
.init();
// Your app code goes here
rt.blocking_flush(std::time::Duration::from_secs(30));
}
[new
] 方法返回一个OtlpBuilder
,可以通过其OtlpBuilder::logs
、OtlpBuilder::traces
和OtlpBuilder::metrics
方法进行配置。
您不需要配置所有信号,但至少应配置OtlpBuilder::logs
。
配置好构建器后,调用OtlpBuilder::spawn
并将生成的Otlp
传递给emit::Setup::emit_to
。
后台工作线程的生成位置
Otlp
发射器不会直接执行任何工作。所有这些都由通过OtlpBuilder::spawn
创建的后台工作线程处理。而OtlpBuilder::spawn
实际上在何处生成后台工作线程取决于其调用位置。
如果OtlpBuilder::spawn
在tokio
运行时内调用,则工作线程将生成到该运行时
// This will spawn in the active tokio runtime because of #[tokio::main]
#[tokio::main]
async fn main() {
let rt = emit::setup()
.emit_to(emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4319"))
.spawn()
.unwrap())
.init();
rt.blocking_flush(std::time::Duration::from_secs(30));
}
如果在外部 tokio
运行时调用 OtlpBuilder::spawn
,则工作将在具有单线程执行器的后台线程上启动
// This will spawn on a background thread because there's no active tokio runtime
fn main() {
let rt = emit::setup()
.emit_to(emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4319"))
.spawn()
.unwrap())
.init();
rt.blocking_flush(std::time::Duration::from_secs(30));
}
为 gRPC+protobuf 配置
函数 logs_grpc_proto
、traces_grpc_proto
和 metrics_grpc_proto
生成 gRPC+protobuf 的构建器
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4319"))
.traces(emit_otlp::traces_grpc_proto("https://127.0.0.1:4319"))
.metrics(emit_otlp::metrics_grpc_proto("https://127.0.0.1:4319"))
.spawn()
.unwrap()
gRPC 基于 HTTP,并使用已知的 URI 路径来路由 RPC 请求。这些路径将自动附加到端点,因此您在配置时无需指定它们。
为 HTTP+JSON 配置
函数 logs_http_json
、traces_http_json
和 metrics_http_json
生成 HTTP+JSON 的构建器
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_http_json("https://127.0.0.1:4318/v1/logs"))
.traces(emit_otlp::traces_http_json("https://127.0.0.1:4318/v1/traces"))
.metrics(emit_otlp::metrics_http_json("https://127.0.0.1:4318/v1/metrics"))
.spawn()
.unwrap()
为 HTTP+protobuf 配置
函数 logs_http_proto
、traces_http_proto
和 metrics_http_proto
生成 HTTP+protobuf 的构建器
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_http_proto("https://127.0.0.1:4318/v1/logs"))
.traces(emit_otlp::traces_http_proto("https://127.0.0.1:4318/v1/traces"))
.metrics(emit_otlp::metrics_http_proto("https://127.0.0.1:4318/v1/metrics"))
.spawn()
.unwrap()
配置 TLS
如果启用了 tls
Cargo 功能,并且端点方案的协议使用 https://
方案,则它将使用 rustls
和 rustls-native-certs
的 TLS。
配置压缩
如果启用了 gzip
Cargo 功能,则将自动对所有导出请求应用 gzip 压缩。
您可以通过 OtlpTransportBuilder
禁用任何压缩
emit_otlp::new()
.logs(emit_otlp::logs_proto(emit_otlp::http("https://127.0.0.1:4318/v1/logs")
.allow_compression(false))
)
自定义 HTTP 标头
您可以通过 OtlpTransportBuilder
指定用于 HTTP 或 gRPC 请求的自定义标头
emit_otlp::new()
.logs(emit_otlp::logs_proto(emit_otlp::http("https://127.0.0.1:4318/v1/logs")
.headers([
("X-ApiKey", "abcd"),
]))
)
配置资源
方法 OtlpBuilder::resource
配置要随每个导出请求发送的 OTLP 资源。一些 OTLP 接收器接受没有资源的数据,但 OpenTelemetry 规范本身要求使用资源。
至少,您应该添加 service.name
属性
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
您还应考虑设置其他已知资源属性
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
#[emit::key("telemetry.sdk.language")]
language: emit_otlp::telemetry_sdk_language(),
#[emit::key("telemetry.sdk.name")]
sdk: emit_otlp::telemetry_sdk_name(),
#[emit::key("telemetry.sdk.version")]
version: emit_otlp::telemetry_sdk_version(),
})
日志
所有 emit::Event
都可以表示为 OTLP 日志记录。您至少应配置日志信号以确保以某种方式捕获所有诊断。gRPC+Protobuf 的最小日志配置如下
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4318"))
.spawn()
.unwrap()
以下诊断
emit::info!("Hello, OTLP!");
将生成以下 HTTP+JSON 导出请求
https://127.0.0.1:4318/v1/logs
{
"resourceLogs": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeLogs": [
{
"scope": {
"name": "my_app"
},
"logRecords": [
{
"timeUnixNano": 1716804019165847000,
"observedTimeUnixNano": 1716804019165847000,
"body": {
"stringValue": "Hello, OTLP!"
},
"attributes": [],
"severityNumber": 9,
"severityText": "info"
}
]
}
]
}
]
}
当未配置跟踪信号时,跨度的事件诊断将表示为常规的 OTLP 日志记录。以下诊断
#[emit::span("Compute {a} + {b}")]
fn add(a: i32, b: i32) -> i32 {
let r = a + b;
emit::info!("Produced {r}", r);
r
}
add(1, 3);
将生成以下 HTTP+JSON 导出请求
https://127.0.0.1:4318/v1/logs
{
"resourceLogs": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeLogs": [
{
"scope": {
"name": "my_app"
},
"logRecords": [
{
"timeUnixNano": 1716804240222377000,
"observedTimeUnixNano": 1716804240222377000,
"body": {
"stringValue": "Produced 4"
},
"attributes": [
{
"key": "a",
"value": {
"intValue": 1
}
},
{
"key": "b",
"value": {
"intValue": 3
}
},
{
"key": "r",
"value": {
"intValue": 4
}
}
],
"severityNumber": 9,
"severityText": "info",
"traceId": "489571cc6b94414ceb4a32ccc2c7df09",
"spanId": "a93239061c12aa4c"
},
{
"timeUnixNano": 1716804240222675000,
"observedTimeUnixNano": 1716804240222675000,
"body": {
"stringValue": "Compute 1 + 3"
},
"attributes": [
{
"key": "a",
"value": {
"intValue": 1
}
},
{
"key": "b",
"value": {
"intValue": 3
}
},
{
"key": "evt_kind",
"value": {
"stringValue": "span"
}
},
{
"key": "span_name",
"value": {
"stringValue": "Compute {a} + {b}"
}
}
],
"severityNumber": 9,
"severityText": "info",
"traceId": "489571cc6b94414ceb4a32ccc2c7df09",
"spanId": "a93239061c12aa4c"
}
]
}
]
}
]
}
当未配置度量信号时,度量样本的事件诊断将表示为常规的 OTLP 日志记录。以下诊断
emit::emit!(
evt: emit::Metric::new(
emit::mdl!(),
"my_metric",
"count",
emit::Empty,
42,
emit::Empty,
)
);
将生成以下 HTTP+JSON 导出请求
https://127.0.0.1:4318/v1/logs
{
"resourceLogs": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeLogs": [
{
"scope": {
"name": "my_app"
},
"logRecords": [
{
"timeUnixNano": 1716876516012074000,
"observedTimeUnixNano": 1716876516012074000,
"body": {
"stringValue": "count of my_metric is 42"
},
"attributes": [
{
"key": "evt_kind",
"value": {
"stringValue": "metric"
}
},
{
"key": "metric_agg",
"value": {
"stringValue": "count"
}
},
{
"key": "metric_name",
"value": {
"stringValue": "my_metric"
}
},
{
"key": "metric_value",
"value": {
"intValue": 42
}
}
],
"severityNumber": 9,
"severityText": "info"
}
]
}
]
}
]
}
跟踪
当配置了跟踪信号时,只要满足以下条件,`emit::Event` 可以表示为 OTLP span:
- 它们在
emit::span::TraceId
属性中具有有效的emit::well_known::KEY_TRACE_ID
,以及在emit::span::SpanId
属性中具有emit::well_known::KEY_SPAN_ID
。 - 它们的
emit::Event::extent
是一个 span。也就是说,emit::Extent::is_span
是true
。 - 它们在
emit::well_known::KEY_EVT_KIND
属性中有一个emit::Kind::Span
。
如果任何条件未满足,事件将表示为 OTLP 日志记录。如果未配置日志信号,则将其丢弃。
gRPC+Protobuf 的最小日志配置
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.traces(emit_otlp::traces_grpc_proto("https://127.0.0.1:4318"))
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4318"))
.spawn()
.unwrap()
以下诊断
#[emit::span("Compute {a} + {b}")]
fn add(a: i32, b: i32) -> i32 {
let r = a + b;
emit::info!("Produced {r}", r);
r
}
add(1, 3);
将生成以下 HTTP+JSON 导出请求
https://127.0.0.1:4318/v1/traces
{
"resourceSpans": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeSpans": [
{
"scope": {
"name": "my_app"
},
"spans": [
{
"name": "Compute {a} + {b}",
"kind": 0,
"startTimeUnixNano": 1716888416629816000,
"endTimeUnixNano": 1716888416630814000,
"attributes": [
{
"key": "a",
"value": {
"intValue": 1
}
},
{
"key": "b",
"value": {
"intValue": 3
}
}
],
"traceId": "0a85ccaf666e11aaca6bd5d469e2850d",
"spanId": "2b9caa35eaefed3a"
}
]
}
]
}
]
}
https://127.0.0.1:4318/v1/logs
{
"resourceLogs": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeLogs": [
{
"scope": {
"name": "my_app"
},
"logRecords": [
{
"timeUnixNano": 1716888416630507000,
"observedTimeUnixNano": 1716888416630507000,
"body": {
"stringValue": "Produced 4"
},
"attributes": [
{
"key": "a",
"value": {
"intValue": 1
}
},
{
"key": "b",
"value": {
"intValue": 3
}
},
{
"key": "r",
"value": {
"intValue": 4
}
}
],
"severityNumber": 9,
"severityText": "info",
"traceId": "0a85ccaf666e11aaca6bd5d469e2850d",
"spanId": "2b9caa35eaefed3a"
}
]
}
]
}
]
}
如果设置了 emit::well_known::KEY_ERR
属性,则生成的 OTLP span 将携带语义异常事件
#[emit::span(guard: span, "Compute {a} + {b}")]
fn add(a: i32, b: i32) -> i32 {
let r = a + b;
if r == 4 {
span.complete_with(|evt| {
emit::error!(
evt,
"Compute {a} + {b} failed",
a,
b,
r,
err: "Invalid result",
);
});
}
r
}
add(1, 3);
https://127.0.0.1:4318/v1/traces
{
"resourceSpans": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeSpans": [
{
"scope": {
"name": "my_app"
},
"spans": [
{
"name": "Compute {a} + {b}",
"kind": 0,
"startTimeUnixNano": 1716936430882852000,
"endTimeUnixNano": 1716936430883250000,
"attributes": [
{
"key": "a",
"value": {
"intValue": 1
}
},
{
"key": "b",
"value": {
"intValue": 3
}
},
{
"key": "r",
"value": {
"intValue": 4
}
}
],
"traceId": "6499bc190add060dad8822600ba65226",
"spanId": "b72c5152c32cc432",
"events": [
{
"name": "exception",
"timeUnixNano": 1716936430883250000,
"attributes": [
{
"key": "exception.message",
"value": {
"stringValue": "Invalid result"
}
}
]
}
],
"status": {
"message": "Invalid result",
"code": 2
}
}
]
}
]
}
]
}
指标
当配置了指标信号时,只要满足以下条件,`emit::Event` 可以表示为 OTLP 指标:
- 它们具有
emit::well_known::KEY_METRIC_AGG
属性。 - 它们有一个
emit::well_known::KEY_METRIC_VALUE
属性,该属性包含一个数值或一系列数值。 - 它们在
emit::Kind::Metric
中有一个emit::well_known::KEY_EVT_KIND
属性。
如果任何条件未满足,事件将表示为 OTLP 日志记录。如果未配置日志信号,则将其丢弃。
gRPC+Protobuf 的最小日志配置
emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.metrics(emit_otlp::metrics_grpc_proto("https://127.0.0.1:4318"))
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4318"))
.spawn()
.unwrap()
如果度量聚合是 "count"
,则生成的 OTLP 度量是一个单调的总和
emit::emit!(
evt: emit::Metric::new(
emit::mdl!(),
"my_metric",
"count",
emit::Empty,
42,
emit::props! {
a: true
},
)
);
https://127.0.0.1:4318/v1/metrics
{
"resourceMetrics": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeMetrics": [
{
"scope": {
"name": "my_app"
},
"metrics": [
{
"name": "my_metric",
"unit": null,
"sum": {
"dataPoints": [
{
"attributes": [
{
"key": "a",
"value": {
"boolValue": true
}
}
],
"startTimeUnixNano": 1716889540249854000,
"timeUnixNano": 1716889540249854000,
"value": 42
}
],
"aggregationTemporality": 2,
"isMonotonic": true
}
}
]
}
]
}
]
}
如果度量聚合是 "sum"
,则生成的 OTLP 度量是一个非单调的总和
emit::emit!(
evt: emit::Metric::new(
emit::mdl!(),
"my_metric",
"sum",
emit::Empty,
-8,
emit::props! {
a: true
},
)
);
https://127.0.0.1:4318/v1/metrics
{
"resourceMetrics": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeMetrics": [
{
"scope": {
"name": "my_app"
},
"metrics": [
{
"name": "my_metric",
"unit": null,
"sum": {
"dataPoints": [
{
"attributes": [
{
"key": "a",
"value": {
"boolValue": true
}
}
],
"startTimeUnixNano": 1716889891391075000,
"timeUnixNano": 1716889891391075000,
"value": -8
}
],
"aggregationTemporality": 2,
"isMonotonic": false
}
}
]
}
]
}
]
}
任何其他聚合都将表示为 OTLP 仪表
emit::emit!(
evt: emit::Metric::new(
emit::mdl!(),
"my_metric",
"last",
emit::Empty,
615,
emit::props! {
a: true
},
)
);
https://127.0.0.1:4318/v1/metrics
{
"resourceMetrics": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeMetrics": [
{
"scope": {
"name": "my_app"
},
"metrics": [
{
"name": "my_metric",
"unit": null,
"gauge": {
"dataPoints": [
{
"attributes": [
{
"key": "a",
"value": {
"boolValue": true
}
}
],
"startTimeUnixNano": 1716890230856380000,
"timeUnixNano": 1716890230856380000,
"value": 615
}
]
}
}
]
}
]
}
]
}
如果度量聚合是 "count"
或 "sum"
,并且值是一个序列,那么每个值都将被求和以产生一个数据点
let start = emit::Timestamp::from_unix(std::time::Duration::from_secs(1716890420));
let end = emit::Timestamp::from_unix(std::time::Duration::from_secs(1716890425));
emit::emit!(
evt: emit::Metric::new(
emit::mdl!(),
"my_metric",
"count",
start..end,
&[
1.0,
1.0,
1.0,
1.0,
1.0,
],
emit::props! {
a: true
},
)
);
https://127.0.0.1:4318/v1/metrics
{
"resourceMetrics": [
{
"resource": {
"attributes": [
{
"key": "service.name",
"value": {
"stringValue": "my_app"
}
}
]
},
"scopeMetrics": [
{
"scope": {
"name": "my_app"
},
"metrics": [
{
"name": "my_metric",
"unit": null,
"sum": {
"dataPoints": [
{
"attributes": [
{
"key": "a",
"value": {
"boolValue": true
}
}
],
"startTimeUnixNano": 1716890420000000000,
"timeUnixNano": 1716890425000000000,
"value": 5
}
],
"aggregationTemporality": 1,
"isMonotonic": true
}
}
]
}
]
}
]
}
限制
这个库不是 OpenTelemetry SDK 的替代品。它专门针对向 OTLP 兼容服务发射诊断事件。它有一些故意的限制
- 无传播。 这是由应用程序负责管理的。
- 无直方图度量。 与 OpenTelemetry 相比,`emit` 的度量数据模型很简单,因此不支持直方图或指数直方图。
- 无跨度事件。 仅支持传统的异常事件。独立的日志事件不会转换为跨度事件。它们通过日志端点发送。
- 无 tracestate。 `emit` 的跨度数据模型不包括 W3C tracestate。
故障排除
如果您在 OTLP 接收器中看不到诊断出现,您可以通过配置 `emit` 的内部日志来排除 emit_otlp
中的配置问题,并从它那里收集指标
use emit::metric::Source;
fn main() {
// 1. Initialize the internal logger
// Diagnostics produced by `emit_otlp` itself will go here
let internal = emit::setup()
.emit_to(emit_term::stdout())
.init_internal();
let mut reporter = emit::metric::Reporter::new();
let rt = emit::setup()
.emit_to({
let otlp = emit_otlp::new()
.resource(emit::props! {
#[emit::key("service.name")]
service_name: emit::pkg!(),
})
.logs(emit_otlp::logs_grpc_proto("https://127.0.0.1:4319"))
.traces(emit_otlp::traces_grpc_proto("https://127.0.0.1:4319"))
.metrics(emit_otlp::metrics_grpc_proto("https://127.0.0.1:4319"))
.spawn()
.unwrap();
// 2. Add `emit_otlp`'s metrics to a reporter so we can see what it's up to
// You can do this independently of the internal emitter
reporter.add_source(otlp.metric_source());
otlp
})
.init();
// Your app code goes here
rt.blocking_flush(std::time::Duration::from_secs(30));
// 3. Report metrics after attempting to flush
// You could also do this periodically as your application runs
reporter.emit_metrics(&internal.emitter());
}
诊断包括批次的发射以及观察到的任何失败。
依赖关系
~8–19MB
~269K SLoC