[AWS] CloudWatch를 사용한 MSK 모니터링 참조 메트릭
DEFAULT 수준 모니터링
다음 표에 설명된 지표는 DEFAULT 모니터링 수준에서 사용할 수 있습니다.
이름표시되는 경우 Dimensions설명
ActiveControllerCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름 | 클러스터당 하나의 컨트롤러만 지정된 시간에 활성화되어야 합니다. |
BurstBalance | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 클러스터의 EBS 볼륨에 대한 입력-출력 버스트 크레딧의 남은 잔액. 지연 시간 또는 처리량 감소를 조사하는 데 사용합니다. 볼륨의 기준 성능이 최대 버스트 성능보다 높은 경우 EBS 볼륨에 대해 BurstBalance가 보고되지 않습니다. 자세한 내용은 I/O 크레딧 및 버스트 성능을 참조하세요. |
BytesInPerSec | 주제를 생성한 후. | 클러스터 이름, 브로커 ID, 주제 | 클라이언트로부터 받은 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다. |
BytesOutPerSec | 주제를 생성한 후. | 클러스터 이름, 브로커 ID, 주제 | 클라이언트에 전송된 초당 바이트 수입니다. 이 지표는 브로커별 및 주제별로 제공됩니다. |
ClientConnectionCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID, 클라이언트 인증 | 인증된 활성 클라이언트 연결 수입니다. |
ConnectionCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 활성 인증, 미인증 및 브로커 간 연결 수입니다. |
CPUCreditBalance | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 이 지표는 브로커의 CPU 크레딧 잔액을 모니터링하는 데 도움이 될 수 있습니다. CPU 사용량이 기준 수준인 20% 사용률 이상으로 지속되면 CPU 크레딧 잔액이 부족해져 클러스터 성능에 부정적인 영향을 미칠 수 있습니다. CPU 부하를 줄이기 위한 조치를 취할 수 있습니다. 예를 들어 클라이언트 요청 수를 줄이거나 브로커 유형을 M5 브로커 유형으로 업데이트할 수 있습니다. |
CpuIdle | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | CPU 유휴 시간의 백분율입니다. |
CpuIoWait | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 보류 중인 디스크 작업 중 CPU 유휴 시간의 백분율입니다. |
CpuSystem | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 커널 공간에 있는 CPU의 백분율입니다. |
CpuUser | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 사용자 공간에 있는 CPU의 백분율입니다. |
GlobalPartitionCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름 | 클러스터의 모든 주제에서 복제본을 제외한 파티션 수입니다. GlobalPartitionCount에는 복제본이 포함되지 않으므로 주제의 복제 인수가 1보다 큰 경우 PartitionCount 값의 합계가 GlobalPartitionCount보다 클 수 있습니다. |
GlobalTopicCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름 | 클러스터의 모든 브로커에 있는 총 주제 수입니다. |
EstimatedMaxTimeLag | 소비자 그룹이 주제에서 소비한 후. | 소비자 그룹, 주제 | MaxOffsetLag를 배출하는 데 걸리는 예상 시간(초)입니다. |
KafkaAppLogsDiskUsed | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 애플리케이션 로그에 사용된 디스크 공간의 백분율입니다. |
KafkaDataLogsDiskUsed(Cluster Name, Broker ID 차원) | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 데이터 로그에 사용된 디스크 공간의 백분율입니다. |
KafkaDataLogsDiskUsed(Cluster Name 차원) | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름 | 데이터 로그에 사용된 디스크 공간의 백분율입니다. |
LeaderCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커당 총 파티션 리더 수(복제본 제외)입니다. |
MaxOffsetLag | 소비자 그룹이 주제에서 소비한 후. | 소비자 그룹, 주제 | 주제의 모든 파티션에 대한 최대 오프셋 지연입니다. |
MemoryBuffered | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 대한 버퍼링된 메모리의 크기(바이트)입니다. |
MemoryCached | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 대한 캐시 메모리의 크기(바이트)입니다. |
MemoryFree | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 사용할 수 있는 메모리의 크기(바이트)입니다. |
HeapMemoryAfterGC | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 가비지 수집 이후 사용된 총 힙 메모리의 백분율입니다. |
MemoryUsed | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에서 사용 중인 메모리의 크기(바이트)입니다. |
MessagesInPerSec | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커의 초당 수신 메시지 수입니다. |
NetworkRxDropped | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 삭제된 수신 패키지의 수입니다. |
NetworkRxErrors | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 대한 네트워크 수신 오류 수입니다. |
NetworkRxPackets | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에서 수신된 패킷 수입니다. |
NetworkTxDropped | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 삭제된 전송 패키지의 수입니다. |
NetworkTxErrors | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커의 네트워크 전송 오류 수입니다. |
NetworkTxPackets | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커가 전송한 패킷 수입니다. |
OfflinePartitionsCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름 | 클러스터에서 오프라인 상태인 총 파티션 수입니다. |
PartitionCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 복제본을 포함하여 브로커당 주제 파티션의 총 개수입니다. |
ProduceTotalTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 밀리초 단위의 평균 생산 시간. |
RequestBytesMean | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 대한 요청 바이트의 평균 수입니다. |
RequestTime | 요청 조절이 적용된 후. | 클러스터 이름, 브로커 ID | 브로커 네트워크 및 I/O 스레드가 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다. |
RootDiskUsed | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커가 사용하는 루트 디스크의 백분율입니다. |
SumOffsetLag | 소비자 그룹이 주제에서 소비한 후. | 소비자 그룹, 주제 | 주제의 모든 파티션에 대한 집계된 오프셋 지연입니다. |
SwapFree | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에서 사용할 수 있는 스왑 메모리의 크기(바이트)입니다. |
SwapUsed | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에서 사용 중인 스왑 메모리의 크기(바이트)입니다. |
TrafficShaping | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 네트워크 할당 초과로 인해 형성(삭제 또는 대기열에 추가)된 패킷 수를 나타내는 상위 수준 지표입니다. PER_BROKER 지표를 사용하면 더 자세한 내용을 확인할 수 있습니다. |
UnderMinIsrPartitionCount | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커의 minIsr 파티션 수입니다. |
UnderReplicatedPartitions | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에 대해 복제가 덜 진행된 파티션 수입니다. |
ZooKeeperRequestLatencyMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 브로커에서 Apache ZooKeeper 요청에 대한 평균 대기 시간(밀리초)입니다. |
ZooKeeperSessionState | 클러스터가 ACTIVE 상태에 도달한 후. | 클러스터 이름, 브로커 ID | 다음 중 하나일 수 있는 브로커의 ZooKeeper 세션의 연결 상태: NOT_CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH_FAILED: '10.0'. |
PER_BROKER 수준 모니터링
모니터링 수준을 PER_BROKER로 설정하면 모든 DEFAULT 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. 다음 표의 지표에 해당하는 비용을 지불하지만 DEFAULT 수준 지표는 계속 무료로 제공됩니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID입니다.
PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표이름표시되는 경우설명
BwInAllowanceExceeded | 클러스터가 ACTIVE 상태에 도달한 후. | 인바운드 집계 대역폭이 브로커의 최대치를 초과하여 형성된 패킷 수입니다. |
BwOutAllowanceExceeded | 클러스터가 ACTIVE 상태에 도달한 후. | 아웃바운드 집계 대역폭이 브로커의 최대치를 초과하여 형성된 패킷 수입니다. |
ConnTrackAllowanceExceeded | 클러스터가 ACTIVE 상태에 도달한 후. | 연결 추적이 브로커의 최대치를 초과하여 형성된 패킷 수입니다. 연결 추적은 설정된 각 연결을 추적하여 반환 패킷이 예상대로 전달되도록 하는 보안 그룹과 관련이 있습니다. |
ConnectionCloseRate | 클러스터가 ACTIVE 상태에 도달한 후. | 리스너당 초당 닫힌 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다. |
ConnectionCreationRate | 클러스터가 ACTIVE 상태에 도달한 후. | 리스너당 초당 설정된 새 연결 수입니다. 이 숫자는 리스너별로 집계되며 클라이언트 리스너에 대해 필터링됩니다. |
CpuCreditUsage | 클러스터가 ACTIVE 상태에 도달한 후. | 이 지표는 인스턴스의 CPU 크레딧 사용량을 모니터링하는 데 도움이 될 수 있습니다. CPU 사용량이 기준 수준인 20% 이상으로 지속되면 CPU 크레딧 잔액이 부족해져 클러스터 성능에 부정적인 영향을 미칠 수 있습니다. 이 지표를 모니터링하고 경보를 보내 수정 조치를 취할 수 있습니다. |
FetchConsumerLocalTimeMsMean | 생산자/소비자가 만들어진 이후. | 소비자 요청이 리더에서 처리되는 평균 시간(밀리초)입니다. |
FetchConsumerRequestQueueTimeMsMean | 생산자/소비자가 만들어진 이후. | 소비자 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다. |
FetchConsumerResponseQueueTimeMsMean | 생산자/소비자가 만들어진 이후. | 소비자 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다. |
FetchConsumerResponseSendTimeMsMean | 생산자/소비자가 만들어진 이후. | 소비자가 응답을 보내는 평균 시간(밀리초)입니다. |
FetchConsumerTotalTimeMsMean | 생산자/소비자가 만들어진 이후. | 소비자가 브로커에서 데이터를 가져오는 데 소요하는 평균 총 시간(밀리초)입니다. |
FetchFollowerLocalTimeMsMean | 생산자/소비자가 만들어진 이후. | 팔로어 요청이 리더에서 처리되는 평균 시간(밀리초)입니다. |
FetchFollowerRequestQueueTimeMsMean | 생산자/소비자가 만들어진 이후. | 팔로어 요청이 요청 대기열에서 대기하는 평균 시간(밀리초)입니다. |
FetchFollowerResponseQueueTimeMsMean | 생산자/소비자가 만들어진 이후. | 팔로어 요청이 응답 대기열에서 대기하는 평균 시간(밀리초)입니다. |
FetchFollowerResponseSendTimeMsMean | 생산자/소비자가 만들어진 이후. | 팔로어가 응답을 보내는 평균 시간(밀리초)입니다. |
FetchFollowerTotalTimeMsMean | 생산자/소비자가 만들어진 이후. | 팔로어가 브로커에서 데이터를 가져오는 데 소비하는 평균 총 시간(밀리초)입니다. |
FetchMessageConversionsPerSec | 주제를 생성한 후. | 브로커의 초당 가져오기 메시지 변환 횟수입니다. |
FetchThrottleByteRate | 대역폭 조절이 적용된 후. | 초당 병목 현상 바이트 수입니다. |
FetchThrottleQueueSize | 대역폭 조절이 적용된 후. | 조절 대기열에 있는 메시지 수입니다. |
FetchThrottleTime | 대역폭 조절이 적용된 후. | 평균 가져오기 조절 시간(밀리초)입니다. |
NetworkProcessorAvgIdlePercent | 클러스터가 ACTIVE 상태에 도달한 후. | 네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다. |
PpsAllowanceExceeded | 클러스터가 ACTIVE 상태에 도달한 후. | 양방향 PPS가 브로커의 최대치를 초과하여 형성된 패킷 수입니다. |
ProduceLocalTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 리더에서 요청이 처리되는 평균 시간(밀리초)입니다. |
ProduceMessageConversionsPerSec | 주제를 생성한 후. | 브로커의 초당 생산 메시지 변환 수입니다. |
ProduceMessageConversionsTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 메시지 형식 변환에 소요된 평균 시간(밀리초)입니다. |
ProduceRequestQueueTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 요청 메시지가 대기열에 소비하는 평균 시간(밀리초)입니다. |
ProduceResponseQueueTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 응답 메시지가 대기열에서 소비하는 평균 시간(밀리초)입니다. |
ProduceResponseSendTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 응답 메시지를 보내는 데 소비한 평균 시간(밀리초)입니다. |
ProduceThrottleByteRate | 대역폭 조절이 적용된 후. | 초당 병목 현상 바이트 수입니다. |
ProduceThrottleQueueSize | 대역폭 조절이 적용된 후. | 조절 대기열에 있는 메시지 수입니다. |
ProduceThrottleTime | 대역폭 조절이 적용된 후. | 평균 생산 조절 시간(밀리초)입니다. |
ProduceTotalTimeMsMean | 클러스터가 ACTIVE 상태에 도달한 후. | 밀리초 단위의 평균 생산 시간. |
RemoteBytesInPerSec | 생산자/소비자가 생성된 후. | 소비자 가져오기에 대한 응답으로 계층형 스토리지에서 전송된 총 바이트 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 기여하는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteBytesOutPerSec | 생산자/소비자가 생성된 후. | 로그 세그먼트, 인덱스, 기타 보조 파일의 데이터를 포함하여 계층화된 스토리지로 전송된 총 바이트 수입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 기여하는 모든 토픽 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteLogManagerTasksAvgIdlePercent | 클러스터가 ACTIVE 상태에 도달한 후. | 원격 로그 관리자가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 관리자는 브로커에서 계층화된 스토리지로 데이터를 전송합니다. 범주는 내부 활동입니다. 이것은 KIP-405 지표입니다. |
RemoteLogReaderAvgIdlePercent | 클러스터가 ACTIVE 상태에 도달한 후. | 원격 로그 리더가 유휴 상태로 보낸 평균 시간 비율입니다. 원격 로그 리더는 소비자의 가져오기에 대한 응답으로 원격 스토리지에서 브로커로 데이터를 전송합니다. 범주는 내부 활동입니다. 이것은 KIP-405 지표입니다. |
RemoteLogReaderTaskQueueSize | 클러스터가 ACTIVE 상태에 도달한 후. | 예약 대기 중인 계층형 스토리지에서 읽기를 담당하는 작업의 수입니다. 범주는 내부 활동입니다. 이것은 KIP-405 지표입니다. |
RemoteReadErrorPerSec | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층화된 스토리지로 전송한 읽기 요청에 대한 총 오류 발생율입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteReadRequestsPerSec | 클러스터가 ACTIVE 상태에 도달한 후. | 지정한 브로커가 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 계층화된 스토리지로 전송한 총 읽기 요청 수입니다. 이 지표에는 다운스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteWriteErrorPerSec | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층화된 스토리지로 전송한 쓰기 요청에 대한 응답으로 발생한 총 오류 발생율입니다. 이 지표에는 업스트림 데이터 전송 트래픽에 영향을 미치는 모든 주제 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
ReplicationBytesInPerSec | 주제를 생성한 후. | 다른 브로커로부터 수신하는 초당 바이트 수입니다. |
ReplicationBytesOutPerSec | 주제를 생성한 후. | 다른 브로커로 전송되는 초당 바이트 수입니다. |
RequestExemptFromThrottleTime | 요청 조절이 적용된 후. | 브로커 네트워크 및 I/O 스레드가 조절에서 제외된 요청을 처리하는 데 소비한 평균 시간(밀리초)입니다. |
RequestHandlerAvgIdlePercent | 클러스터가 ACTIVE 상태에 도달한 후. | 요청 핸들러 스레드가 유휴 상태인 시간의 평균 백분율입니다. |
RequestThrottleQueueSize | 요청 조절이 적용된 후. | 조절 대기열에 있는 메시지 수입니다. |
RequestThrottleTime | 요청 조절이 적용된 후. | 평균 요청 조절 시간(밀리초)입니다. |
TcpConnections | 클러스터가 ACTIVE 상태에 도달한 후. | SYN 플래그가 설정된 수신 및 발신 TCP 세그먼트 수를 표시합니다. |
TotalTierBytesLag | 주제를 생성한 후. | 브로커에서 계층화할 수 있지만 아직 계층화된 스토리지로 전송되지 않은 데이터의 총 바이트 수입니다. 이 지표는 업스트림 데이터 전송의 효율성을 보여줍니다. 지연이 증가하면 계층형 스토리지에 유지되지 않는 데이터의 양이 증가합니다. 범주는 아카이브 지연입니다. 이것은 KIP-405 지표가 아닙니다. |
TrafficBytes | 클러스터가 ACTIVE 상태에 도달한 후. | 클라이언트(생산자 및 소비자)와 브로커 간의 네트워크 트래픽을 전체 바이트 단위로 표시합니다. 브로커 사이의 트래픽은 보고되지 않습니다. |
VolumeQueueLength | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간 동안 완료되기를 기다리는 읽기 및 쓰기 작업 요청의 수입니다. |
VolumeReadBytes | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간 동안 읽은 바이트 수입니다. |
VolumeReadOps | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간 동안의 읽기 작업 횟수입니다. |
VolumeTotalReadTime | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간에 완료된 모든 읽기 작업에 소요된 총 시간(초)입니다. |
VolumeTotalWriteTime | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간에 완료된 모든 쓰기 작업에 소요된 총 시간(초)입니다. |
VolumeWriteBytes | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간 동안 기록된 바이트 수입니다. |
VolumeWriteOps | 클러스터가 ACTIVE 상태에 도달한 후. | 지정된 기간 동안의 쓰기 작업 횟수입니다. |
PER_TOPIC_PER_BROKER 수준 모니터링
모니터링 수준을 PER_TOPIC_PER_BROKER로 설정하면 모든 PER_BROKER 및 기본 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. DEFAULT 수준 지표만 무료입니다. 이 표에 있는 지표의 차원은 클러스터 이름, 브로커 ID, 주제입니다.
Apache Kafka 2.4.1 이상 버전을 사용하는 Amazon MSK 클러스터의 경우 다음 표의 지표는 해당 값이 처음으로 0이 아닌 값이 된 후에만 나타납니다. 예를 들어, BytesInPerSec를 보려면 하나 이상의 생산자가 먼저 클러스터로 데이터를 전송해야 합니다.
PER_TOPIC_PER_BROKER 모니터링 수준부터 사용할 수 있는 추가 지표이름표시되는 경우설명
FetchMessageConversionsPerSec | 주제를 생성한 후. | 초당 가져와서 변환한 메시지 수입니다. |
MessagesInPerSec | 주제를 생성한 후. | 초당 수신된 메시지 수입니다. |
ProduceMessageConversionsPerSec | 주제를 생성한 후. | 생산된 메시지의 초당 변환 수입니다. |
RemoteBytesInPerSec | 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. | 지정된 주제 및 브로커에 대한 소비자 가져오기에 대한 응답으로 계층형 스토리지에서 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteBytesOutPerSec | 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. | 지정된 주제 및 브로커에 대해 계층형 스토리지로 전송된 바이트 수입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteReadErrorPerSec | 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. | 지정된 주제에 대한 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 지정된 브로커가 계층화된 스토리지로 보내는 읽기 요청에 대한 응답으로 발생하는 오류의 비율입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteReadRequestsPerSec | 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. | 지정된 주제에 대한 소비자 가져오기에 대한 응답으로 데이터를 검색하기 위해 지정한 브로커가 계층화된 스토리지로 보내는 읽기 요청의 수입니다. 이 지표에는 지정된 브로커의 다운스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
RemoteWriteErrorPerSec | 주제 생성 후 해당 주제가 생산/소비되고 있는 경우. | 지정된 브로커가 데이터를 업스트림으로 전송하기 위해 계층형 스토리지로 보내는 쓰기 요청에 대한 응답으로 발생하는 오류의 비율입니다. 이 지표에는 지정된 브로커의 업스트림 데이터 전송 트래픽에 기여하는 주제의 모든 파티션이 포함되어 있습니다. 범주는 트래픽 및 오류 발생율입니다. 이것은 KIP-405 지표입니다. |
PER_TOPIC_PER_PARTITION 수준 모니터링
모니터링 수준을 PER_TOPIC_PER_PARTITION로 설정하면 모든 PER_TOPIC_PER_BROKER, PER_BROKER, 기본 수준 지표 외에 다음 표에 설명된 지표가 표시됩니다. DEFAULT 수준 지표만 무료입니다. 이 표의 지표에는 소비자 그룹, 주제, 파티션 등의 차원이 있습니다.
PER_TOPIC_PER_PARTITION 모니터링 수준부터 사용할 수 있는 추가 지표이름표시되는 경우설명
EstimatedTimeLag | 소비자 그룹이 주제에서 소비한 후. | 파티션 오프셋 지연을 배출하는 데 걸리는 예상 시간(초)입니다. |
OffsetLag | 소비자 그룹이 주제에서 소비한 후. | 파티션 수준 소비자 지연의 오프셋 수입니다. |
'Architecture' 카테고리의 다른 글
K8s 2) 쿠버네티스 구축 (0) | 2024.05.18 |
---|---|
K8s 1) 쿠버네티스 기본 (0) | 2024.05.17 |
Kafka 2) 모니터링 (2) | 2024.01.11 |
Kafka 1) 연결 모니터링 (2) | 2024.01.11 |
MSA 5) MSA 분리 전략 : 도메인 주도 설계 (0) | 2023.11.01 |