◆ Greenova Checkout API 성능 심층 분석 v2.1  ·  3 Scenarios · 12 Endpoints · 287M requests  ·  평균 TPS 1,842 · p95 182ms · 에러율 0.12%  ·  Bottleneck 4건 (Critical 1 · High 1 · Medium 1 · Low 1)  ·  P1 적용 예상 효과: p99 67%↓, Error 90%↓  ·  Prepared by QALabs × sunny34  · 
287M
Total Requests
1,842
Avg TPS
182ms
P95 (Normal)
2410ms
P99 (Peak)
3.41%
Error (Surge)
4
Bottlenecks

01 · 전체 시나리오 결과

3 Scenarios + 1 Retest

시나리오별 판정 분포

Doughnut

SLO 충족도 (레이더)

Radar

응답시간 SLA 대비 (ms)

Bar
▲ Analyst Note
정상 트래픽 시 SLA를 모두 충족하나, Peak 시나리오의 p99 2,410ms(SLA 1,000ms 대비 141%↑)·Surge 시나리오의 에러율 3.41%가 주요 리스크. 3개 시나리오의 복합 분석 결과 DB Connection Pool이 공통 병목 축으로 수렴.

02 · 응답시간 심층 분석

Percentile · Endpoint 매트릭스

응답시간 백분위 분포 (Peak)

Line · p50/p95/p99

엔드포인트별 p95 vs p99 (Peak)

Grouped Bar

엔드포인트 × 시나리오 응답시간 히트맵 (p95, ms)

Heatmap
Endpoint
Normal
Peak
Surge (5m)
Surge (15m)
Retest
SLA 대비
GET /products/{id}
48
98
182
310
58
-67%
GET /cart
62
124
240
420
78
-58%
POST /auth/login
82
168
340
680
124
-44%
POST /coupons/apply
210
520
820
1,420
280
+73%
POST /orders
340
920
1,680
2,410
410
+141%
POST /payments
420
1,180
2,120
2,980
520
+198%
≤100ms (우수) ≤300ms (양호) ≤700ms (주의) ≤1,200ms (위험) >1,200ms (SLA 초과)

03 · 에러율 · 처리량 분석

Surge 25분 구간 분석

HTTP 상태코드 분포 (시간대별)

Stacked Area

TPS vs 동시 사용자 (Surge)

Combo · Bar + Line

04 · 자원 사용률 상관 분석

CPU · Memory · DB Pool · Cache

자원 사용률 타임라인 (Peak 30분)

Multi-Line

DB Pool Saturation vs 에러율 상관

Dual Axis
▲ 상관 분석
DB Connection Pool 사용률이 80%를 넘는 순간부터 에러율이 기하급수적으로 증가. Redis Hit Ratio 하락(94→62%)과 DB 부하 상승이 거의 동일 타임라인에 발생하는 것으로 보아 캐시 미스 → DB 부하 가중 → Pool 고갈의 연쇄 반응 확인.

05 · 병목 원인 분해

4 Bottlenecks · Root Cause

응답시간 구성 분해 (Peak p99)

Stacked Bar · Waterfall

병목별 기여도 (Pareto)

Bar + Line (Cumulative %)

06 · 튜닝 ROI · 우선순위

Effort vs Impact Matrix

튜닝 Effort × Impact 매트릭스

Bubble Scatter

튜닝 전/후 예상 효과

Grouped Bar

상세 액션 플랜

4 actions
#튜닝 항목대상예상 효과공수ROI우선순위
01HikariCP Pool 100→300 + Long Tx 분리B-001 · 주문 APIp99 2,410→800ms · Error 3.41→0.3%3일★★★★★P1
02Redis TTL jitter + Pre-warmingB-002 · 상품 상세Hit ratio 62→90% · DB 부하 -40%2일★★★★★P1
03Warm Pool 2대 상시 유지B-004 · Auto-scalingSurge 초기 에러율 3.88→1.2%1일★★★★P2
04CDN 기반 이미지 변환 이관B-003 · 리사이즈p99 210→140ms · App CPU -17%p4일★★★P3

07 · 이전 버전 대비 트렌드

v1.8 → v2.0 → v2.1

버전별 p95 응답시간 추이

Line · 3 versions

버전별 SLO 충족률

100% Stacked