Capacity Planning¶

Scope¶

This file covers capacity planning and performance sizing including load testing, growth projections, auto-scaling validation, database connection limits, and cost projection. For compute instance selection, see general/compute.md. For testing strategies including load testing tools, see general/testing-strategy.md.

Checklist¶

Why This Matters¶

Under-provisioning causes outages during peak traffic. Over-provisioning wastes money continuously. Without load testing, capacity is guesswork — teams discover limits during production incidents instead of planned tests. Auto-scaling is not instant; it takes 2-10 minutes to provision new instances, during which traffic must be absorbed by existing capacity (hence the headroom requirement). Database connection limits are the most common unplanned bottleneck — a 100-connection limit shared across 20 application instances means only 5 connections per instance. Storage growth is predictable but frequently ignored until disks fill up. Translating capacity plans into cost projections lets the business make informed decisions about growth investment vs architecture changes.

Common Decisions (ADR Triggers)¶

Sizing approach — empirical (load test and measure) vs analytical (model-based), frequency of re-validation
Load testing tool — k6 vs Locust vs Gatling, distributed load generation setup, realistic traffic patterns vs synthetic
Headroom policy — percentage buffer above peak (20-30% typical), cost justification, review cadence
Auto-scaling configuration — scaling metric (CPU, memory, request count, custom), thresholds, cooldown periods, instance limits
Database connection strategy — connection pooler selection (PgBouncer, RDS Proxy), pool sizing formula, read replica connection routing
Storage tiering — hot/warm/cold storage lifecycle, data retention policy, archive strategy (Glacier, Archive Storage)
Burst capacity approach — pre-provisioned reserve vs pure auto-scaling vs CDN/edge absorption vs queue-based load leveling
Performance budget — latency targets per endpoint (p99 < 500ms), error rate thresholds, degradation graceful fallbacks
Cost modeling — cost per user/transaction at scale, reserved vs on-demand ratio, break-even analysis for architectural changes

Capacity Planning¶

Scope¶

Checklist¶

Why This Matters¶

Common Decisions (ADR Triggers)¶

See Also¶