AWS EC2 and Auto Scaling Groups¶

Scope¶

AWS virtual machine compute and auto-scaling. Covers instance families (including Graviton), launch templates, mixed instance policies, Spot Instances, AMI pipelines, IMDSv2, EBS volumes, scaling policies, and Capacity Blocks for ML.

Checklist¶

Why This Matters¶

EC2 and ASG configuration directly affects availability, performance, and cost. Launch configurations are legacy and cannot be versioned. Single-AZ ASGs fail completely during AZ outages. IMDSv1 is a known attack vector. Oversized instances waste money; undersized instances degrade performance. Ungoverned AMIs accumulate vulnerabilities.

Common Decisions (ADR Triggers)¶

Instance family and generation -- Graviton4 (R8g/M8g/C8g, best price-performance) vs Graviton3 vs x86 (Intel/AMD), latest generation vs compatibility needs
Purchase model -- On-Demand vs Reserved Instances vs Savings Plans vs Spot, commitment term
AMI management -- EC2 Image Builder vs Packer, base AMI source, patching cadence, AMI lifecycle policy
Scaling strategy -- target tracking vs step scaling vs predictive scaling, scale-out speed vs cost
EBS volume type -- gp3 (baseline IOPS/throughput) vs io2 (provisioned IOPS) vs instance store for ephemeral data
Access model -- SSM Session Manager vs SSH bastion, OS-level access controls
Spot strategy -- capacity-optimized vs lowest-price allocation, diversified instance pools
Instance selection method -- attribute-based instance type selection (ABS) vs explicit instance type lists; ABS simplifies maintenance across instance generations and improves Spot capacity by automatically including matching types
ML/GPU capacity -- On-Demand GPU instances vs Capacity Blocks for ML (reserved GPU capacity for defined duration) vs Spot GPU instances (high interruption risk for training)

Reference Architectures¶

AWS Architecture Center: Compute -- reference architectures for EC2, Auto Scaling, and Spot integration patterns
AWS Well-Architected Labs: Cost Optimization - EC2 Right Sizing -- hands-on labs for right-sizing EC2 instances and optimizing Auto Scaling
AWS Prescriptive Guidance: EC2 Auto Scaling for predictable and dynamic workloads -- scaling strategies and mixed instance policies
AWS Spot Instances best practices -- reference patterns for Spot diversification, capacity-optimized allocation, and interruption handling
AWS EC2 Image Builder pipeline architecture -- reference architecture for automated AMI build and distribution pipelines