Skip to content

System Design Diagrams

Notes

singhkshitij/awesome-system-design-diagrams

System Design Diagrams

singhkshitij/awesome-system-design-diagrams

Home
HLD Fundamentals
HLD Fundamentals
- API Gateway
  API Gateway
  - Simple
  - Detailed
  - Notes
- API Versioning Evolution
  API Versioning Evolution
  - Simple
  - Detailed
  - Notes
- Batch Stream Processing
  Batch Stream Processing
  - Simple
  - Detailed
  - Notes
- Caching Strategies
  Caching Strategies
  - Simple
  - Detailed
  - Notes
- CAP PACELC
  CAP PACELC
  - Simple
  - Detailed
  - Notes
- Capacity Planning
  Capacity Planning
  - Simple
  - Detailed
  - Notes
- CDN
  CDN
  - Simple
  - Detailed
  - Notes
- Change Data Capture
  Change Data Capture
  - Simple
  - Detailed
  - Notes
- Consensus Raft Paxos
  Consensus Raft Paxos
  - Simple
  - Detailed
  - Notes
- Consistent Hashing
  Consistent Hashing
  - Simple
  - Detailed
  - Notes
- CRDTs
  CRDTs
  - Simple
  - Detailed
  - Notes
- Database Sharding
  Database Sharding
  - Simple
  - Detailed
  - Notes
- Distributed Transactions
  Distributed Transactions
  - Simple
  - Detailed
  - Notes
- Event Sourcing Cqrs
  Event Sourcing Cqrs
  - Simple
  - Detailed
  - Notes
- Geo Indexing
  Geo Indexing
  - Simple
  - Detailed
  - Notes
- Http Protocols
  Http Protocols
  - Simple
  - Detailed
  - Notes
- Idempotency Retries
  Idempotency Retries
  - Simple
  - Detailed
  - Notes
- Load Balancer
  Load Balancer
  - Simple
  - Detailed
  - Notes
- Logical Clocks
  Logical Clocks
  - Simple
  - Detailed
  - Notes
- Multi Region Dr
  Multi Region Dr
  - Simple
  - Detailed
  - Notes
- MVCC Isolation Levels
  MVCC Isolation Levels
  - Simple
  - Detailed
  - Notes
- Observability
  Observability
  - Simple
  - Detailed
  - Notes Notes
    Table of contents
    
    Why three pillars (and what's missing)
    
    Cost rule of thumb
    
    Cardinality budget (Prometheus / Mimir)
    
    What to instrument by default
    
    Trace propagation
    
    Practical wins
    
    Refs
- Probabilistic Data Structures
  Probabilistic Data Structures
  - Simple
  - Detailed
  - Notes
- Pub Sub Pattern
  Pub Sub Pattern
  - Simple
  - Detailed
  - Notes
- Realtime Protocols
  Realtime Protocols
  - Simple
  - Detailed
  - Notes
- Replication Leader Follower
  Replication Leader Follower
  - Simple
  - Detailed
  - Notes
- Resilience Patterns
  Resilience Patterns
  - Simple
  - Detailed
  - Notes
- Search Internals
  Search Internals
  - Simple
  - Detailed
  - Notes
- Service Mesh
  Service Mesh
  - Simple
  - Detailed
  - Notes
- Storage Engines LSM B-Tree
  Storage Engines LSM B-Tree
  - Simple
  - Detailed
  - Notes
LLD Concepts
LLD Concepts
- Async Models
  Async Models
  - Simple
  - Detailed
  - Notes
- Behavioral Patterns
  Behavioral Patterns
  - Simple
  - Detailed
  - Notes
- Clean Architecture
  Clean Architecture
  - Simple
  - Detailed
  - Notes
- Composition Over Inheritance
  Composition Over Inheritance
  - Simple
  - Detailed
  - Notes
- Concurrency Primitives
  Concurrency Primitives
  - Simple
  - Detailed
  - Notes
- Creational Patterns
  Creational Patterns
  - Simple
  - Detailed
  - Notes
- Data Structures Complexity
  Data Structures Complexity
  - Simple
  - Detailed
  - Notes
- Ddd Tactical
  Ddd Tactical
  - Simple
  - Detailed
  - Notes
- Dependency Injection
  Dependency Injection
  - Simple
  - Detailed
  - Notes
- Error Handling
  Error Handling
  - Simple
  - Detailed
  - Notes
- Immutability
  Immutability
  - Simple
  - Detailed
  - Notes
- Oop Pillars
  Oop Pillars
  - Simple
  - Detailed
  - Notes
- Repository Pattern
  Repository Pattern
  - Simple
  - Detailed
  - Notes
- Rest API Design
  Rest API Design
  - Simple
  - Detailed
  - Notes
- Solid Principles
  Solid Principles
  - Simple
  - Detailed
  - Notes
- State Machines
  State Machines
  - Simple
  - Detailed
  - Notes
- Structural Patterns
  Structural Patterns
  - Simple
  - Detailed
  - Notes
- Testing Strategy
  Testing Strategy
  - Simple
  - Detailed
  - Notes
- Threading And Deadlocks
  Threading And Deadlocks
  - Simple
  - Detailed
  - Notes
Classics
Classics
- Distributed Cache
  Distributed Cache
  - Simple
  - Detailed
  - Notes
- Key Value Store
  Key Value Store
  - Simple
  - Detailed
  - Notes
- News Feed
  News Feed
  - Simple
  - Detailed
  - Notes
- Notification System
  Notification System
  - Simple
  - Detailed
  - Notes
- Pastebin
  Pastebin
  - Simple
  - Detailed
  - Notes
- Rate Limiter
  Rate Limiter
  - Simple
  - Detailed
  - Notes
- Search Autocomplete
  Search Autocomplete
  - Simple
  - Detailed
  - Notes
- Unique Id Generator
  Unique Id Generator
  - Simple
  - Detailed
  - Notes
- Url Shortener
  Url Shortener
  - Simple
  - Detailed
  - Notes
- Web Crawler
  Web Crawler
  - Simple
  - Detailed
  - Notes
Social & Communication
Social & Communication
- Email Service
  Email Service
  - Simple
  - Detailed
  - Notes
- Facebook News Feed
  Facebook News Feed
  - Simple
  - Detailed
  - Notes
- Instagram
  Instagram
  - Simple
  - Detailed
  - Notes
- LinkedIn
  LinkedIn
  - Simple
  - Detailed
  - Notes
- Pinterest
  Pinterest
  - Simple
  - Detailed
  - Notes
- Reddit Q&A
  Reddit Q&A
  - Simple
  - Detailed
  - Notes
- Slack
  Slack
  - Simple
  - Detailed
  - Notes
- TikTok
  TikTok
  - Simple
  - Detailed
  - Notes
- Twitter
  Twitter
  - Simple
  - Detailed
  - Notes
- WhatsApp
  WhatsApp
  - Simple
  - Detailed
  - Notes
Media & Streaming
Media & Streaming
- Netflix
  Netflix
  - Simple
  - Detailed
  - Notes
- Reels Shorts
  Reels Shorts
  - Simple
  - Detailed
  - Notes
- Spotify
  Spotify
  - Simple
  - Detailed
  - Notes
- Twitch
  Twitch
  - Simple
  - Detailed
  - Notes
- YouTube
  YouTube
  - Simple
  - Detailed
  - Notes
- Zoom
  Zoom
  - Simple
  - Detailed
  - Notes
Storage & File
Storage & File
- Distributed File System
  Distributed File System
  - Simple
  - Detailed
  - Notes
- Document Database
  Document Database
  - Simple
  - Detailed
  - Notes
- Google Drive
  Google Drive
  - Simple
  - Detailed
  - Notes
- Google Photos
  Google Photos
  - Simple
  - Detailed
  - Notes
- Object Storage
  Object Storage
  - Simple
  - Detailed
  - Notes
- Time Series Database
  Time Series Database
  - Simple
  - Detailed
  - Notes
E-commerce & Marketplaces
E-commerce & Marketplaces
- Airbnb
  Airbnb
  - Simple
  - Detailed
  - Notes
- Amazon
  Amazon
  - Simple
  - Detailed
  - Notes
- eBay Auction
  eBay Auction
  - Simple
  - Detailed
  - Notes
- Flipkart
  Flipkart
  - Simple
  - Detailed
  - Notes
- Food Delivery
  Food Delivery
  - Simple
  - Detailed
  - Notes
- OLX Classifieds
  OLX Classifieds
  - Simple
  - Detailed
  - Notes
- Ticketmaster
  Ticketmaster
  - Simple
  - Detailed
  - Notes
Location & Maps
Location & Maps
- Find My Friends
  Find My Friends
  - Simple
  - Detailed
  - Notes
- Geofencing
  Geofencing
  - Simple
  - Detailed
  - Notes
- Google Maps
  Google Maps
  - Simple
  - Detailed
  - Notes
- Proximity Service
  Proximity Service
  - Simple
  - Detailed
  - Notes
- Uber
  Uber
  - Simple
  - Detailed
  - Notes
- Yelp
  Yelp
  - Simple
  - Detailed
  - Notes
Financial & Payments
Financial & Payments
- Crypto Exchange
  Crypto Exchange
  - Simple
  - Detailed
  - Notes
- Digital Wallet
  Digital Wallet
  - Simple
  - Detailed
  - Notes
- Fraud Detection
  Fraud Detection
  - Simple
  - Detailed
  - Notes
- Payment Gateway
  Payment Gateway
  - Simple
  - Detailed
  - Notes
- Splitwise
  Splitwise
  - Simple
  - Detailed
  - Notes
- Stock Exchange
  Stock Exchange
  - Simple
  - Detailed
  - Notes
- UPI
  UPI
  - Simple
  - Detailed
  - Notes
Infrastructure & Platform
Infrastructure & Platform
- Ab Testing
  Ab Testing
  - Simple
  - Detailed
  - Notes
- Ad Aggregation
  Ad Aggregation
  - Simple
  - Detailed
  - Notes
- API Gateway Service
  API Gateway Service
  - Simple
  - Detailed
  - Notes
- Background Jobs
  Background Jobs
  - Simple
  - Detailed
  - Notes
- CDN Service
  CDN Service
  - Simple
  - Detailed
  - Notes
- Configuration Service
  Configuration Service
  - Simple
  - Detailed
  - Notes
- Distributed Lock
  Distributed Lock
  - Simple
  - Detailed
  - Notes
- Distributed Logging
  Distributed Logging
  - Simple
  - Detailed
  - Notes
- Distributed Tracing
  Distributed Tracing
  - Simple
  - Detailed
  - Notes
- DNS System
  DNS System
  - Simple
  - Detailed
  - Notes
- Email SMS Delivery
  Email SMS Delivery
  - Simple
  - Detailed
  - Notes
- Feature Flags
  Feature Flags
  - Simple
  - Detailed
  - Notes
- Job Scheduler
  Job Scheduler
  - Simple
  - Detailed
  - Notes
- Message Queue
  Message Queue
  - Simple
  - Detailed
  - Notes
- Metrics Monitoring
  Metrics Monitoring
  - Simple
  - Detailed
  - Notes
- Realtime Analytics
  Realtime Analytics
  - Simple
  - Detailed
  - Notes
- Recommendation System
  Recommendation System
  - Simple
  - Detailed
  - Notes
- Search Engine
  Search Engine
  - Simple
  - Detailed
  - Notes
- Service Discovery
  Service Discovery
  - Simple
  - Detailed
  - Notes
- Webhooks
  Webhooks
  - Simple
  - Detailed
  - Notes
Real-time Collaboration
Real-time Collaboration
- Collaborative Editor
  Collaborative Editor
  - Simple
  - Detailed
  - Notes
- Figma
  Figma
  - Simple
  - Detailed
  - Notes
- Google Docs
  Google Docs
  - Simple
  - Detailed
  - Notes
- Notion
  Notion
  - Simple
  - Detailed
  - Notes
- Online Whiteboard
  Online Whiteboard
  - Simple
  - Detailed
  - Notes
Specialized / Niche
Specialized / Niche
- Calendar Reminder
  Calendar Reminder
  - Simple
  - Detailed
  - Notes
- Code Execution
  Code Execution
  - Simple
  - Detailed
  - Notes
- Content Moderation
  Content Moderation
  - Simple
  - Detailed
  - Notes
- Distributed Counter
  Distributed Counter
  - Simple
  - Detailed
  - Notes
- Health Check
  Health Check
  - Simple
  - Detailed
  - Notes
- Matchmaking
  Matchmaking
  - Simple
  - Detailed
  - Notes
- Multiplayer Game
  Multiplayer Game
  - Simple
  - Detailed
  - Notes
- OAuth SSO
  OAuth SSO
  - Simple
  - Detailed
  - Notes
- Quiz Platform
  Quiz Platform
  - Simple
  - Detailed
  - Notes
- Spam Detection
  Spam Detection
  - Simple
  - Detailed
  - Notes
- Trending Top-K
  Trending Top-K
  - Simple
  - Detailed
  - Notes
- Url Filter
  Url Filter
  - Simple
  - Detailed
  - Notes
- Voting System
  Voting System
  - Simple
  - Detailed
  - Notes
LLD-flavoured
LLD-flavoured
- ATM Machine
  ATM Machine
  - Simple
  - Detailed
  - Notes
- Chess Engine
  Chess Engine
  - Simple
  - Detailed
  - Notes
- Elevator System
  Elevator System
  - Simple
  - Detailed
  - Notes
- Hotel Management
  Hotel Management
  - Simple
  - Detailed
  - Notes
- Library Management
  Library Management
  - Simple
  - Detailed
  - Notes
- Logger Framework
  Logger Framework
  - Simple
  - Detailed
  - Notes
- Movie Booking LLD
  Movie Booking LLD
  - Simple
  - Detailed
  - Notes
- Parking Lot
  Parking Lot
  - Simple
  - Detailed
  - Notes
- Snake Ladders
  Snake Ladders
  - Simple
  - Detailed
  - Notes
- Vending Machine
  Vending Machine
  - Simple
  - Detailed
  - Notes

Observability — Notes#

Why three pillars (and what's missing)#

Metrics: cheap, aggregable, weak detail.
Logs: rich detail, costly, hard to query for trends.
Traces: causal chains across services.
4th: Continuous profiling (Pyroscope/Parca) — code-level resource attribution.
5th, emerging: eBPF events (network, syscalls) for kernel-side observability.

Cost rule of thumb#

Logs are by far the most expensive.
Sample logs and traces aggressively in steady state.
Always keep error traces / error logs.

Cardinality budget (Prometheus / Mimir)#

Labels multiply: user × route × method × status × dc.
Drop user-level labels; aggregate them server-side if needed.

What to instrument by default#

RED: Request rate, Errors, Duration (per route).
USE: Utilization, Saturation, Errors (per resource).
Golden Signals: latency, traffic, errors, saturation (SRE book).

Trace propagation#

W3C traceparent header in HTTP/gRPC.
Across queues, propagate via headers (Kafka, SQS message attributes).
Server logs include trace_id for join with traces.

Practical wins#

Exemplars on histogram metrics let you click p99 latency directly to a slow trace.
"Tail sampling" Collector keeps every error trace without overload.
Service map auto-generated from traces gives free architecture visibility.

Refs#

Google SRE Book + SRE Workbook (SLO/SLI chapters).
OpenTelemetry docs (https://opentelemetry.io).
"Distributed Systems Observability" — Cindy Sridharan.
Honeycomb blog series on tail sampling.
Prometheus / Grafana / Loki / Tempo docs.