Skip to content

System Design Diagrams

Notes

singhkshitij/awesome-system-design-diagrams

System Design Diagrams

singhkshitij/awesome-system-design-diagrams

Home
HLD Fundamentals
HLD Fundamentals
- API Gateway
  API Gateway
  - Simple
  - Detailed
  - Notes
- API Versioning Evolution
  API Versioning Evolution
  - Simple
  - Detailed
  - Notes
- Batch Stream Processing
  Batch Stream Processing
  - Simple
  - Detailed
  - Notes
- Caching Strategies
  Caching Strategies
  - Simple
  - Detailed
  - Notes
- CAP PACELC
  CAP PACELC
  - Simple
  - Detailed
  - Notes
- Capacity Planning
  Capacity Planning
  - Simple
  - Detailed
  - Notes
- CDN
  CDN
  - Simple
  - Detailed
  - Notes
- Change Data Capture
  Change Data Capture
  - Simple
  - Detailed
  - Notes
- Consensus Raft Paxos
  Consensus Raft Paxos
  - Simple
  - Detailed
  - Notes
- Consistent Hashing
  Consistent Hashing
  - Simple
  - Detailed
  - Notes
- CRDTs
  CRDTs
  - Simple
  - Detailed
  - Notes
- Database Sharding
  Database Sharding
  - Simple
  - Detailed
  - Notes
- Distributed Transactions
  Distributed Transactions
  - Simple
  - Detailed
  - Notes
- Event Sourcing Cqrs
  Event Sourcing Cqrs
  - Simple
  - Detailed
  - Notes
- Geo Indexing
  Geo Indexing
  - Simple
  - Detailed
  - Notes
- Http Protocols
  Http Protocols
  - Simple
  - Detailed
  - Notes
- Idempotency Retries
  Idempotency Retries
  - Simple
  - Detailed
  - Notes
- Load Balancer
  Load Balancer
  - Simple
  - Detailed
  - Notes
- Logical Clocks
  Logical Clocks
  - Simple
  - Detailed
  - Notes
- Multi Region Dr
  Multi Region Dr
  - Simple
  - Detailed
  - Notes
- MVCC Isolation Levels
  MVCC Isolation Levels
  - Simple
  - Detailed
  - Notes
- Observability
  Observability
  - Simple
  - Detailed
  - Notes
- Probabilistic Data Structures
  Probabilistic Data Structures
  - Simple
  - Detailed
  - Notes
- Pub Sub Pattern
  Pub Sub Pattern
  - Simple
  - Detailed
  - Notes
- Realtime Protocols
  Realtime Protocols
  - Simple
  - Detailed
  - Notes
- Replication Leader Follower
  Replication Leader Follower
  - Simple
  - Detailed
  - Notes
- Resilience Patterns
  Resilience Patterns
  - Simple
  - Detailed
  - Notes Notes
    Table of contents
    
    Default playbook for any service call
    
    Sizing concurrency
    
    Failure detection
    
    Anti-patterns
    
    Where this shows up in this repo
    
    Refs
- Search Internals
  Search Internals
  - Simple
  - Detailed
  - Notes
- Service Mesh
  Service Mesh
  - Simple
  - Detailed
  - Notes
- Storage Engines LSM B-Tree
  Storage Engines LSM B-Tree
  - Simple
  - Detailed
  - Notes
LLD Concepts
LLD Concepts
- Async Models
  Async Models
  - Simple
  - Detailed
  - Notes
- Behavioral Patterns
  Behavioral Patterns
  - Simple
  - Detailed
  - Notes
- Clean Architecture
  Clean Architecture
  - Simple
  - Detailed
  - Notes
- Composition Over Inheritance
  Composition Over Inheritance
  - Simple
  - Detailed
  - Notes
- Concurrency Primitives
  Concurrency Primitives
  - Simple
  - Detailed
  - Notes
- Creational Patterns
  Creational Patterns
  - Simple
  - Detailed
  - Notes
- Data Structures Complexity
  Data Structures Complexity
  - Simple
  - Detailed
  - Notes
- Ddd Tactical
  Ddd Tactical
  - Simple
  - Detailed
  - Notes
- Dependency Injection
  Dependency Injection
  - Simple
  - Detailed
  - Notes
- Error Handling
  Error Handling
  - Simple
  - Detailed
  - Notes
- Immutability
  Immutability
  - Simple
  - Detailed
  - Notes
- Oop Pillars
  Oop Pillars
  - Simple
  - Detailed
  - Notes
- Repository Pattern
  Repository Pattern
  - Simple
  - Detailed
  - Notes
- Rest API Design
  Rest API Design
  - Simple
  - Detailed
  - Notes
- Solid Principles
  Solid Principles
  - Simple
  - Detailed
  - Notes
- State Machines
  State Machines
  - Simple
  - Detailed
  - Notes
- Structural Patterns
  Structural Patterns
  - Simple
  - Detailed
  - Notes
- Testing Strategy
  Testing Strategy
  - Simple
  - Detailed
  - Notes
- Threading And Deadlocks
  Threading And Deadlocks
  - Simple
  - Detailed
  - Notes
Classics
Classics
- Distributed Cache
  Distributed Cache
  - Simple
  - Detailed
  - Notes
- Key Value Store
  Key Value Store
  - Simple
  - Detailed
  - Notes
- News Feed
  News Feed
  - Simple
  - Detailed
  - Notes
- Notification System
  Notification System
  - Simple
  - Detailed
  - Notes
- Pastebin
  Pastebin
  - Simple
  - Detailed
  - Notes
- Rate Limiter
  Rate Limiter
  - Simple
  - Detailed
  - Notes
- Search Autocomplete
  Search Autocomplete
  - Simple
  - Detailed
  - Notes
- Unique Id Generator
  Unique Id Generator
  - Simple
  - Detailed
  - Notes
- Url Shortener
  Url Shortener
  - Simple
  - Detailed
  - Notes
- Web Crawler
  Web Crawler
  - Simple
  - Detailed
  - Notes
Social & Communication
Social & Communication
- Email Service
  Email Service
  - Simple
  - Detailed
  - Notes
- Facebook News Feed
  Facebook News Feed
  - Simple
  - Detailed
  - Notes
- Instagram
  Instagram
  - Simple
  - Detailed
  - Notes
- LinkedIn
  LinkedIn
  - Simple
  - Detailed
  - Notes
- Pinterest
  Pinterest
  - Simple
  - Detailed
  - Notes
- Reddit Q&A
  Reddit Q&A
  - Simple
  - Detailed
  - Notes
- Slack
  Slack
  - Simple
  - Detailed
  - Notes
- TikTok
  TikTok
  - Simple
  - Detailed
  - Notes
- Twitter
  Twitter
  - Simple
  - Detailed
  - Notes
- WhatsApp
  WhatsApp
  - Simple
  - Detailed
  - Notes
Media & Streaming
Media & Streaming
- Netflix
  Netflix
  - Simple
  - Detailed
  - Notes
- Reels Shorts
  Reels Shorts
  - Simple
  - Detailed
  - Notes
- Spotify
  Spotify
  - Simple
  - Detailed
  - Notes
- Twitch
  Twitch
  - Simple
  - Detailed
  - Notes
- YouTube
  YouTube
  - Simple
  - Detailed
  - Notes
- Zoom
  Zoom
  - Simple
  - Detailed
  - Notes
Storage & File
Storage & File
- Distributed File System
  Distributed File System
  - Simple
  - Detailed
  - Notes
- Document Database
  Document Database
  - Simple
  - Detailed
  - Notes
- Google Drive
  Google Drive
  - Simple
  - Detailed
  - Notes
- Google Photos
  Google Photos
  - Simple
  - Detailed
  - Notes
- Object Storage
  Object Storage
  - Simple
  - Detailed
  - Notes
- Time Series Database
  Time Series Database
  - Simple
  - Detailed
  - Notes
E-commerce & Marketplaces
E-commerce & Marketplaces
- Airbnb
  Airbnb
  - Simple
  - Detailed
  - Notes
- Amazon
  Amazon
  - Simple
  - Detailed
  - Notes
- eBay Auction
  eBay Auction
  - Simple
  - Detailed
  - Notes
- Flipkart
  Flipkart
  - Simple
  - Detailed
  - Notes
- Food Delivery
  Food Delivery
  - Simple
  - Detailed
  - Notes
- OLX Classifieds
  OLX Classifieds
  - Simple
  - Detailed
  - Notes
- Ticketmaster
  Ticketmaster
  - Simple
  - Detailed
  - Notes
Location & Maps
Location & Maps
- Find My Friends
  Find My Friends
  - Simple
  - Detailed
  - Notes
- Geofencing
  Geofencing
  - Simple
  - Detailed
  - Notes
- Google Maps
  Google Maps
  - Simple
  - Detailed
  - Notes
- Proximity Service
  Proximity Service
  - Simple
  - Detailed
  - Notes
- Uber
  Uber
  - Simple
  - Detailed
  - Notes
- Yelp
  Yelp
  - Simple
  - Detailed
  - Notes
Financial & Payments
Financial & Payments
- Crypto Exchange
  Crypto Exchange
  - Simple
  - Detailed
  - Notes
- Digital Wallet
  Digital Wallet
  - Simple
  - Detailed
  - Notes
- Fraud Detection
  Fraud Detection
  - Simple
  - Detailed
  - Notes
- Payment Gateway
  Payment Gateway
  - Simple
  - Detailed
  - Notes
- Splitwise
  Splitwise
  - Simple
  - Detailed
  - Notes
- Stock Exchange
  Stock Exchange
  - Simple
  - Detailed
  - Notes
- UPI
  UPI
  - Simple
  - Detailed
  - Notes
Infrastructure & Platform
Infrastructure & Platform
- Ab Testing
  Ab Testing
  - Simple
  - Detailed
  - Notes
- Ad Aggregation
  Ad Aggregation
  - Simple
  - Detailed
  - Notes
- API Gateway Service
  API Gateway Service
  - Simple
  - Detailed
  - Notes
- Background Jobs
  Background Jobs
  - Simple
  - Detailed
  - Notes
- CDN Service
  CDN Service
  - Simple
  - Detailed
  - Notes
- Configuration Service
  Configuration Service
  - Simple
  - Detailed
  - Notes
- Distributed Lock
  Distributed Lock
  - Simple
  - Detailed
  - Notes
- Distributed Logging
  Distributed Logging
  - Simple
  - Detailed
  - Notes
- Distributed Tracing
  Distributed Tracing
  - Simple
  - Detailed
  - Notes
- DNS System
  DNS System
  - Simple
  - Detailed
  - Notes
- Email SMS Delivery
  Email SMS Delivery
  - Simple
  - Detailed
  - Notes
- Feature Flags
  Feature Flags
  - Simple
  - Detailed
  - Notes
- Job Scheduler
  Job Scheduler
  - Simple
  - Detailed
  - Notes
- Message Queue
  Message Queue
  - Simple
  - Detailed
  - Notes
- Metrics Monitoring
  Metrics Monitoring
  - Simple
  - Detailed
  - Notes
- Realtime Analytics
  Realtime Analytics
  - Simple
  - Detailed
  - Notes
- Recommendation System
  Recommendation System
  - Simple
  - Detailed
  - Notes
- Search Engine
  Search Engine
  - Simple
  - Detailed
  - Notes
- Service Discovery
  Service Discovery
  - Simple
  - Detailed
  - Notes
- Webhooks
  Webhooks
  - Simple
  - Detailed
  - Notes
Real-time Collaboration
Real-time Collaboration
- Collaborative Editor
  Collaborative Editor
  - Simple
  - Detailed
  - Notes
- Figma
  Figma
  - Simple
  - Detailed
  - Notes
- Google Docs
  Google Docs
  - Simple
  - Detailed
  - Notes
- Notion
  Notion
  - Simple
  - Detailed
  - Notes
- Online Whiteboard
  Online Whiteboard
  - Simple
  - Detailed
  - Notes
Specialized / Niche
Specialized / Niche
- Calendar Reminder
  Calendar Reminder
  - Simple
  - Detailed
  - Notes
- Code Execution
  Code Execution
  - Simple
  - Detailed
  - Notes
- Content Moderation
  Content Moderation
  - Simple
  - Detailed
  - Notes
- Distributed Counter
  Distributed Counter
  - Simple
  - Detailed
  - Notes
- Health Check
  Health Check
  - Simple
  - Detailed
  - Notes
- Matchmaking
  Matchmaking
  - Simple
  - Detailed
  - Notes
- Multiplayer Game
  Multiplayer Game
  - Simple
  - Detailed
  - Notes
- OAuth SSO
  OAuth SSO
  - Simple
  - Detailed
  - Notes
- Quiz Platform
  Quiz Platform
  - Simple
  - Detailed
  - Notes
- Spam Detection
  Spam Detection
  - Simple
  - Detailed
  - Notes
- Trending Top-K
  Trending Top-K
  - Simple
  - Detailed
  - Notes
- Url Filter
  Url Filter
  - Simple
  - Detailed
  - Notes
- Voting System
  Voting System
  - Simple
  - Detailed
  - Notes
LLD-flavoured
LLD-flavoured
- ATM Machine
  ATM Machine
  - Simple
  - Detailed
  - Notes
- Chess Engine
  Chess Engine
  - Simple
  - Detailed
  - Notes
- Elevator System
  Elevator System
  - Simple
  - Detailed
  - Notes
- Hotel Management
  Hotel Management
  - Simple
  - Detailed
  - Notes
- Library Management
  Library Management
  - Simple
  - Detailed
  - Notes
- Logger Framework
  Logger Framework
  - Simple
  - Detailed
  - Notes
- Movie Booking LLD
  Movie Booking LLD
  - Simple
  - Detailed
  - Notes
- Parking Lot
  Parking Lot
  - Simple
  - Detailed
  - Notes
- Snake Ladders
  Snake Ladders
  - Simple
  - Detailed
  - Notes
- Vending Machine
  Vending Machine
  - Simple
  - Detailed
  - Notes

Resilience Patterns — Notes#

Default playbook for any service call#

Timeout (connect + read), short.
Retry only idempotent ops, with exponential backoff + jitter, max N.
Circuit breaker around the call.
Bulkhead the pool.
Fallback / static response if all else fails.
Surface SLO impact via metrics.

Sizing concurrency#

Little's Law: concurrency = throughput × latency.
If p99 = 200 ms and target 1000 RPS, you need 200 concurrent slots.
Pool size bigger than that wastes; smaller queues requests.

Failure detection#

Liveness ≠ readiness. Liveness: "process alive?". Readiness: "can serve traffic?".
Heartbeat with phi-accrual: probabilistic measure of suspicion vs binary up/down.

Anti-patterns#

Infinite retry loops without budget.
Long timeouts that hold threads (default 30 s on HTTP libs is too high).
No upstream backpressure → memory blow up.
Circuit breaker per host instead of per dependency.
Retrying inside retrying (nested retry storms).

Where this shows up in this repo#

All service-to-service calls.
API gateway timeouts & circuits.
Job scheduler retry policies.
Webhook delivery retries.
Email/SMS provider failover.
Message queue consumer DLQ.

Refs#

Michael Nygard: "Release It!" (Bulkhead, Circuit Breaker patterns).
Marc Brooker AWS: "What's a 'reasonable' timeout?", "Hedging your bets."
Netflix Hystrix (now archived) docs; Resilience4j docs.
Google SRE Book ch.22 (Addressing Cascading Failures).