Skip to content

System Design Diagrams

Notes

singhkshitij/awesome-system-design-diagrams

System Design Diagrams

singhkshitij/awesome-system-design-diagrams

Home
HLD Fundamentals
HLD Fundamentals
- API Gateway
  API Gateway
  - Simple
  - Detailed
  - Notes
- API Versioning Evolution
  API Versioning Evolution
  - Simple
  - Detailed
  - Notes
- Batch Stream Processing
  Batch Stream Processing
  - Simple
  - Detailed
  - Notes
- Caching Strategies
  Caching Strategies
  - Simple
  - Detailed
  - Notes
- CAP PACELC
  CAP PACELC
  - Simple
  - Detailed
  - Notes
- Capacity Planning
  Capacity Planning
  - Simple
  - Detailed
  - Notes
- CDN
  CDN
  - Simple
  - Detailed
  - Notes
- Change Data Capture
  Change Data Capture
  - Simple
  - Detailed
  - Notes
- Consensus Raft Paxos
  Consensus Raft Paxos
  - Simple
  - Detailed
  - Notes
- Consistent Hashing
  Consistent Hashing
  - Simple
  - Detailed
  - Notes
- CRDTs
  CRDTs
  - Simple
  - Detailed
  - Notes
- Database Sharding
  Database Sharding
  - Simple
  - Detailed
  - Notes
- Distributed Transactions
  Distributed Transactions
  - Simple
  - Detailed
  - Notes
- Event Sourcing Cqrs
  Event Sourcing Cqrs
  - Simple
  - Detailed
  - Notes
- Geo Indexing
  Geo Indexing
  - Simple
  - Detailed
  - Notes
- Http Protocols
  Http Protocols
  - Simple
  - Detailed
  - Notes
- Idempotency Retries
  Idempotency Retries
  - Simple
  - Detailed
  - Notes
- Load Balancer
  Load Balancer
  - Simple
  - Detailed
  - Notes
- Logical Clocks
  Logical Clocks
  - Simple
  - Detailed
  - Notes
- Multi Region Dr
  Multi Region Dr
  - Simple
  - Detailed
  - Notes
- MVCC Isolation Levels
  MVCC Isolation Levels
  - Simple
  - Detailed
  - Notes
- Observability
  Observability
  - Simple
  - Detailed
  - Notes
- Probabilistic Data Structures
  Probabilistic Data Structures
  - Simple
  - Detailed
  - Notes
- Pub Sub Pattern
  Pub Sub Pattern
  - Simple
  - Detailed
  - Notes
- Realtime Protocols
  Realtime Protocols
  - Simple
  - Detailed
  - Notes
- Replication Leader Follower
  Replication Leader Follower
  - Simple
  - Detailed
  - Notes
- Resilience Patterns
  Resilience Patterns
  - Simple
  - Detailed
  - Notes
- Search Internals
  Search Internals
  - Simple
  - Detailed
  - Notes
- Service Mesh
  Service Mesh
  - Simple
  - Detailed
  - Notes
- Storage Engines LSM B-Tree
  Storage Engines LSM B-Tree
  - Simple
  - Detailed
  - Notes
LLD Concepts
LLD Concepts
- Async Models
  Async Models
  - Simple
  - Detailed
  - Notes
- Behavioral Patterns
  Behavioral Patterns
  - Simple
  - Detailed
  - Notes
- Clean Architecture
  Clean Architecture
  - Simple
  - Detailed
  - Notes
- Composition Over Inheritance
  Composition Over Inheritance
  - Simple
  - Detailed
  - Notes
- Concurrency Primitives
  Concurrency Primitives
  - Simple
  - Detailed
  - Notes
- Creational Patterns
  Creational Patterns
  - Simple
  - Detailed
  - Notes
- Data Structures Complexity
  Data Structures Complexity
  - Simple
  - Detailed
  - Notes
- Ddd Tactical
  Ddd Tactical
  - Simple
  - Detailed
  - Notes
- Dependency Injection
  Dependency Injection
  - Simple
  - Detailed
  - Notes
- Error Handling
  Error Handling
  - Simple
  - Detailed
  - Notes
- Immutability
  Immutability
  - Simple
  - Detailed
  - Notes
- Oop Pillars
  Oop Pillars
  - Simple
  - Detailed
  - Notes
- Repository Pattern
  Repository Pattern
  - Simple
  - Detailed
  - Notes
- Rest API Design
  Rest API Design
  - Simple
  - Detailed
  - Notes
- Solid Principles
  Solid Principles
  - Simple
  - Detailed
  - Notes
- State Machines
  State Machines
  - Simple
  - Detailed
  - Notes
- Structural Patterns
  Structural Patterns
  - Simple
  - Detailed
  - Notes
- Testing Strategy
  Testing Strategy
  - Simple
  - Detailed
  - Notes
- Threading And Deadlocks
  Threading And Deadlocks
  - Simple
  - Detailed
  - Notes
Classics
Classics
- Distributed Cache
  Distributed Cache
  - Simple
  - Detailed
  - Notes
- Key Value Store
  Key Value Store
  - Simple
  - Detailed
  - Notes
- News Feed
  News Feed
  - Simple
  - Detailed
  - Notes
- Notification System
  Notification System
  - Simple
  - Detailed
  - Notes
- Pastebin
  Pastebin
  - Simple
  - Detailed
  - Notes
- Rate Limiter
  Rate Limiter
  - Simple
  - Detailed
  - Notes
- Search Autocomplete
  Search Autocomplete
  - Simple
  - Detailed
  - Notes
- Unique Id Generator
  Unique Id Generator
  - Simple
  - Detailed
  - Notes
- Url Shortener
  Url Shortener
  - Simple
  - Detailed
  - Notes
- Web Crawler
  Web Crawler
  - Simple
  - Detailed
  - Notes Notes
    Table of contents
    
    Functional
    
    Non-functional
    
    Capacity (10B pages, 1 month)
    
    Data
    
    Trade-offs
    
    Refs
Social & Communication
Social & Communication
- Email Service
  Email Service
  - Simple
  - Detailed
  - Notes
- Facebook News Feed
  Facebook News Feed
  - Simple
  - Detailed
  - Notes
- Instagram
  Instagram
  - Simple
  - Detailed
  - Notes
- LinkedIn
  LinkedIn
  - Simple
  - Detailed
  - Notes
- Pinterest
  Pinterest
  - Simple
  - Detailed
  - Notes
- Reddit Q&A
  Reddit Q&A
  - Simple
  - Detailed
  - Notes
- Slack
  Slack
  - Simple
  - Detailed
  - Notes
- TikTok
  TikTok
  - Simple
  - Detailed
  - Notes
- Twitter
  Twitter
  - Simple
  - Detailed
  - Notes
- WhatsApp
  WhatsApp
  - Simple
  - Detailed
  - Notes
Media & Streaming
Media & Streaming
- Netflix
  Netflix
  - Simple
  - Detailed
  - Notes
- Reels Shorts
  Reels Shorts
  - Simple
  - Detailed
  - Notes
- Spotify
  Spotify
  - Simple
  - Detailed
  - Notes
- Twitch
  Twitch
  - Simple
  - Detailed
  - Notes
- YouTube
  YouTube
  - Simple
  - Detailed
  - Notes
- Zoom
  Zoom
  - Simple
  - Detailed
  - Notes
Storage & File
Storage & File
- Distributed File System
  Distributed File System
  - Simple
  - Detailed
  - Notes
- Document Database
  Document Database
  - Simple
  - Detailed
  - Notes
- Google Drive
  Google Drive
  - Simple
  - Detailed
  - Notes
- Google Photos
  Google Photos
  - Simple
  - Detailed
  - Notes
- Object Storage
  Object Storage
  - Simple
  - Detailed
  - Notes
- Time Series Database
  Time Series Database
  - Simple
  - Detailed
  - Notes
E-commerce & Marketplaces
E-commerce & Marketplaces
- Airbnb
  Airbnb
  - Simple
  - Detailed
  - Notes
- Amazon
  Amazon
  - Simple
  - Detailed
  - Notes
- eBay Auction
  eBay Auction
  - Simple
  - Detailed
  - Notes
- Flipkart
  Flipkart
  - Simple
  - Detailed
  - Notes
- Food Delivery
  Food Delivery
  - Simple
  - Detailed
  - Notes
- OLX Classifieds
  OLX Classifieds
  - Simple
  - Detailed
  - Notes
- Ticketmaster
  Ticketmaster
  - Simple
  - Detailed
  - Notes
Location & Maps
Location & Maps
- Find My Friends
  Find My Friends
  - Simple
  - Detailed
  - Notes
- Geofencing
  Geofencing
  - Simple
  - Detailed
  - Notes
- Google Maps
  Google Maps
  - Simple
  - Detailed
  - Notes
- Proximity Service
  Proximity Service
  - Simple
  - Detailed
  - Notes
- Uber
  Uber
  - Simple
  - Detailed
  - Notes
- Yelp
  Yelp
  - Simple
  - Detailed
  - Notes
Financial & Payments
Financial & Payments
- Crypto Exchange
  Crypto Exchange
  - Simple
  - Detailed
  - Notes
- Digital Wallet
  Digital Wallet
  - Simple
  - Detailed
  - Notes
- Fraud Detection
  Fraud Detection
  - Simple
  - Detailed
  - Notes
- Payment Gateway
  Payment Gateway
  - Simple
  - Detailed
  - Notes
- Splitwise
  Splitwise
  - Simple
  - Detailed
  - Notes
- Stock Exchange
  Stock Exchange
  - Simple
  - Detailed
  - Notes
- UPI
  UPI
  - Simple
  - Detailed
  - Notes
Infrastructure & Platform
Infrastructure & Platform
- Ab Testing
  Ab Testing
  - Simple
  - Detailed
  - Notes
- Ad Aggregation
  Ad Aggregation
  - Simple
  - Detailed
  - Notes
- API Gateway Service
  API Gateway Service
  - Simple
  - Detailed
  - Notes
- Background Jobs
  Background Jobs
  - Simple
  - Detailed
  - Notes
- CDN Service
  CDN Service
  - Simple
  - Detailed
  - Notes
- Configuration Service
  Configuration Service
  - Simple
  - Detailed
  - Notes
- Distributed Lock
  Distributed Lock
  - Simple
  - Detailed
  - Notes
- Distributed Logging
  Distributed Logging
  - Simple
  - Detailed
  - Notes
- Distributed Tracing
  Distributed Tracing
  - Simple
  - Detailed
  - Notes
- DNS System
  DNS System
  - Simple
  - Detailed
  - Notes
- Email SMS Delivery
  Email SMS Delivery
  - Simple
  - Detailed
  - Notes
- Feature Flags
  Feature Flags
  - Simple
  - Detailed
  - Notes
- Job Scheduler
  Job Scheduler
  - Simple
  - Detailed
  - Notes
- Message Queue
  Message Queue
  - Simple
  - Detailed
  - Notes
- Metrics Monitoring
  Metrics Monitoring
  - Simple
  - Detailed
  - Notes
- Realtime Analytics
  Realtime Analytics
  - Simple
  - Detailed
  - Notes
- Recommendation System
  Recommendation System
  - Simple
  - Detailed
  - Notes
- Search Engine
  Search Engine
  - Simple
  - Detailed
  - Notes
- Service Discovery
  Service Discovery
  - Simple
  - Detailed
  - Notes
- Webhooks
  Webhooks
  - Simple
  - Detailed
  - Notes
Real-time Collaboration
Real-time Collaboration
- Collaborative Editor
  Collaborative Editor
  - Simple
  - Detailed
  - Notes
- Figma
  Figma
  - Simple
  - Detailed
  - Notes
- Google Docs
  Google Docs
  - Simple
  - Detailed
  - Notes
- Notion
  Notion
  - Simple
  - Detailed
  - Notes
- Online Whiteboard
  Online Whiteboard
  - Simple
  - Detailed
  - Notes
Specialized / Niche
Specialized / Niche
- Calendar Reminder
  Calendar Reminder
  - Simple
  - Detailed
  - Notes
- Code Execution
  Code Execution
  - Simple
  - Detailed
  - Notes
- Content Moderation
  Content Moderation
  - Simple
  - Detailed
  - Notes
- Distributed Counter
  Distributed Counter
  - Simple
  - Detailed
  - Notes
- Health Check
  Health Check
  - Simple
  - Detailed
  - Notes
- Matchmaking
  Matchmaking
  - Simple
  - Detailed
  - Notes
- Multiplayer Game
  Multiplayer Game
  - Simple
  - Detailed
  - Notes
- OAuth SSO
  OAuth SSO
  - Simple
  - Detailed
  - Notes
- Quiz Platform
  Quiz Platform
  - Simple
  - Detailed
  - Notes
- Spam Detection
  Spam Detection
  - Simple
  - Detailed
  - Notes
- Trending Top-K
  Trending Top-K
  - Simple
  - Detailed
  - Notes
- Url Filter
  Url Filter
  - Simple
  - Detailed
  - Notes
- Voting System
  Voting System
  - Simple
  - Detailed
  - Notes
LLD-flavoured
LLD-flavoured
- ATM Machine
  ATM Machine
  - Simple
  - Detailed
  - Notes
- Chess Engine
  Chess Engine
  - Simple
  - Detailed
  - Notes
- Elevator System
  Elevator System
  - Simple
  - Detailed
  - Notes
- Hotel Management
  Hotel Management
  - Simple
  - Detailed
  - Notes
- Library Management
  Library Management
  - Simple
  - Detailed
  - Notes
- Logger Framework
  Logger Framework
  - Simple
  - Detailed
  - Notes
- Movie Booking LLD
  Movie Booking LLD
  - Simple
  - Detailed
  - Notes
- Parking Lot
  Parking Lot
  - Simple
  - Detailed
  - Notes
- Snake Ladders
  Snake Ladders
  - Simple
  - Detailed
  - Notes
- Vending Machine
  Vending Machine
  - Simple
  - Detailed
  - Notes

Web Crawler — Notes#

Functional#

Start from seeds, fetch HTML, extract links, recurse.
Respect robots.txt, sitemaps, crawl-delay.
Re-crawl with freshness policy (popular = faster).
Deduplicate URLs and content.

Non-functional#

1B+ pages crawled.
1k+ fetchers in parallel.
Politeness: ≤ 1 connection / host by default.
Resumable on failure.

Capacity (10B pages, 1 month)#

10B pages / 30 days = ~4,000 pages/s avg.
Avg page 500 KB → 2 GB/s = 16 Gbps inbound.
Storage: 10B × 500 KB = 5 PB raw; 1 PB compressed (gzip ~5×).
URL frontier: 100B URLs × 50 B → 5 TB → Bloom filter 100 GB at 1% FPR.

Data#

URL store: (url, host, depth, last_fetched, fetch_state, http_code, content_hash).
Page store: WARC files on S3 (immutable, append-only).

Trade-offs#

BFS = better coverage, DFS = bias to one site.
Priority crawl by PageRank/freshness for limited budget.
Politeness vs throughput: per-host queue trims throughput on big hosts but is the law.
Headless rendering essential for SPA sites but 10–100× cost; do selectively.

Refs#

Mercator (1999), UbiCrawler, Heritrix (Internet Archive), Common Crawl, "Designing Data-Intensive Applications" ch.10, ByteByteGo web crawler.