Skip to content

System Design Diagrams

Notes

singhkshitij/awesome-system-design-diagrams

System Design Diagrams

singhkshitij/awesome-system-design-diagrams

Home
HLD Fundamentals
HLD Fundamentals
- API Gateway
  API Gateway
  - Simple
  - Detailed
  - Notes
- API Versioning Evolution
  API Versioning Evolution
  - Simple
  - Detailed
  - Notes
- Batch Stream Processing
  Batch Stream Processing
  - Simple
  - Detailed
  - Notes
- Caching Strategies
  Caching Strategies
  - Simple
  - Detailed
  - Notes
- CAP PACELC
  CAP PACELC
  - Simple
  - Detailed
  - Notes
- Capacity Planning
  Capacity Planning
  - Simple
  - Detailed
  - Notes
- CDN
  CDN
  - Simple
  - Detailed
  - Notes
- Change Data Capture
  Change Data Capture
  - Simple
  - Detailed
  - Notes
- Consensus Raft Paxos
  Consensus Raft Paxos
  - Simple
  - Detailed
  - Notes
- Consistent Hashing
  Consistent Hashing
  - Simple
  - Detailed
  - Notes
- CRDTs
  CRDTs
  - Simple
  - Detailed
  - Notes
- Database Sharding
  Database Sharding
  - Simple
  - Detailed
  - Notes
- Distributed Transactions
  Distributed Transactions
  - Simple
  - Detailed
  - Notes
- Event Sourcing Cqrs
  Event Sourcing Cqrs
  - Simple
  - Detailed
  - Notes
- Geo Indexing
  Geo Indexing
  - Simple
  - Detailed
  - Notes
- Http Protocols
  Http Protocols
  - Simple
  - Detailed
  - Notes
- Idempotency Retries
  Idempotency Retries
  - Simple
  - Detailed
  - Notes
- Load Balancer
  Load Balancer
  - Simple
  - Detailed
  - Notes
- Logical Clocks
  Logical Clocks
  - Simple
  - Detailed
  - Notes
- Multi Region Dr
  Multi Region Dr
  - Simple
  - Detailed
  - Notes
- MVCC Isolation Levels
  MVCC Isolation Levels
  - Simple
  - Detailed
  - Notes
- Observability
  Observability
  - Simple
  - Detailed
  - Notes
- Probabilistic Data Structures
  Probabilistic Data Structures
  - Simple
  - Detailed
  - Notes
- Pub Sub Pattern
  Pub Sub Pattern
  - Simple
  - Detailed
  - Notes
- Realtime Protocols
  Realtime Protocols
  - Simple
  - Detailed
  - Notes
- Replication Leader Follower
  Replication Leader Follower
  - Simple
  - Detailed
  - Notes
- Resilience Patterns
  Resilience Patterns
  - Simple
  - Detailed
  - Notes
- Search Internals
  Search Internals
  - Simple
  - Detailed
  - Notes Notes
    Table of contents
    
    Lucene segment lifecycle
    
    Tokenisation pitfalls
    
    Embedding model choice (2024+)
    
    Latency budget (typical search)
    
    When you don't need a search engine
    
    Refs
- Service Mesh
  Service Mesh
  - Simple
  - Detailed
  - Notes
- Storage Engines LSM B-Tree
  Storage Engines LSM B-Tree
  - Simple
  - Detailed
  - Notes
LLD Concepts
LLD Concepts
- Async Models
  Async Models
  - Simple
  - Detailed
  - Notes
- Behavioral Patterns
  Behavioral Patterns
  - Simple
  - Detailed
  - Notes
- Clean Architecture
  Clean Architecture
  - Simple
  - Detailed
  - Notes
- Composition Over Inheritance
  Composition Over Inheritance
  - Simple
  - Detailed
  - Notes
- Concurrency Primitives
  Concurrency Primitives
  - Simple
  - Detailed
  - Notes
- Creational Patterns
  Creational Patterns
  - Simple
  - Detailed
  - Notes
- Data Structures Complexity
  Data Structures Complexity
  - Simple
  - Detailed
  - Notes
- Ddd Tactical
  Ddd Tactical
  - Simple
  - Detailed
  - Notes
- Dependency Injection
  Dependency Injection
  - Simple
  - Detailed
  - Notes
- Error Handling
  Error Handling
  - Simple
  - Detailed
  - Notes
- Immutability
  Immutability
  - Simple
  - Detailed
  - Notes
- Oop Pillars
  Oop Pillars
  - Simple
  - Detailed
  - Notes
- Repository Pattern
  Repository Pattern
  - Simple
  - Detailed
  - Notes
- Rest API Design
  Rest API Design
  - Simple
  - Detailed
  - Notes
- Solid Principles
  Solid Principles
  - Simple
  - Detailed
  - Notes
- State Machines
  State Machines
  - Simple
  - Detailed
  - Notes
- Structural Patterns
  Structural Patterns
  - Simple
  - Detailed
  - Notes
- Testing Strategy
  Testing Strategy
  - Simple
  - Detailed
  - Notes
- Threading And Deadlocks
  Threading And Deadlocks
  - Simple
  - Detailed
  - Notes
Classics
Classics
- Distributed Cache
  Distributed Cache
  - Simple
  - Detailed
  - Notes
- Key Value Store
  Key Value Store
  - Simple
  - Detailed
  - Notes
- News Feed
  News Feed
  - Simple
  - Detailed
  - Notes
- Notification System
  Notification System
  - Simple
  - Detailed
  - Notes
- Pastebin
  Pastebin
  - Simple
  - Detailed
  - Notes
- Rate Limiter
  Rate Limiter
  - Simple
  - Detailed
  - Notes
- Search Autocomplete
  Search Autocomplete
  - Simple
  - Detailed
  - Notes
- Unique Id Generator
  Unique Id Generator
  - Simple
  - Detailed
  - Notes
- Url Shortener
  Url Shortener
  - Simple
  - Detailed
  - Notes
- Web Crawler
  Web Crawler
  - Simple
  - Detailed
  - Notes
Social & Communication
Social & Communication
- Email Service
  Email Service
  - Simple
  - Detailed
  - Notes
- Facebook News Feed
  Facebook News Feed
  - Simple
  - Detailed
  - Notes
- Instagram
  Instagram
  - Simple
  - Detailed
  - Notes
- LinkedIn
  LinkedIn
  - Simple
  - Detailed
  - Notes
- Pinterest
  Pinterest
  - Simple
  - Detailed
  - Notes
- Reddit Q&A
  Reddit Q&A
  - Simple
  - Detailed
  - Notes
- Slack
  Slack
  - Simple
  - Detailed
  - Notes
- TikTok
  TikTok
  - Simple
  - Detailed
  - Notes
- Twitter
  Twitter
  - Simple
  - Detailed
  - Notes
- WhatsApp
  WhatsApp
  - Simple
  - Detailed
  - Notes
Media & Streaming
Media & Streaming
- Netflix
  Netflix
  - Simple
  - Detailed
  - Notes
- Reels Shorts
  Reels Shorts
  - Simple
  - Detailed
  - Notes
- Spotify
  Spotify
  - Simple
  - Detailed
  - Notes
- Twitch
  Twitch
  - Simple
  - Detailed
  - Notes
- YouTube
  YouTube
  - Simple
  - Detailed
  - Notes
- Zoom
  Zoom
  - Simple
  - Detailed
  - Notes
Storage & File
Storage & File
- Distributed File System
  Distributed File System
  - Simple
  - Detailed
  - Notes
- Document Database
  Document Database
  - Simple
  - Detailed
  - Notes
- Google Drive
  Google Drive
  - Simple
  - Detailed
  - Notes
- Google Photos
  Google Photos
  - Simple
  - Detailed
  - Notes
- Object Storage
  Object Storage
  - Simple
  - Detailed
  - Notes
- Time Series Database
  Time Series Database
  - Simple
  - Detailed
  - Notes
E-commerce & Marketplaces
E-commerce & Marketplaces
- Airbnb
  Airbnb
  - Simple
  - Detailed
  - Notes
- Amazon
  Amazon
  - Simple
  - Detailed
  - Notes
- eBay Auction
  eBay Auction
  - Simple
  - Detailed
  - Notes
- Flipkart
  Flipkart
  - Simple
  - Detailed
  - Notes
- Food Delivery
  Food Delivery
  - Simple
  - Detailed
  - Notes
- OLX Classifieds
  OLX Classifieds
  - Simple
  - Detailed
  - Notes
- Ticketmaster
  Ticketmaster
  - Simple
  - Detailed
  - Notes
Location & Maps
Location & Maps
- Find My Friends
  Find My Friends
  - Simple
  - Detailed
  - Notes
- Geofencing
  Geofencing
  - Simple
  - Detailed
  - Notes
- Google Maps
  Google Maps
  - Simple
  - Detailed
  - Notes
- Proximity Service
  Proximity Service
  - Simple
  - Detailed
  - Notes
- Uber
  Uber
  - Simple
  - Detailed
  - Notes
- Yelp
  Yelp
  - Simple
  - Detailed
  - Notes
Financial & Payments
Financial & Payments
- Crypto Exchange
  Crypto Exchange
  - Simple
  - Detailed
  - Notes
- Digital Wallet
  Digital Wallet
  - Simple
  - Detailed
  - Notes
- Fraud Detection
  Fraud Detection
  - Simple
  - Detailed
  - Notes
- Payment Gateway
  Payment Gateway
  - Simple
  - Detailed
  - Notes
- Splitwise
  Splitwise
  - Simple
  - Detailed
  - Notes
- Stock Exchange
  Stock Exchange
  - Simple
  - Detailed
  - Notes
- UPI
  UPI
  - Simple
  - Detailed
  - Notes
Infrastructure & Platform
Infrastructure & Platform
- Ab Testing
  Ab Testing
  - Simple
  - Detailed
  - Notes
- Ad Aggregation
  Ad Aggregation
  - Simple
  - Detailed
  - Notes
- API Gateway Service
  API Gateway Service
  - Simple
  - Detailed
  - Notes
- Background Jobs
  Background Jobs
  - Simple
  - Detailed
  - Notes
- CDN Service
  CDN Service
  - Simple
  - Detailed
  - Notes
- Configuration Service
  Configuration Service
  - Simple
  - Detailed
  - Notes
- Distributed Lock
  Distributed Lock
  - Simple
  - Detailed
  - Notes
- Distributed Logging
  Distributed Logging
  - Simple
  - Detailed
  - Notes
- Distributed Tracing
  Distributed Tracing
  - Simple
  - Detailed
  - Notes
- DNS System
  DNS System
  - Simple
  - Detailed
  - Notes
- Email SMS Delivery
  Email SMS Delivery
  - Simple
  - Detailed
  - Notes
- Feature Flags
  Feature Flags
  - Simple
  - Detailed
  - Notes
- Job Scheduler
  Job Scheduler
  - Simple
  - Detailed
  - Notes
- Message Queue
  Message Queue
  - Simple
  - Detailed
  - Notes
- Metrics Monitoring
  Metrics Monitoring
  - Simple
  - Detailed
  - Notes
- Realtime Analytics
  Realtime Analytics
  - Simple
  - Detailed
  - Notes
- Recommendation System
  Recommendation System
  - Simple
  - Detailed
  - Notes
- Search Engine
  Search Engine
  - Simple
  - Detailed
  - Notes
- Service Discovery
  Service Discovery
  - Simple
  - Detailed
  - Notes
- Webhooks
  Webhooks
  - Simple
  - Detailed
  - Notes
Real-time Collaboration
Real-time Collaboration
- Collaborative Editor
  Collaborative Editor
  - Simple
  - Detailed
  - Notes
- Figma
  Figma
  - Simple
  - Detailed
  - Notes
- Google Docs
  Google Docs
  - Simple
  - Detailed
  - Notes
- Notion
  Notion
  - Simple
  - Detailed
  - Notes
- Online Whiteboard
  Online Whiteboard
  - Simple
  - Detailed
  - Notes
Specialized / Niche
Specialized / Niche
- Calendar Reminder
  Calendar Reminder
  - Simple
  - Detailed
  - Notes
- Code Execution
  Code Execution
  - Simple
  - Detailed
  - Notes
- Content Moderation
  Content Moderation
  - Simple
  - Detailed
  - Notes
- Distributed Counter
  Distributed Counter
  - Simple
  - Detailed
  - Notes
- Health Check
  Health Check
  - Simple
  - Detailed
  - Notes
- Matchmaking
  Matchmaking
  - Simple
  - Detailed
  - Notes
- Multiplayer Game
  Multiplayer Game
  - Simple
  - Detailed
  - Notes
- OAuth SSO
  OAuth SSO
  - Simple
  - Detailed
  - Notes
- Quiz Platform
  Quiz Platform
  - Simple
  - Detailed
  - Notes
- Spam Detection
  Spam Detection
  - Simple
  - Detailed
  - Notes
- Trending Top-K
  Trending Top-K
  - Simple
  - Detailed
  - Notes
- Url Filter
  Url Filter
  - Simple
  - Detailed
  - Notes
- Voting System
  Voting System
  - Simple
  - Detailed
  - Notes
LLD-flavoured
LLD-flavoured
- ATM Machine
  ATM Machine
  - Simple
  - Detailed
  - Notes
- Chess Engine
  Chess Engine
  - Simple
  - Detailed
  - Notes
- Elevator System
  Elevator System
  - Simple
  - Detailed
  - Notes
- Hotel Management
  Hotel Management
  - Simple
  - Detailed
  - Notes
- Library Management
  Library Management
  - Simple
  - Detailed
  - Notes
- Logger Framework
  Logger Framework
  - Simple
  - Detailed
  - Notes
- Movie Booking LLD
  Movie Booking LLD
  - Simple
  - Detailed
  - Notes
- Parking Lot
  Parking Lot
  - Simple
  - Detailed
  - Notes
- Snake Ladders
  Snake Ladders
  - Simple
  - Detailed
  - Notes
- Vending Machine
  Vending Machine
  - Simple
  - Detailed
  - Notes

Search Internals — Notes#

Lucene segment lifecycle#

In-memory buffer → flush → immutable segment.
Many small segments → merge into fewer larger ones.
Deletes are tombstones; freed at merge.

Tokenisation pitfalls#

CJK languages need n-gram or ICU analysers, not whitespace.
URLs / code / log lines need keyword analysers (no stemming).
Synonyms expanded at index time (precise) or query time (flexible) — both have trade-offs.

Embedding model choice (2024+)#

General text: OpenAI text-embedding-3, Cohere embed-multilingual, BGE.
Code: voyage-code-2.
Images / video: CLIP, OpenCLIP.
Pick a dim that fits memory: 512-d × 1B vectors × 4 bytes = 2 TB.

Latency budget (typical search)#

p99 budget: 100-300 ms.
Allocate: parse 5 ms, candidate fan-out 30 ms, score 30 ms, hydrate 20 ms, ranker 50 ms.

When you don't need a search engine#

Single table, < 100k rows — Postgres full-text (tsvector) is fine.
Strict exact-match: indexed columns + B-tree.

Refs#

"Lucene in Action" (still relevant).
Elasticsearch internals docs.
"Pretrained Transformers as Universal Computation Engines" (modern embeddings).
Faiss / HNSWlib / ScaNN repos.
"BM25 explained" — Trey Grainger talk.