spinny:~/writing $ cat scale-web-applications.md

Cách mở rộng quy mô ứng dụng web: Chiến lược và mô hình

2024-06-11 · 8 min read · Filippo Spinella · Công nghệ, Lập trình, Kiến trúc phần mềm, Khả năng mở rộng

Khi một ứng dụng web phát triển về người dùng, dữ liệu và tính năng, khả năng mở rộng trở thành ưu tiên hàng đầu. Trong bài viết này, chúng ta phân tích các chiến lược và mô hình chính để mở rộng quy mô ứng dụng web, với các ví dụ thực tế và sơ đồ để làm rõ các khái niệm chính.

Mở rộng dọc vs mở rộng ngang

Sự phân biệt cơ bản đầu tiên liên quan đến cách tăng tài nguyên:

Mở rộng dọc (Scale Up): tăng tài nguyên (CPU, RAM, lưu trữ) của một máy chủ duy nhất.

Mở rộng ngang (Scale Out): thêm nhiều máy chủ/node hoạt động cùng nhau.

Dọc: đơn giản để triển khai, nhưng có giới hạn vật lý và nguy cơ điểm lỗi đơn.
Ngang: có khả năng phục hồi và mở rộng tốt hơn, nhưng yêu cầu quản lý đồng bộ hóa và phân phối tải.

Bộ nhớ đệm: Tăng tốc phản hồi

Bộ nhớ đệm là một trong những kỹ thuật hiệu quả nhất để cải thiện hiệu suất và giảm tải máy chủ.

Bộ nhớ đệm phía máy khách: trình duyệt, service worker.
Bộ nhớ đệm phía máy chủ: Redis, Memcached.
CDN (Content Delivery Network): phân phối nội dung tĩnh trên các máy chủ toàn cầu.

Ưu điểm:

Giảm độ trễ cảm nhận bởi người dùng.
Giảm tải cho máy chủ và cơ sở dữ liệu.

Cân bằng tải: Phân phối lưu lượng

Bộ cân bằng tải phân phối yêu cầu giữa nhiều máy chủ, ngăn không cho bất kỳ máy chủ nào bị quá tải.

Thuật toán: Round Robin, Least Connections, IP Hash.
Công cụ: NGINX, HAProxy, AWS ELB.

Ưu điểm:

Tính sẵn sàng cao.
Chuyển đổi dự phòng tự động.

Mở rộng cơ sở dữ liệu: Sao chép và Sharding

Khi cơ sở dữ liệu trở thành nút thắt cổ chai, có thể áp dụng một số chiến lược:

Sao chép: bản sao chỉ đọc để phân phối tải truy vấn.
Sharding: chia dữ liệu trên nhiều cơ sở dữ liệu dựa trên một khóa (ví dụ: theo vùng hoặc người dùng).
Cơ sở dữ liệu NoSQL: được thiết kế để mở rộng ngang (MongoDB, Cassandra, DynamoDB).

Ưu điểm:

Thông lượng cao hơn.
Thời gian phản hồi giảm.

Microservices và kiến trúc phân tán

Chia ứng dụng thành microservices cho phép bạn chỉ mở rộng những phần cần thiết.

Mỗi microservice có thể được triển khai và mở rộng độc lập.
Giao tiếp qua REST API, gRPC hoặc message broker (RabbitMQ, Kafka).

Ưu điểm:

Khả năng mở rộng chi tiết.
Khả năng phục hồi cao hơn.

Bất đồng bộ và hàng đợi công việc

Đối với các thao tác nặng hoặc không quan trọng (ví dụ: gửi email, xử lý hình ảnh), việc ủy thác công việc cho hàng đợi do các worker riêng biệt quản lý là hữu ích.

Cải thiện khả năng phản hồi của ứng dụng.
Xử lý đỉnh lưu lượng.

Giám sát và Auto-Scaling

Giám sát hiệu suất liên tục là điều cần thiết để mở rộng hiệu quả.

Số liệu: CPU, RAM, độ trễ, lỗi.
Auto-scaling: tự động thêm/bớt tài nguyên dựa trên tải (ví dụ: Kubernetes, dịch vụ đám mây).

Các mô hình khả năng mở rộng phổ biến

Strangler Fig Pattern: di chuyển dần từ monolith sang microservices.
CQRS (Command Query Responsibility Segregation): tách biệt đọc và ghi để tối ưu hóa hiệu suất.
Event Sourcing: trạng thái ứng dụng được quản lý thông qua sự kiện.

Các mô hình khả năng mở rộng nâng cao

Ngoài các mô hình cổ điển, có những chiến lược nâng cao cơ bản trong kiến trúc phân tán:

Circuit Breaker: ngăn chặn lỗi lan tầng giữa các dịch vụ. Nếu một dịch vụ hạ nguồn liên tục lỗi, Circuit Breaker "mở mạch" và tạm thời chặn yêu cầu, cho phép phục hồi.
Bulkhead: cô lập tài nguyên giữa các thành phần, để quá tải ở một phần không ảnh hưởng đến toàn hệ thống.
Retry và Backoff: tự động thử lại các yêu cầu thất bại, với khoảng thời gian tăng dần (hàm mũ) để tránh quá tải dịch vụ.
Rate Limiting: giới hạn số lượng yêu cầu được chấp nhận trong một khoảng thời gian, bảo vệ khỏi lạm dụng và đỉnh đột ngột.

Công nghệ thực tế

Netflix: sử dụng microservices, auto-scaling trên AWS, Circuit Breaker (Hystrix), bộ nhớ đệm phân tán (EVCache), CDN riêng.
Amazon: sharding cơ sở dữ liệu quy mô lớn, cân bằng tải đa tầng, hàng đợi bất đồng bộ (SQS), giám sát nâng cao.
Công ty SaaS: thường áp dụng Kubernetes cho điều phối, Redis/Memcached cho bộ nhớ đệm, Prometheus/Grafana cho giám sát.

Lỗi thường gặp và phương pháp tốt nhất

Lỗi thường gặp:

Chỉ dựa vào mở rộng dọc.
Không giám sát các số liệu chính (CPU, RAM, độ trễ, lỗi).
Không kiểm tra khả năng mở rộng dưới tải thực.
Bỏ qua khả năng phục hồi (thiếu retry, circuit breaker, bulkhead).

Phương pháp tốt nhất:

Tự động hóa triển khai và mở rộng (CI/CD, auto-scaling).
Cô lập các dịch vụ quan trọng.
Triển khai logging, tracing và alerting.
Thường xuyên kiểm tra với tải mô phỏng (stress test, chaos engineering).

Công cụ và công nghệ chuyên sâu

Bộ nhớ đệm: Redis (persistence, pub/sub, clustering), Memcached (đơn giản, tốc độ).
Cân bằng tải: NGINX (reverse proxy, SSL termination), HAProxy (hiệu suất cao), đám mây (AWS ELB, GCP LB).
Cơ sở dữ liệu:
- Quan hệ (PostgreSQL, MySQL) với sao chép và sharding.
- NoSQL (MongoDB, Cassandra) cho khả năng mở rộng ngang.
- NewSQL (CockroachDB, Google Spanner) cho tính nhất quán và khả năng mở rộng.

Auto-Scaling: Phản ứng vs Dự đoán

Phản ứng: thêm/bớt tài nguyên dựa trên số liệu thời gian thực (CPU, RAM, lưu lượng).
Dự đoán: sử dụng các mô hình thống kê hoặc machine learning để dự đoán đỉnh lưu lượng (ví dụ: sự kiện đã lên lịch, tính mùa vụ).
Ví dụ: Kubernetes Horizontal Pod Autoscaler (HPA), AWS Auto Scaling Policies.

Giám sát, Logging và Tracing

Giám sát: thu thập số liệu (Prometheus, Datadog, CloudWatch).
Logging: thu thập và phân tích log (ELK Stack, Loki, Splunk).
Tracing: theo dõi yêu cầu xuyên dịch vụ (Jaeger, Zipkin, OpenTelemetry).

DevOps và CI/CD cho khả năng mở rộng

Pipeline CI/CD: tự động hóa build, test, deploy và mở rộng.
Kiểm tra tải: tích hợp trong pipeline để xác nhận khả năng mở rộng trước khi triển khai.
Blue/Green và Canary Deploy: phát hành dần dần để giảm rủi ro.

Luồng yêu cầu hoàn chỉnh trong kiến trúc có khả năng mở rộng

Kết luận

Mở rộng quy mô ứng dụng web đòi hỏi tầm nhìn toàn diện: kiến trúc, công cụ, tự động hóa, giám sát và văn hóa DevOps. Nghiên cứu các mô hình nâng cao, áp dụng phương pháp tốt nhất và học hỏi từ sai lầm của các công ty lớn là chìa khóa để xây dựng hệ thống có khả năng phục hồi và sẵn sàng phát triển.

spinny:~/writing $ cat scale-web-applications.md

Cách mở rộng quy mô ứng dụng web: Chiến lược và mô hình

2024-06-11 · 8 min read · Filippo Spinella · Công nghệ, Lập trình, Kiến trúc phần mềm, Khả năng mở rộng

Mở rộng dọc vs mở rộng ngang

Sự phân biệt cơ bản đầu tiên liên quan đến cách tăng tài nguyên:

Mở rộng dọc (Scale Up): tăng tài nguyên (CPU, RAM, lưu trữ) của một máy chủ duy nhất.

Mở rộng ngang (Scale Out): thêm nhiều máy chủ/node hoạt động cùng nhau.

Dọc: đơn giản để triển khai, nhưng có giới hạn vật lý và nguy cơ điểm lỗi đơn.
Ngang: có khả năng phục hồi và mở rộng tốt hơn, nhưng yêu cầu quản lý đồng bộ hóa và phân phối tải.

Bộ nhớ đệm: Tăng tốc phản hồi

Bộ nhớ đệm là một trong những kỹ thuật hiệu quả nhất để cải thiện hiệu suất và giảm tải máy chủ.

Bộ nhớ đệm phía máy khách: trình duyệt, service worker.
Bộ nhớ đệm phía máy chủ: Redis, Memcached.
CDN (Content Delivery Network): phân phối nội dung tĩnh trên các máy chủ toàn cầu.

Ưu điểm:

Giảm độ trễ cảm nhận bởi người dùng.
Giảm tải cho máy chủ và cơ sở dữ liệu.

Cân bằng tải: Phân phối lưu lượng

Bộ cân bằng tải phân phối yêu cầu giữa nhiều máy chủ, ngăn không cho bất kỳ máy chủ nào bị quá tải.

Thuật toán: Round Robin, Least Connections, IP Hash.
Công cụ: NGINX, HAProxy, AWS ELB.

Ưu điểm:

Tính sẵn sàng cao.
Chuyển đổi dự phòng tự động.

Mở rộng cơ sở dữ liệu: Sao chép và Sharding

Khi cơ sở dữ liệu trở thành nút thắt cổ chai, có thể áp dụng một số chiến lược:

Sao chép: bản sao chỉ đọc để phân phối tải truy vấn.
Sharding: chia dữ liệu trên nhiều cơ sở dữ liệu dựa trên một khóa (ví dụ: theo vùng hoặc người dùng).
Cơ sở dữ liệu NoSQL: được thiết kế để mở rộng ngang (MongoDB, Cassandra, DynamoDB).

Ưu điểm:

Thông lượng cao hơn.
Thời gian phản hồi giảm.

Microservices và kiến trúc phân tán

Chia ứng dụng thành microservices cho phép bạn chỉ mở rộng những phần cần thiết.

Mỗi microservice có thể được triển khai và mở rộng độc lập.
Giao tiếp qua REST API, gRPC hoặc message broker (RabbitMQ, Kafka).

Ưu điểm:

Khả năng mở rộng chi tiết.
Khả năng phục hồi cao hơn.

Bất đồng bộ và hàng đợi công việc

Cải thiện khả năng phản hồi của ứng dụng.
Xử lý đỉnh lưu lượng.

Giám sát và Auto-Scaling

Giám sát hiệu suất liên tục là điều cần thiết để mở rộng hiệu quả.

Số liệu: CPU, RAM, độ trễ, lỗi.
Auto-scaling: tự động thêm/bớt tài nguyên dựa trên tải (ví dụ: Kubernetes, dịch vụ đám mây).

Các mô hình khả năng mở rộng phổ biến

Strangler Fig Pattern: di chuyển dần từ monolith sang microservices.
CQRS (Command Query Responsibility Segregation): tách biệt đọc và ghi để tối ưu hóa hiệu suất.
Event Sourcing: trạng thái ứng dụng được quản lý thông qua sự kiện.

Các mô hình khả năng mở rộng nâng cao

Ngoài các mô hình cổ điển, có những chiến lược nâng cao cơ bản trong kiến trúc phân tán:

Circuit Breaker: ngăn chặn lỗi lan tầng giữa các dịch vụ. Nếu một dịch vụ hạ nguồn liên tục lỗi, Circuit Breaker "mở mạch" và tạm thời chặn yêu cầu, cho phép phục hồi.
Bulkhead: cô lập tài nguyên giữa các thành phần, để quá tải ở một phần không ảnh hưởng đến toàn hệ thống.
Retry và Backoff: tự động thử lại các yêu cầu thất bại, với khoảng thời gian tăng dần (hàm mũ) để tránh quá tải dịch vụ.
Rate Limiting: giới hạn số lượng yêu cầu được chấp nhận trong một khoảng thời gian, bảo vệ khỏi lạm dụng và đỉnh đột ngột.

Công nghệ thực tế

Netflix: sử dụng microservices, auto-scaling trên AWS, Circuit Breaker (Hystrix), bộ nhớ đệm phân tán (EVCache), CDN riêng.
Amazon: sharding cơ sở dữ liệu quy mô lớn, cân bằng tải đa tầng, hàng đợi bất đồng bộ (SQS), giám sát nâng cao.
Công ty SaaS: thường áp dụng Kubernetes cho điều phối, Redis/Memcached cho bộ nhớ đệm, Prometheus/Grafana cho giám sát.

Lỗi thường gặp và phương pháp tốt nhất

Lỗi thường gặp:

Chỉ dựa vào mở rộng dọc.
Không giám sát các số liệu chính (CPU, RAM, độ trễ, lỗi).
Không kiểm tra khả năng mở rộng dưới tải thực.
Bỏ qua khả năng phục hồi (thiếu retry, circuit breaker, bulkhead).

Phương pháp tốt nhất:

Tự động hóa triển khai và mở rộng (CI/CD, auto-scaling).
Cô lập các dịch vụ quan trọng.
Triển khai logging, tracing và alerting.
Thường xuyên kiểm tra với tải mô phỏng (stress test, chaos engineering).

Công cụ và công nghệ chuyên sâu

Bộ nhớ đệm: Redis (persistence, pub/sub, clustering), Memcached (đơn giản, tốc độ).
Cân bằng tải: NGINX (reverse proxy, SSL termination), HAProxy (hiệu suất cao), đám mây (AWS ELB, GCP LB).
Cơ sở dữ liệu:
- Quan hệ (PostgreSQL, MySQL) với sao chép và sharding.
- NoSQL (MongoDB, Cassandra) cho khả năng mở rộng ngang.
- NewSQL (CockroachDB, Google Spanner) cho tính nhất quán và khả năng mở rộng.

Auto-Scaling: Phản ứng vs Dự đoán

Phản ứng: thêm/bớt tài nguyên dựa trên số liệu thời gian thực (CPU, RAM, lưu lượng).
Dự đoán: sử dụng các mô hình thống kê hoặc machine learning để dự đoán đỉnh lưu lượng (ví dụ: sự kiện đã lên lịch, tính mùa vụ).
Ví dụ: Kubernetes Horizontal Pod Autoscaler (HPA), AWS Auto Scaling Policies.

Giám sát, Logging và Tracing

Giám sát: thu thập số liệu (Prometheus, Datadog, CloudWatch).
Logging: thu thập và phân tích log (ELK Stack, Loki, Splunk).
Tracing: theo dõi yêu cầu xuyên dịch vụ (Jaeger, Zipkin, OpenTelemetry).

DevOps và CI/CD cho khả năng mở rộng

Pipeline CI/CD: tự động hóa build, test, deploy và mở rộng.
Kiểm tra tải: tích hợp trong pipeline để xác nhận khả năng mở rộng trước khi triển khai.
Blue/Green và Canary Deploy: phát hành dần dần để giảm rủi ro.