Dự án tardigrade bảo vệ vms của bạn chống lại lỗi máy chủ

Mục lục:

Video: Thiếu Niên 3Q | Quay 100 Lần Kim Tướng Mã Siêu & Cái Kết Nhân Phẩm Của Tôi 2024

Video: Thiếu Niên 3Q | Quay 100 Lần Kim Tướng Mã Siêu & Cái Kết Nhân Phẩm Của Tôi 2024
Anonim

Sau nhiều thay đổi Azure và cải tiến bảo mật trong vài tháng qua, Microsoft sẽ giới thiệu Project Tardigrade như là nỗ lực mới nhất của họ trong việc làm cho Azure trở nên đáng tin cậy hơn.

Dự án Tardigrade ngăn ngừa sự cố nền tảng

Project Tardigrade là một dịch vụ mới nhằm cải thiện khả năng phục hồi của Azure. Nó bao gồm các chiến lược giảm thiểu để bảo vệ máy ảo Azure trước các lỗi nền tảng.

Dưới đây là cách Mark Russinovich, Giám đốc Công nghệ tại Microsoft Azure, đang mô tả công việc hiện tại trên Azure:

Mục tiêu của chúng tôi là trao quyền cho các tổ chức để chạy khối lượng công việc của họ một cách đáng tin cậy trên Azure. Với nguyên tắc này, chúng tôi liên tục đầu tư phát triển nền tảng Azure để trở nên có khả năng phục hồi lỗi, không chỉ để tăng năng suất kinh doanh mà còn cung cấp trải nghiệm khách hàng liền mạch.

Để ngăn tác động đến khối lượng công việc của bạn, dịch vụ cho phép các thành phần tự phục hồi và nhanh chóng phục hồi sau các lỗi tiềm ẩn, ngay cả trong các lỗi máy chủ quan trọng.

Project Tardigrade hoạt động như thế nào?

Dưới đây là một ví dụ về cách hoạt động của quy trình phục hồi Tardigrade:

  • Giai đoạn 1: Bước này không có tác động đến việc chạy VM khách hàng. Nó chỉ đơn giản là tái chế tất cả các dịch vụ chạy trên máy chủ. Trong trường hợp hiếm hoi mà dịch vụ bị lỗi không khởi động lại thành công, chúng tôi tiến hành Giai đoạn 2.
  • Giai đoạn 2: Dịch vụ chẩn đoán của chúng tôi chạy trên máy chủ để thu thập tất cả các nhật ký / bãi chứa có liên quan một cách có hệ thống, để đảm bảo rằng chúng tôi có thể chẩn đoán triệt để lý do thất bại trong Giai đoạn 1. Phân tích toàn diện này cho phép chúng tôi 'xử lý tận gốc' vấn đề và từ đó ngăn chặn sự tái diễn trong tương lai.
  • Giai đoạn 3: Ở mức cao, chúng tôi đặt lại HĐH về trạng thái khỏe mạnh với tác động tối thiểu của khách hàng để giảm thiểu vấn đề máy chủ. Trong giai đoạn này, chúng tôi bảo vệ các trạng thái của từng VM thành RAM, sau đó chúng tôi bắt đầu thiết lập lại hệ điều hành về trạng thái khỏe mạnh. Trong khi HĐH nhanh chóng đặt lại bên dưới, các ứng dụng đang chạy trên tất cả các máy ảo được lưu trữ trên máy chủ sẽ nhanh chóng 'đóng băng' vì CPU tạm thời bị treo. Trải nghiệm này tương tự như kết nối mạng tạm thời bị mất nhưng nhanh chóng được phục hồi do logic thử lại. Sau khi HĐH được thiết lập lại thành công, VM sử dụng trạng thái được lưu trữ của chúng và tiếp tục hoạt động bình thường, do đó tránh được mọi khởi động lại VM tiềm năng.

Với suy nghĩ này, Project Tardigrade sẽ đảm bảo rằng sự thất bại của bất kỳ thành phần nào trong máy chủ không ảnh hưởng đến toàn bộ hệ thống. Như vậy, máy ảo của khách hàng sẽ không bị ảnh hưởng bởi lỗi máy chủ.

Microsoft đang nỗ lực cải thiện và mở rộng các kịch bản lỗi máy chủ khác nhau để đảm bảo rằng nền tảng điện toán đám mây của họ đáng tin cậy hơn bao giờ hết.

Mong đợi những phát triển mới và triển khai độ tin cậy khác trong tương lai gần.

Dự án tardigrade bảo vệ vms của bạn chống lại lỗi máy chủ