Поделиться через


Общая ответственность за устойчивость

На общедоступной облачной платформе Azure устойчивость — это общая ответственность между корпорацией Майкрософт и вами. Так как в каждой рабочей нагрузке вы разрабатываете и развертываете разные уровни устойчивости, важно понимать, кто несет основную ответственность за каждый из этих уровней с точки зрения устойчивости.

Чтобы лучше понять, как работает общая ответственность, особенно при столкновении с сбоем или катастрофой, в этой статье описывается модель общей ответственности за устойчивость. Дополнительные сведения об использовании этой модели для планирования аварийного восстановления см . в рекомендациях по разработке стратегии аварийного восстановления.

Модель общей ответственности за устойчивость

Модель общей ответственности за устойчивость состоит из трех уровней:

  • Надежность основной платформы. Платформа Azure обеспечивает базовый уровень надежности для всех клиентов и всех служб через базовую инфраструктуру, службы и процессы.
  • Возможности, повышающие устойчивость Azure, предоставляют набор встроенных функций и служб, которые повышают устойчивость, такие как использование зон доступности, развертывание в нескольких регионах и реализация стратегий резервного копирования. Хотя Azure предоставляет эти возможности, вы несете ответственность за оценку и настройку этих возможностей в соответствии с конкретными требованиями. Требования могут включать надежность, стоимость, производительность и соответствие нормативным стандартам.
  • Приложения. Чтобы эффективно использовать другие уровни, приложение и рабочая нагрузка должны быть разработаны для обеспечения устойчивости.

Схема, показывающая модель общей ответственности за устойчивость: надежность основной платформы, повышение устойчивости возможностей и приложений.

Корпорация Майкрософт несет ответственность за надежность основной платформы. Корпорация Майкрософт также отвечает за обеспечение возможностей повышения устойчивости, которые можно использовать. Вы несете ответственность за выбор и использование соответствующих компонентов.

Выбор категорий служб SaaS, PaaS или IaaS определяет, какие решения вы принимаете. Например, если вы используете службу SaaS, обычно не нужно использовать зоны доступности. Если вы используете службы PaaS для уровня данных, возможно, у вас есть автоматизированные возможности для резервного копирования. Если вы используете службы IaaS, вам обычно нужно спланировать и реализовать множество возможностей устойчивости самостоятельно.

Примечание.

Категории служб (SaaS, PaaS и IaaS) полезны как широкая группа служб, но важно понимать свои обязанности по каждой используемой вами службе.

Руководства по надежности предоставляют обзор работы каждой службы с точки зрения устойчивости и помогают принимать обоснованные решения о настройке служб в соответствии с вашими потребностями.

Вы также несете ответственность за разработку приложения и рабочей нагрузки, а также за определение требований к надежности, которые помогут вам решить, как разработать и настроить решение.

Надежность основной платформы

Облачная платформа Майкрософт состоит из большого объема инфраструктуры, оборудования, программного обеспечения и процессов для поддержки развертывания и управления службами. Каждый компонент предназначен для обеспечения высокой устойчивости, с несколькими избыточностью оборудования и процессами программного обеспечения на основе исследований. Вместе эти компоненты составляют базовый уровень надежности платформы. Ниже приведены некоторые примеры того, как корпорация Майкрософт предоставляет надежную платформу:

  • Сети имеют избыточные ссылки и могут динамически обходить неисправные сегменты.
  • В каждом регионе центры обработки данных подключаются через сеть с низкой задержкой, которая обеспечивает различные подходы к репликации данных.
  • Объекты центра обработки данных имеют избыточное питание, охлаждение и сетевые подключения. Они управляются группами, которые защищают, отслеживают и управляют ими.
  • Оборудование, включая кластеры и стойки, имеет избыточность на нескольких уровнях.
  • Обновления вычислительных кластеров, стоек и узлов следуют управляемому процессу. Мы используем такие методы, как горячее исправление, чтобы уменьшить или устранить влияние на узлы.
  • Обновления платформы программного обеспечения и изменения конфигурации применяются в соответствии с нашими безопасными методиками развертывания.
  • Корпорация Майкрософт проводит аудит критически важных внешних поставщиков, чтобы убедиться, что сторонний сбой не нарушает службы Azure.
  • Каждая служба Azure должна иметь подробный план аварийного восстановления. Мы проводим детализацию по полному региону в регионах, которые соответствуют рабочим средам.

Все службы Azure получают преимущества от этих основных возможностей надежности платформы и с текущими улучшениями Майкрософт.

Возможности повышения устойчивости

Azure предоставляет множество различных возможностей повышения устойчивости. Хотя корпорация Майкрософт отвечает за предоставление этих возможностей, вы полностью отвечаете за выбор и использование подходящих для ваших потребностей. Ниже приведены некоторые примеры этих возможностей.

  • Регионы. Azure имеет более 60 регионов, и вы можете использовать несколько регионов в одном решении для обеспечения геоизбыточной избыточности, удовлетворения потребностей расположения данных и обеспечения низкой задержки взаимодействия с пользователями во всем мире.

  • использование зон доступности; Многие регионы Azure поддерживают зоны доступности, которые позволяют распределять рабочие нагрузки между несколькими независимыми наборами центров обработки данных. Службы Azure поддерживают зоны доступности таким образом, чтобы они соответствовали их целевой цели, обычно поддерживая зональные развертывания (закрепленные в одной зоне) и (или) избыточные между зонами развертывания (распределены по нескольким зонам). Дополнительные сведения о зонах доступности см. в статье "Что такое зоны доступности?".

  • Уровни служб. Службы предоставляют ряд предложений и уровней, которые соответствуют разным требованиям. Например, при создании виртуальной машины можно выбрать один из стандартных дисков, который предоставляет низкий уровень доступности или диск класса Premium.

  • Резервное копирование. Многие службы Azure, в которых хранятся данные, поддерживают резервные копии, которые могут быть автоматическими, ручным или обоими. С помощью резервных копий можно защитить рабочую нагрузку от сбоев, а также повреждения данных и других событий потери данных.

  • Управление. Возможности платформы, такие как Политика Azure, управление доступом на основе ролей и возможности защиты идентификации Идентификатора Microsoft Entra, можно настроить для обеспечения согласованного применения требований вашей организации. С помощью этих подходов вы можете защитить рабочие нагрузки от инцидентов безопасности и случайных изменений, которые могут привести к простою или другим проблемам с рабочей нагрузкой.

Внимание

Важно понимать соглашения об уровне обслуживания для каждой службы Azure. Соглашения об уровне обслуживания предоставляют важную информацию о ожидаемом времени простоя службы, и любые условия, необходимые для предоставления соглашения об уровне обслуживания. Сведения об уровне обслуживания для каждой службы см. в соглашениях об уровне обслуживания для веб-служб.

Приложения

Это ваша ответственность, чтобы убедиться, что ваши приложения предназначены для обеспечения устойчивости. Использование основных компонентов Платформы Azure Well-Architected Framework для повышения архитектуры на базовом уровне рабочей нагрузки. Основное внимание уделяется тому , как можно сделать рабочую нагрузку и приложения устойчивыми к различным типам сбоев, а также обеспечить восстановление при возникновении сбоев.

Следующие шаги

Модель общей ответственности применяется к другим частям решения за пределами устойчивости. Дополнительные сведения о модели общей ответственности за безопасность см . в Центре управления безопасностью Майкрософт.