Отказоустойчивые компьютеры компании Stratus

       

Дублирование функциональных узлов и режим пошаговой блокировки


Режим пошаговой блокировки предполагает, что все дублированные элементы некоторой подсистемы обрабатывают одну и ту же команду или данные в один и тот же момент времени. Например, в системах компании Stratus каждые два физических процессора (ЦП) объединяются парами и одновременно выполняют одну и ту же команду. При этом специальная схема сравнения в каждом такте проверяет, что оба ЦП вычислили тот же самый результат. Если ошибки отсутствуют, работа процессоров продолжается. Если обнаруживается ошибка, то работа останавливается, но простая схема сравнения не может сообщить, в каком ЦП произошел сбой. Именно поэтому работающие в режиме пошаговой блокировки пары ЦП также объединяются парами, образуя логический процессор из четырех физических ЦП. В этом случае, если в каком-либо одном физическом процессоре произойдет сбой, то логический ЦП будет продолжать работать без какой-либо потери производительности, что является важным аспектом обеспечения режима непрерывной готовности системы.

Режим пошаговой блокировки предполагает также, что неисправные компоненты аппаратуры автоматически изолируются от остальной части системы и выполняют цикл самотестирования. Если этот тест проходит успешно, то соответствующий функциональный узел автоматически возвращает себя в рабочий режим и продолжает обработку. Если тест самоконтроля не проходит, то в системный журнальный файл заносится соответствующая запись. Система с неисправными компонентами сама дозванивается по сети удаленного обслуживания (RSN - Remote Service Network) в сервисный центр компании Stratus и сообщает о неисправности. Это позволяет обслуживающему персоналу компании определить местоположение отказавшего узла и отправить подлежащий замене узел заказчику.

- -



Содержание раздела