B.2Аппаратное обеспечение Вычислительного комплекса и прочее оборудование
B.2.1.3.1Общие требования
Как минимум все аппаратное обеспечение, поставляемое в рамках данного конкурса, должно удовлетворять следующим требованиям:
Все функции, описанные в п. B.2, должны быть реализованы.
Должно быть предусмотрено все необходимое оборудование и программное обеспечение (в том числе явно не обозначенное в Технических требованиях) для реализации функций обозначенных в п.B.2.
Все активное оборудование Вычислительного комплекса должно иметь встроенные аппаратные средства удаленного управления, позволяющие осуществлять конфигурирование, останов, запуск и/или перезапуск системы или отдельного элемента посредством защищенного интерфейса из сети мониторинга и управления. Сеть мониторинга и управления должна поставляться и устанавливаться вместе с остальным оборудованием Вычислительного комплекса.
Все аппаратные средства СКТП и СБЭ должны иметь встроенные аппаратные средства удаленного управления, позволяющие осуществлять конфигурирование и мониторинг системы или отдельного элемента посредством интерфейса из сети мониторинга и управления. Все аппаратные средства СКТП и СБЭ должны содержать все необходимое оборудование и инфраструктуру для включения в сеть мониторинга и управления.
Вычислительный комплекс должен удовлетворять требованию максимальной готовности. Под термином «максимальная готовность» в данном случае понимается следующее: в случае выхода из строя любого узла или компонента системы (аппаратного или программного), система должна автоматически выявить сбой и принять все меры к самовосстановлению и переконфигурированию. Пользовательские процессы, прерванные сбоем узла, могут не восстанавливаться автоматически. Потеря целостности данных параллельной файловой системы не допускается.
В случае выхода из строя узла/узлов Вычислителя или любой части коммуникационной сети MPI, или части дисковой подсистемы, оставшиеся узлы Вычислителя должны автоматически сохранить доступ ко всей информации, хранящейся в Дисковых системах хранения данных.
Должна быть обеспечена возможность для инженеров сопровождения, выполняющих диагностические или ремонтные работы над любой подсистемой, выполнять работы без прерывания основных оперативных функций и снижения производительности Вычислителя более чем на 25%.
B.2.2.3.1Вычислитель #1
Вычислитель представляет собой набор вычислительных узлов, объединенных с помощью высокопроизводительного механизма взаимодействия (сеть для MPI коммуникаций/интерконнект).
Как минимум, Вычислитель должен удовлетворять следующим требованиям:
-
Совокупная пиковая производительность Вычислителя по тесту Linpack должна составлять по методике, применяемой для измерения этого значения TOP500.org (значение Rpeak):
1,2 PFlops.
Максимальная достигнутая производительность по тесту Linpack Вычислителя должна составлять по методике, применяемой для измерения этого значения TOP500.org (значение Rmax):
0,9 PFlops.
Вычислитель должен обеспечивать выполнение приложений написанных с использованием библиотек MPI версии 3.0.
Все вычислительные узлы должны быть идентичны.
Вычислительные узлы должны быть исполнены в форм-факторе серверов-лезвий и устанавливаться в общее шасси. В одном лезвии допускается установка не более 4-х вычислительных узлов, в одном шасси – не менее 12 вычислительных узлов.
Вычислитель должен иметь систему жидкостного охлаждения, удовлетворяющую следующим требованиям:
Охлаждение горючими и химически активными веществами не допускается.
Не допускается непосредственный контакт охлаждающей жидкости с электронными компонентами вычислительных узлов.
Использование эффективного охлаждения (без использования чиллеров) до тех пор, пока температура наружного воздуха остается ниже 28°C.
Компоненты вычислительных узлов должны функционировать без снижения производительности.
Должна быть обеспечена защита от непреднамеренной протечки жидкости в случае остановки или отключения элементов вычислительного комплекса.
Подключение и отключение серверов-лезвий без остановки любого из других серверов-лезвий.
Теоретическая пиковая производительность вычислительного узла должна составлять не менее:
1TFlops.
Каждый узел должен содержать оперативную память с поддержкой алгоритмов контроля четности и исправления однобитовых ошибок со следующими характеристиками:
частота не менее 2400 MHz.
объем не менее 4 GB на каждый процессор.
модули памяти должны быть установлены так чтобы равномерно использовать все доступные каналы для максимальной производительности.
все модули памяти в вычислительном узле должны быть идентичны.
Каждый узел должен иметь системные жесткие твердотельные диски SSD с объемом 200 GB.
Допускается бездисковая конфигурация, при этом должно быть предусмотрено все необходимое оборудование для обеспечения работы в отказоустойчивом режиме для организации загрузки ОС на вычислительные узлы.
Для вычислительных узлов должно быть реализовано выполнение следующих операций, инициируемых со стороны любого управляющего узла системы:
набор операций совместимый с протоколом IPMI версии 2.0 или выше.
селективный аппаратный сброс (hard reset) любого узла или группы узлов.
селективное включение/отключение электропитания любого узла или группы узлов (power cycle).
чтение кода результата тестирования состояния узла (Power-On Self Test , POST).
обновление микрокода BIOS на одном и всех узлах Вычислителя одновременно.
чтение значения моментального энергопотребления узла, процессорных чипов.
установка ограничения энергопотребления узла: после установки максимального предельного значения узел должен снизить уровень потребляемой электрической мощности до установленного лимита.
чтение значения температуры или термального запаса для каждого процессорного чипа.
Узлы Вычислителя должны иметь функционал предотвращения катастроф: узел должен полностью самостоятельно выключаться при выходе значений температуры за рамки диапазона рабочих температур установленные Производителем для данных узлов.
Каждый процессор вычислительного узла должен быть оригинальным 64-х разрядным скалярным процессором. Все процессоры в узле должны быть идентичны.
Архитектура набора команд процессора должна быть совместима с x86-64 с векторными расширениями.
Объем кэш-памяти каждого процессорного чипа должен составлять не менее 25 MB.
Теоретическая пиковая производительность одного процессора должна составлять не менее 35 GFlops.
Каждый узел должен иметь доступ к Дисковой системе хранения данных #2 через параллельную файловую систему. Производительность Дисковой системы хранения #2 (тест E.3.6) должна быть не менее значений, указанных в сопроводительной документации к тестированию.
Каждый узел должен содержать MPI-интерфейс, а Вычислитель Коммуникационную сеть MPI, с характеристиками не хуже, чем указанные в сопроводительной документации к тестированию и измеренными на тестах п. E.3.3.
Коммуникационная сеть MPI должна обеспечивать объединение, как минимум, всех вычислительных узлов в единую высокопроизводительную сеть. Топология сети должна обеспечивать полное использование полосы пропускания от всех подключенных вычислительных узлов, т.е. каждый элемент (например, коммутатор) в топологии должен иметь ту же или лучшую производительность к сети, чем сумма производительностей подключенных узлов. Топология должна быть одинаковой для всего Вычислителя.
Транспортная сеть должна обеспечивать объединение всех вычислительных узлов для доступа к дисковым системам хранения.
Должна обеспечиваться одновременная работа коммуникационной и транспортной сетей по раздельным интерфейсам. Топологии коммуникационной и транспортной сети должны быть идентичны.
Высокопроизводительные коммуникационная и транспортная сети должны обеспечивать пропускную способность каждого линка на уровне не менее 80 Gbps.
Количество корневых коммутаторов в каждой из указанных выше высокопроизводительных сетей (при наличии в топологии) должно быть не менее 2-х.
Коммуникация узлов (электропитание, интерконнект, ЛВС) в шасси реализуется без использования кабелей. При использовании центральных корневых коммутаторов-директоров интерконнекта допускается использование прямых кабельных соединений.
Коммуникационная сеть должна быть построена по схеме без единой точки отказа, обеспечивая объединение пропускных способностей интерфейсов или, в случае отказа, автоматический механизм переключения между интерфейсами вычислительных узлов.
Выделенная сеть мониторинга и управления Вычислителя реализуется по схеме без единой точки отказа со скоростью не менее 1Gbps.
Продолжительность перевода Вычислителя из рабочего режима в состояние «отключение питания» не должна превышать 15 мин. Продолжительность перевода Вычислителя из состояния «отключение питания» в рабочий режим не должна превышать 20 минут.
Единичный отказ блока питания и/или активного элемента охлаждения не должен приводить к выходу из строя узла.
Система охлаждения вычислительных узлов Вычислителя должна обеспечивать надежность и доступность:
в составе вычислительных узлов должны отсутствовать элементы с механически движущимися в процессе работы частями, такие как жесткие диски, вентиляторы, и пр.
единичный отказ элемента охлаждения не должен приводить к выходу любого из узлов группы серверов-лезвий.
проведение регламентного обслуживания элементов системы охлаждения Вычислителя должно осуществляться без останова вычислительных узлов.
Время выполнения представленного Получателем теста на основе глобальной спектральной модели (п. E.3.7.1) для минимальной конфигурации, требуемой к тестированию (п. E.3.1) должно быть не более значения, указанного в сопроводительной документации к тестированию.
Время выполнения представленных Получателем тестов на основе глобальной конечно-разностной модели SLM (п. E.3.7.2) для минимальной конфигурации, требуемой к тестированию (п. E.3.1), должно быть не более значений, указанных в сопроводительной документации к тестированию.
Время выполнения тестов на основе модели COSMO (п. E.3.7.3) для минимальной конфигурации, требуемой к тестированию (п. E.3.1), должно быть не более значения, указанного в сопроводительной документации к тестированию.
B.2.2.1Системная консоль #1 Вычислителя
Вычислитель должен поставляться с одной Системной консолью #1 (кластер), которая должна удовлетворять, как минимум, следующим требованиям:
Системная консоль #1 Вычислителя должна обеспечивать выполнение функций консоли для Вычислителя и всего серверного оборудования Вычислительного комплекса и включать все необходимое для этого оборудование;
Функции управления оборудованием до загрузки операционной системы должны быть обеспечены (в том числе работа с BIOS, состояние отключенное питание, креш ОС).
Должен быть обеспечен монтаж в стойку.
Предустановленная ОС Вычислителя с оптическим диском дистрибутива.
DVD дисковод.
Подключение к ЛВС для организации удаленного доступа.
TFT-монитор, активная матрица, размер экрана не менее 17" по диагонали в конструктиве 1U.
B.2.2.2Системная консоль #2
Системная консоль #2 дублирует функции Системной консоли #1 Вычислителя, располагается вне помещения размещения Вычислительного комплекса, включает в себя Системный блок#1 и Монитор#1
Как минимум, Системный блок#1 должен удовлетворять следующим требованиям:
1 (один) 64 разрядных процессорный чип;.
Пиковая производительность каждого процессорного чипа – 30 GFlops;
ОЗУ – 8 GB;
1(один) НЖМД SAS 10k, емкостью 600 GB или 2(два) НЖМД SATA, емкостью 1 TB каждый с зеркалированием;
1 комбинированный CD/DVD привод;
1 сетевой адаптер – интегрированный RJ-45, Ethernet 10/100/1000 Base-Т;
2 свободных порта USB 2.0;
1 последовательный порт;
Стандартная клавиатура 101 key Rus/ Lat
Оптическая мышь с колесом прокрутки, коврик для мыши;
Предустановленная ОС – ОС Вычислителя с инсталляционным диском.
Как минимум, Монитор#1 должен удовлетворять следующим требованиям:
Тип – цветной, активная матрица TFT;
Размер экрана – 20" по диагонали;
Размер пикселя – не более 0.26 mm;
Контраст –700:1;
Яркость – 300 cd/m2;
Разрешение – 1600x1200, 60 Hz;
Максимально допустимое количество неисправных пикселей – class II по стандарту ISO 13406-2;
Встроенный источник питания;
Стандарт излучения и экологической безопасности – TCO-03
Монитор#1 должен быть совместим с Системным блоком#1.
Монитор#1 должен поставляться вместе с интерфейсными кабелями.
B.2.2.3Система FRONT-END Вычислителя
Как минимум, Система должна удовлетворять следующим требованиям:
Система организуется для обеспечения единой точки входа для пользователей, организации среды трансляции и т.д.
Система должна быть организована:
(М) – в виде кластера без единой точки отказа, который базируется на конфигурации Сервер #1 (п.B.2.9.1)
(Р) – на базе конфигурации Сервер #1 (п.B.2.9.1)
Операционная система – ОС Вычислителя.
Запуск задач на Вычислителе должен организовываться через систему пакетной обработки заданий.
Не допускается реализация других сервисов и систем на аппаратной платформе данной системы.
B.2.2.4Система пакетной обработки заданий
Как минимум, Система должна удовлетворять следующим требованиям:
Система организуется для обеспечения контролируемого запуска задач на ресурсах вычислительного комплекса.
Система организуется в виде кластера без единой точки отказа, который базируется на конфигурации Сервер #2 (п. B.2.9.2).
Сервис системы пакетной обработки заданий также должен быть задублирован.
Не допускается реализация других сервисов и систем на аппаратной платформе данной системы.
B.2.2.5Система управления лицензиями
Как минимум, Система управления лицензиями должна удовлетворять следующим требованиям:
Система должна организовываться для обеспечения централизованного управления лицензиями программного обеспечения, установленного на ресурсах вычислительного комплекса.
Система должна организовываться в виде кластера без единой точки отказа, который базируется на конфигурации Сервер #2 (п. B.2.9.2).
Предустановленная операционная система должна быть идентична ОС Вычислителя.
|