Основополагающими концептуальными архитектурными принципами создания
суперкомпьютерных конфигураций "СКИФ" являются:
Базовая кластерная архитектура. Концепция создания
моделей семейства суперкомпьютеров "СКИФ" (далее по тексту - Концепция)
базируется на масштабируемой кластерной архитектуре, реализуемой
на классических кластерах из вычислительных узлов на основе компонент
широкого применения (стандартных микропроцессоров, модулей памяти,
жестких дисков и материнских плат, в том числе с поддержкой SMP)
под управлением универсальной операционной системы Linux. Для организации
параллельного выполнения прикладных задач на кластерном уровне используется
оригинальная система поддержки параллельных вычислений - Т-система,
реализующая автоматическое динамическое распараллеливание программ.
По сравнению с использованием распараллеливающих компиляторов, Т-система
обеспечивает более глубокий уровень параллелизма во время выполнения
программы и более полное использование вычислительных ресурсов мультипроцессоров
при более низких затратах на разработку параллельных программ и
повышении их надежности.
Технические характеристики базовой суперкомпьютерной конфигурации
кластерного уровня Ряда 1 на процессорах AMD Athlon MP 1800+:
| Пиковая производительность |
100 GFlops |
| Число процессоров |
32 |
| Число вычислительных узлов |
16 |
| Оперативная память |
16 GB |
| Дисковая память |
640 GB |
| Системная сеть SCI |
2D-тор 4х4 |
| Скорость MPI-обмена |
до 276 MB/S |
| Физическая скорость обмена |
1600 MB/S |
Иерархические кластерные конфигурации (метакластеры).
Отдельные кластеры могут быть объединены в единую кластерную конфигурацию
- кластер высшего уровня или метакластер (Metacluster). Метакластерный
принцип позволяет создавать сетевые (распределенные) метакластерные
конфигурации на базе локальных или глобальных сетей передачи данных
триллионного диапазона производительности. Такой подход является
базовым для создания единого информационного пространства участников
Программы, а, в перспективе, и для объединения научных сетей России
и Беларуси.
Системное программное обеспечение метакластера обеспечивает возможность
реализации гетерогенных систем, включающих кластеры различной
архитектуры на различных программно-аппаратных платформах.
Универсальная двухуровневая архитектура. Для оптимизации
организации на суперкомпьютерах "СКИФ" параллельного счета задач
как с крупноблочным (явным статическим или скрытым динамическим)
параллелизмом, так и с конвейерным или мелкозернистым явным параллелизмом,
с большими потоками информации, требующими обработки в реальном
режиме времени, Концепция предусматривает возможность реализации
универсальной двухуровневой (гибридной) архитектуры суперкомпьютеров,
включающей базовый (кластерный) архитектурный уровень и потоковый
архитектурный уро-вень, реализующий модель потоковых вычислений
(data-flow).
Концепция предусматривает реализацию потокового архитектурного уровня
как на базе однородной вычислительной среды (ОВС) с использованием
оригинальных СБИС ОВС, разрабатываемых в рамках Программы, так и
на базе других (альтернативных) структурных и технических решений
(например, на базе FPGA типа XILINX). На потоковом уровне может
быть эффективно реализован высокоскоростной потоковый обмен со стандартной
компьютерной периферией и/или с нестандартными устройствами-датчиками,
например, с датчиками медицинских и других приборов.
В процессе реализации программы на этапе 1 по результатам проведенных
моделирования и экспериментального макетирования выбраны следующие
основные параметры СБИС:
- Проектная норма, мкм - 0,6;
- Тактовая частота, Мгц - 25,0;
- Потребляемая мощность, ВА - 3,0 (V - 3,0);
- Быстродействие (пиковое), 32 разряда, MIPS (миллион операций в
секунду) - 20;
- Количество СБИС на 1 GIPS (миллиард операций в секунду) - 50.
Функциональные возможности СБИС с проектными нормами 0,6 мкм полностью
соответствуют концептуальным требованиям для всего спектра моделей
суперкомпьютеров, создаваемых в рамках Программы. Предложенные архитектурные
принципы позволяют эффективно реализовывать любые виды параллелизма.
Архитектура является открытой и масштабируемой, то есть не накладывает
жестких ограничений к программно-аппаратной платформе узлов кластера,
топологии вычислительной сети, конфигурации и диапазону производительности
суперкомпьютеров. Вычислительные системы, создаваемые на базе основополагающих
концептуальных архитектурных принципов могут оптимально решать как
классические вычислительные задачи математической физики и линейной
алгебры, так и специализированные задачи обработки сигналов, моделирования
виртуальной реальности, задачи управления сложными системами в реальном
времени и другие приложения.
Основные концептуальные принципы создания семейства суперкомпьютеров
(открытая масштабируемая архитектура, набор базовых вычислительных
модулей и конфигураций и др.) позволяют оптимальным способом создавать
для каждой конкретной прикладной проблемы адекватную суперкомпьютерную
конфигурацию. В связи с этим фактически отождествляются понятия
модель и прикладная конфигурация.
В состав базовых конфигураций входят базовые вычислительные модули
кластерного и потокового уровней (БВМ КУ и БВМ ОВС), сетевые средства
поддержки взаимодействия вычислительных узлов и соответствующее
базовое (общесис-темное) и прикладное программное обеспечение.
Специфика моделей и их модификаций отражается в эксплуатационной
документации. Основополагающие принципы Концепции позволяют создавать
прикладные комплексы, соответствующие требованиям конкретного заказчика,
оптимально использовать производственные мощности предприятия-изготовителя
с учетом специфики рынка сбыта высокопроизводительных вычислительных
систем.
Конструкторская документация разрабатывается на базовые модули,
имеющие самостоятельную поставку, и на базовые конфигурации суперкомпьютерных
систем. Конструкторская документация выполняется в едином для всех
исполнений суперкомпьютерных конфигураций групповом варианте в соответствии
с действующими стандартами.
Групповое построение конструкторской документации адекватно отражает
возможности архитектурной идеологии (открытость, масштабируемость),
позволяя оптимальным способом организовать серийное производство
широкой номенклатуры моделей суперкомпьютеров, наиболее полно удовлетворяющих
предъявляемым пользовательским требованиям.