Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

Москва, 29 ноября 2019 г. — Группа компаний РСК, ведущий в России и хорошо известный в мире разработчик и интегратор инновационных сверхплотных, масштабируемых, энергоэффективных и гиперконвергентных решений для высокопроизводительных вычислений (HPC) и центров обработки данных (ЦОД), продемонстрировала на крупнейшей мировой суперкомпьютерной выставке SC19, прошедшей 18-21 ноября в Денвере (шт. Колорадо, США) дальнейшее развитие линейки унифицированных решений RSC Tornado. Новые решения РСК предназначены для выполнения широкого спектра ресурсоемких научных и прикладных задач. Обновленная линейка интегрированных программно-определяемых и реконфигурируемых решений ориентирована на применение как в составе классических высокопроизводительных систем (high performance computing, HPC), так и для эффективного хранения и обработки данных, а также для создания систем искусственного интеллекта (Artificial Intelligence, AI), систем машинного и глубокого обучения (Machine Learning, Deep Learning - ML/DL).

Среди представленных специалистами РСК новинок:

  • Сверхмощный вычислительный узел RSC Tornado AP на базе самых высокопроизводительных серверных процессоров новой линейки Intel® Xeon® Platinum 9200 (до 56-ти ядер на процессор).
  • Высокопроизводительные системы хранения данных RSC Tornado AFS, предназначенные для применения, как в сфере высокопроизводительных вычислений, так и в областях машинного и глубокого обучения. Они базируются на передовом программном стеке DAOS для создания распределённых объектных систем хранения данных с поддержкой модулей энергонезависимой памяти Intel® Optane DC Persistent Memory.

Кроме    того,    на    стенде    РСК    были    продемонстрированы    широкие функциональные  возможности  обновленной  версии  программного  стека  RSC BasIS, предназначенного для создания, мониторинга, управления вычислительными кластерами (Cluster-on-Demand) и распределенными системами хранения данных по требованию (Storage-on-Demand).

Развитие линейки RSC Tornado позволяет на новом уровне реализовывать основные преимущества решений РСК, например, такие как: максимальная вычислительная плотность и энергоэффективность (за счет 100% жидкостного охлаждения «горячей водой» всех электронных компонент), линейная масштабируемость от малых систем в несколько серверов до тысяч серверов в составе больших кластеров или серверных ферм. При этом предоставляются дополнительные возможности для оптимизации стоимости конечных решений за счет поддержки открытых стандартов, в том числе и новых типов накопителей для систем хранения данных:

  • Intel Optane DC Persistent Memory,
  • накопителей с поддержкой технологии NVMe в максимально плотном форм-факторе EDSFF (так называемые long/short ruler),

также:

  • серверных плат с поддержкой большего объема оперативной памяти,
  • процессоров с максимальным энергопотреблением до 500 Вт на сокет,
  • широкого набора акселераторов с энергопотреблением до 700 Вт.

В результате, обновленная линейка RSC Tornado позволит создавать системы с еще большей объемной вычислительной плотностью, широким разнообразием наборов применяемых компонент и их конфигураций для достижения максимальной эффективности конкретного решения.

В свою очередь, унификация форм-фактора монтажного шкафа, включая распределенную систему энергопитания с дублированием N+x, встроенную систему мониторинга и управления вычислительной и коммутационной компонентами, позволяет одновременно использовать в одной стойке как решения РСК со 100% жидкостным охлаждением, так и серверное и коммуникационное оборудование стандартного форм-фактора 19” (rack unit, RU) других производителей, оснащенное воздушным или комбинированным охлаждением.

Вычислительный узел RSC Tornado AP

Новый высокопроизводительный узел RSC Tornado AP с поддержкой 56-ти ядерных процессоров линейки Intel® Xeon® Platinum 9200 (модель Intel® Xeon® Platinum 9282) и прямым жидкостным охлаждением в режиме «горячая вода» обладает максимальной теоретической (пиковой) производительностью 9,3 ТФЛОПС, имея при этом 24 канала оперативной памяти и обеспечивая поддержку объема хранения до 1,5 ТБ данных. Такой узел может комплектоваться двумя твердотельными накопителями (SSD) с поддержкой технологии NVMe в форм-факторе M.2 — например, Intel® Optane SSD DC P4801X M.2 Series или Intel® SSD DC P4511 (NVMe, M.2), либо двумя SSD-накопителями формата E1.S (short ruler) — например, Intel® SSD DC P4511 (NVMe, E1.S). В качестве опции возможно расширение системы с помощью дополнительной корзины с 6-ю SSD-накопителями на базе NVMe в форм-факторе E1.L (long ruler) объемом до 15,36 ТБ каждый, причем с возможностью горячей замены.

Так, например, конфигурация с Intel® SSD DC P4320/P4520 (NVMe, E1.L) дает возможность обеспечить объем хранения более чем 100 ТБ данных на узле максимально быстрым доступом. Оптимальное сочетание вычислительной, сетевой и компоненты хранения данных обеспечивает необходимый баланс для построения высокопроизводительных гиперконвергентных систем с линейным масштабированием, как для достижения необходимой вычислительной мощности, так и требуемых параметров объема/скорости распределенной системы хранения.

Данный подход позволяет создавать высокопроизводительные и компактные системы, обладающие рекордными для индустрии показателями: 0,8 ПФЛОПС суммарной пиковой производительности и 8,4 ПБ объема хранения данных в одном монтажном шкафу 42U.

Системы хранения данных RSC Tornado AFS

Учитывая постоянно растущие потребности клиентов в увеличении объемов хранения и скоростей обработки данных, РСК разработала совершенно новое решение RSC Tornado AFS для создания All-Flash систем хранения большого объёма на основе высокоскоростной технологии NVMe и c максимально плотным форм-фактором EDSFF.L. Новый All-Flash массив с 100% жидкостным охлаждением всех компонент «горячей водой» поддерживает до 32-х твердотельных накопителей с поддержкой технологии NVMe в форм-факторе EDSFF.L с заявленной на сегодняшний день емкостью 15,36 ТБ каждый возможностью горячей замены. Ожидаемое в ближайшем будущем удвоение емкости накопителей класса NVMe/EDSFF.L позволит увеличить объем хранения до 1 ПБ на 1 место стандартного форм-фактора 19” (1RU) без каких-либо конструктивных изменений.

Широкое использование технологии NVMe-over-Fabric (NVMeOF) предоставляет возможности для создания высокоскоростных распределенных систем со скоростями передачи данных до нескольких ТБ/с и объемом хранения до 20,64 ПБ на шкаф при поддержке различных типов параллельных файловых систем, таких как Lustre, BGFS и др.

Применение же перспективных технологий Intel® Optane DC Persistent Memory и удалённого прямого доступа к памяти RDMA (remote direct memory access) открывает абсолютно новый подход для построения высокоскоростных низколатентных распределенных систем хранения данных (СХД) класса key-value store при помощи передового программного стека DAOS (Distributed Asynchronous Object Storage). Такие СХД предназначены для широкого использования в областях машинного и глубокого обучения.

С целью достижения оптимальной производительности особое внимание было уделено и базовой части решения, в котором применены два высокопроизводительных процессора Intel® Xeon® Scalable второго поколения, реализована возможность использования до 2 ТБ высокоскоростной памяти и до четырех модулей Intel® Optane DC Persistent Memory в качестве кэшей данных 4-5 уровней. За обеспечение высокоскоростного межузлового обмена на скоростях до 200 Гб/с отвечает коммуникационная подсистема, состоящая из 2-х адаптеров PCIe Gen3/4 x16 на основе технологий Intel® Omni-Path, InfiniBand или Ethernet, что обеспечивает скорость доступа к данным на уровне до 25 ГБ/с на массив.

В свою очередь, логичным развитием высокоскоростной гиперконвергентной системы хранения данных RSC Tornado HS с 12-ю NVMe-накопителями стало добавление модулей энергонезависимой памяти Intel® Optane DC Persistent Memory, что предоставило возможность реализации поддержки программного стека DAOS. Уместно отметить, что в недавно завершенном проекте модернизации суперкомпьютера имени Н.Н. Говоруна.

В Объединенном институте ядерных исследований (ОИЯИ) в г. Дубна, применение таких решений позволило достичь высочайшего уровня производительности распределенной системы хранения данных в 300 ГБ/c.

Использование гиперконвергентного решения RSC Tornado с программным стеком RSC BasIS позволяет с помощью встроенного оркестратора определять архитектуру системы хранения данных «на лету» после инсталляции оборудования, адаптируя при этом комплекс к различным типам нагрузок в соответствии с предпочтениями и задачами пользователей. При этом становится возможным создание «хранилищ-по-требованию» (storage-on-demand) с различными характеристиками для каждого из них (объем, тип файловой системы, скорость доступа, уровень надежности и безопасности, время жизни).

----

«Альфа Конфа» в Самаре

«Альфа Конфа» в Самаре. Статья Владислава Боярова. 05.03.2024 г.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть четвёртая. Статья Владислава Боярова. 12.03.2024 г.

«Домашний компьютер». Конкурс в Самаре.

«Домашний компьютер». Конкурс в Самаре.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность.

Галопом по вычислительным Европам. Часть 10. Китайский путь и персональная безопасность. Статья Ильи Вайцмана. 11.12.2023 г.