Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

Два с половиной года назад у меня появился один из лучших на тот момент процессоров: Intel® Core™ i7-970. На его базе был собран высокопроизводительный компьютер с целью проведения различных инженерных расчетов. Я не стал тратиться на мощную видеокарту, потому что для программ типа ANSYS она не нужна, а играть особо не планировалось. Со временем задачи усложнились, и времени на их решение уходило всё больше. 

 

Над выбором нового процессора особенно задумываться не пришлось, поскольку сегодня в мире только один лидер процессорного рынка, а у него есть только один самый мощный процессор, полное название которого Intel® Core™ i7-4960X Processor Extreme Edition.

 

Остальные компоненты нового компьютера, разумеется, тоже стали мощнее, всё же два с половиной года для ИТ-отрасли – большой срок. Некоторые решения были обусловлены разницей в самих процессорах: если Core i7-970 поддерживал трёхканальную память и для раскрытия своих возможностей требовал 3 планки, то Core i7-4960X поддерживает уже 4 канала, соответственно, увеличилось до четырёх и количество планок. Из таблицы сравнения процессоров видно, что больше всего увеличилась как раз пропускная способность памяти. Кроме того, снижение цен на память и увеличение объёма поддерживаемой памяти с 24 ГБ до 64 ГБ позволило поставить на новый компьютер 32 ГБ оперативки. 

Таблица 1. Сравнение процессоров.
Название продукта Intel® Core™ i7-970 Processor (12M Cache, 3.20 GHz, 4.80 GT/s Intel® QPI) Intel® Core™ i7-4960X Processor Extreme Edition (15M Cache, up to 4.00 GHz)
Кодовое название Gulftown Ivy Bridge E
Дата выпуска Q3'10 Q3'13
Номер процессора i7-970 i7-4960X
Количество ядер  6  6
Количество потоков  12  12
Тактовая частота  3.2 GHz  3.6 GHz
Максимальная тактовая частота с технологией Turbo Boost  3.46 GHz  4 GHz
Кэш-память  12 MB Intel® Smart Cache 15 MB Intel® Smart Cache
Тип шины QPI DMI2
Системная шина 4.8 GT/s 5 GT/s
Литография 32 nm 22 nm
Макс. расч. мощность 130 W 130 W
Макс. объем памяти (зависит от типа памяти) 24 GB 64 GB
Типы памяти DDR3-800/1066 DDR3-1333/1600/1866
Кол-во каналов памяти 3 4
Макс. пропускная способность памяти 25,6 GB/s 59,7 GB/s
Размер корпуса 42.5mm X 45.0mm 52.5mm x 45.0mm
Поддерживаемые разъемы FCLGA1366 FCLGA2011
Редакция PCI Express   3.0
Макс. кол-во каналов PCI Express   40

Ещё сильнее подешевели SSD, что позволило без большого финансового напряжения установить 2 штуки: под систему и под данные.

  

Таблица 2. Сравнение компьютеров.
Компонент Старый ПК Новый ПК
Процессор Intel Core i7-970 Intel Core i7-4960X
Материнская плата Intel DX58SO Gigabyte X79-UD3
Оперативная память 3*2 Gb Kingston 99U5471 4*8 Gb Kingston 99U5471
Жесткий диск Intel SSD X25-M Series SSDSA2M160G2GC (160 Gb)

Intel SSD 510 Series SSDSC2MH12 (120 Gb), система

Intel SSD 510 Series SSDSC2BW12 (120 Gb), данные

Видеокарта NVidia GeForce GTX 250 NVidia GeForce GTX 650 Ti

Тестирование производилось на реальных инженерных расчётах, однако в некоторых случаях их сложность была искусственно снижена. Математические модели были взяты из учебных проектов и заданий.

Задача 1 – расчет полноокружной модели рабочего колеса газотурбинного двигателя на резонанс. Модель содержит 1,44 миллиона узлов, 1,16 миллиона элементов, определялись первые пять собственных частот. Расчет проводился в ANSYS Mechanical 14.5.7. Отмечу, что задачи такого уровня сейчас решаются на суперкомпьютерах, поскольку обычно требуется найти не пять частот, а несколько сотен.

 

Задача 2 – расчет лопатки газотурбинного двигателя на прочность с учетом приложенной центробежной и газовой нагрузки. Модель содержит 245,9 тысяч узлов и 186,2 тысяч элементов. Расчет проводился в ANSYS Mechanical 14.5.7. Эта задача – учебная, но модель с таким количеством элементов применяется и при расчете реальных лопаток.

 

Задача 3 – расчет течения газа в центробежном компрессоре. Модель содержала 351,5 тысяч узлов и 317,5 тысяч элементов. Расчет проводился в ANSYS CFX 14.5.7. Тоже учебная задача, в которой моделируется лабораторный стенд. Замерялось не общее время, за которое выполняется расчет, а время выполнения 100 итераций. Причина в том, что газодинамические задачи, в отличие от прочностных, решаются итерационно, например, до достижения разницы в заданном расходе на входе и расчётном расходе на выходе из компрессора 0,01%.

 

Задача 4 – расчет диска центробежного компрессора на прочность с учетом пластичности, теплового состояния и газовой нагрузки. Модель содержит 1061 тысячу узлов и 748,1 тысячу элементов. Это реальная модель, которая рассчитывалась в рамках проектирования малогабаритного двигателя для беспилотника.

 

Все четыре задачи рассчитывались на одном, двух, шести и двенадцати ядрах. При настройке решателя или запуске программы требуется указать количество ядер, которые будут задействованы при решении задачи – при этом никакого различия между физическими и логическими ядрами нет. Поэтому для одного, двух и шести ядер использовались только физические ядра, а при указании числа ядер равным двенадцати задействовались и виртуальные, которые обеспечиваются технологией Intel Hyper-Threading. Одна из целей исследования – проверить, имеет ли смысл использовать Hyper-Threading при инженерных расчетах. При чтении графиков следует учитывать, что «12 ядер» - это использование процессором всех шести физических ядер с их удвоением посредством Hyper-Threading. При этом в некоторых задачах процессор был загружен по максимуму.

 

Результаты получились следующие:

Задача 1. Расчет полноокружной модели рабочего колеса газотурбинного двигателя на резонанс.

Видно, что многоядерность не дает эффекта, при этом новый ПК выигрывает у старого более чем в 2,5 раза. Это объясняется тем, что данная задача не распараллеливается, и критичным становится объем оперативной памяти.

Задача 2. Расчет лопатки газотурбинного двигателя на прочность с учетом приложенной центробежной и газовой нагрузки.

Ситуация примерно такая же, но повышение количества ядер несколько сказывается на скорости расчета. Влияние объема оперативной памяти не так велико, так как размерность задачи (количество решаемых уравнений) меньше, чем в предыдущем случае.

Задача 3. Расчет течения газа в центробежном компрессоре.

А это уже не Mechanical, а CFX – расчет течения газа в компрессоре. Видно, что увеличение количества ядер с 1 до 6 повышает скорость расчета в 3 раза. Однако расчет на 12 ядрах не дает никакого преимущества по сравнению с шестью: то ли задача дальше не распараллеливается, то ли применение технологии Hyper-Threading в данном случае не оправдано. Более того, на Intel i7-970 время расчета при увеличении количества ядер увеличилось.

Задача 4. Расчет диска центробежного компрессора на прочность с учетом пластичности, теплового состояния и газовой нагрузки.

Снова прочностной расчет, но уже в другой системе и с другими условиями. Однако точно так же видно двухкратную разницу в производительности старого и нового ПК и отсутствие влияния многоядерности.

По результатам тестирования, а также по личному опыту и данным компании ANSYS, можно сделать следующие выводы:

  • Преимущество нового процессора (точнее, новой конфигурации компьютера) не одинаково для всех задач. Если в задаче 1 наблюдалось более чем трёхкратное повышение производительности, то в задаче 3 оно составило около 25%. Однако в целом счёт идёт на разы, а не на проценты, поэтому при интенсивной работе новая конфигурация, безусловно, себя окупит.
  • В разных задачах сравнение процессоров показало различную зависимость от количества используемых ядер. Особенно интересна в этом отношении задача 2: при задействовании только одного ядра новый процессор показывает преимущество в 2,3 раза, при 12 ядрах – в 3 раза.
  • Не на всех задачах увеличение количества ядер даёт эффект. Однако следует иметь в виду, что те задачи, которые сегодня не удалось распараллелить (или разработчики не собрались распараллелить), завтра могут быть распараллелены. Кроме того, процессоры с меньшим количеством ядер слабее и в других отношениях (объём кеш-памяти, скорость обращения к памяти), поэтому использование Intel® Core™ i7-4960X будет оправдано и здесь.
  • Сравнение работы системы с SSD и HDD не проводилось, однако нет никаких сомнений, что для тяжёлых задач, требующих чтения и записи больших объёмов данных, использование SSD будет целесообразно.

Ресурс SPTC.ru выражает благодарность компании «Киберкуб» за качественное комплектование и сборку компьютера.

Intel: архитектурные неизлишества… с хвостиком

Intel: архитектурные неизлишества… с хвостиком. Статья Владислава Боярова

16-я ежегодная конференция «КОСС Плюс» – возраст зрелости

16-я ежегодная конференция «КОСС Плюс» – возраст зрелости. Статья Владислава Боярова