Чего ждать от amd ryzen 7000 (zen 4)

Производительность 3990х во вьюпорте C4D

Однако, хорошего понемногу. Результаты тестов 3990x во вьюпорте Cinema 4D не столь хороши, как хотелось бы. На практике этот тест вполне недвусмысленно указывает, что Threadripper — это крутое решение для рендер ноды, а не в качестве процессора на котором можно с максимальным комфортом и создавать графику, анимировать и т.д. В целом, результаты это теста довольно показательны не только для C4D, но и любого другого графического пакета в плане активной работы.

Справедливости ради, стоит упомянуть, что в рамках такого теста процессоры Xeon вообще и рядом не стояли, потому что базовые частоты ядер у них еще меньше.

То, чего нет у EPYC!

Очень интересно, что в материнской плате ASRockRack X399D8A-2T используется традиционный сине-серый текстовый BIOS, который (ой, я не могу сдержать эмоции), поддерживает разгон процессора и памяти, а ещё может похвастаться профилями для сохранения настроек оверклокинга. Имеющийся Watchdog таймер перезагрузит ваш сервер, если тот зависнет во время работы от переразгона. Конечно, кто-то скажет, что разгон в сервере — это несерьёзно, но не спешите тушить свечи: в мире есть целый пласт серверов, в которых частота CPU имеет определяющее значение при выборе. Их задача — отработать 8 часов в день, а потом они, как правило, перегружаются или отдыхают. Это — серверы для HFT (High-Frequency Trading), задача которых зарабатывать деньги на бирже методом высокочастотной торговли, то есть выставлением заявок в промежуток времени, пока сервер биржи запрашивает повторный сетевой пакет от клиента, подавшего ордер на покупку/продажу. Такие машины, как правило, устанавливаются в тех же дата-центрах, что и серверы биржи, и их задача с точки зрения оборудования — добиться минимальной задержки в выставлении заявок на покупку/продажу. В таких серверах активно применяется разгон, жидкостное охлаждение, процессоры с частотами 5 ГГц и выше и даже платы FPGA.

Кроме этого, у нас есть целый ряд некритичных задач, таких как рендеринг или расчёт моделей для нейронных сетей, где в случае сбоя можно продолжить задачу с того же шага. Да и вообще не будем забывать, что у геймеров процессоры годами работают в разогнанном режиме, без зависаний, а некоторые вообще не представляют себе компьютер без разгона. Для всех этих случаев материнская плата ASRockRack X399D8A-2T готова, ну а если не хочешь — не разгоняй!

Про EPYC же следует сказать, что если у вас процессор нового, второго поколения, то он отличается от первого возможностью настройки NUMA-конфигураций памяти с привязкой к отдельным группам ядер или всему сокету сразу. Так же вам могут быть доступны настройки задержек памяти, но это зависит от воли производителя материнской платы, и встречается крайне редко.

Прогресс очевиден

По утверждению самой Loongson, ее новый процессор 3A6000 показывает в тесте SPEC CPU 2006 на 68% более высокий результат по сравнению со своим предшественником 3A5000, анонсированным в апреле 2021 г. В данном случае имеется в виду производительность в одноядерном режиме в операциях с плавающей запятой.

Насколько эти данные соответствуют действительности, станет известно лишь после релиза самого процессора или хотя бы его официального анонса. Вероятно, CPU действительно стал мощнее на фоне 3A5000, но сможет ли он на равных конкурировать с AMD Ryzen 5000, сказать пока нельзя.

На повышенную вероятность провала 3A6000 сравнительных тестов, в которых его оппонентами выступят чипы AMD, указывают радикальные отличия в техпроцессах. Все Ryzen 5000 выпускаются по 7-нанометровым нормам, тогда как 3A6000 будет 12-нанометровым. В этом плане может оказаться, что он не дотянет и до Intel Core 11 поколения с их 10 нм техпроцессом.

Главное отличие 3A6000 от чипов AMD и Intel – в отсутствии архитектуры х86. Весной 2021 г. Loongson презентовала процессорную архитектуру LoongArch собственной разработки.

Обойти в бенчмарках топовые модификации Ryzen 5000 — задача не из простых

Система команд LoongArch включает почти 2000 уникальных инструкций. В дополнение к базовому набору команд также были реализованы инструкции двоичного преобразования (LBT), векторной обработки (LSX), расширенной векторной обработки (LASX) и виртуализации (LVZ).

Александр Голубчиков, МегаФон: Популярность набирают облачные решения и кибершеринг для расширения концепции SecaaS
Безопасность

Loongson подчеркивает, что LoongArch не нарушает каких-либо патентов, связанных с уже существующими архитектурами, включая x86, ARM, MIPS или RISC-V. Все процессоры компании совместимы с наборами команд х86 при помощи эмуляции.

MariaDB 10.3

Используя форк MySQL, MariaDB 10.3, входящую в состав дистрибутивов CentOS / Debian, традиционно, мы создаём InnoDB базу на 1 миллион строк, из которой используем только 100 000, чтобы нагрузить процессор запросами SELECT из пула, хранящегося в ОЗУ. У нас очень быстрый NVME накопитель, который сглаживает задержки записи логов, поэтому производительность системы хранения не влияет на показатели.

Мы видим ситуацию, характерную для предыдущих приложений: огромное преимущество EPYC Rome 7532 по латентности в 1 потоке, которое тает по мере увеличения загрузки, уступая Threadripper 2990WX.

Производительность Threadripper 3990x в Cinebench R20

Давайте посмотрим на производительность нового процессора от AMD в Cinebench R20 относительно других продуктов AMD и конкурентов от Intel в режиме многопоточности.

Вполне ожидаемо, Threadripper 3990x оставляет глотать пыль не только массовый сегмент Intel далеко позади, но и серверное решение 2х Intel Xeon Platinum 8180. Вот он новый чемпион во всей красе. Без конкуренции, без компромиссов. Реально страшная и завораживающая мощь 128 потоков.

Особенностью теста Cinebench R20 является почти линейное, чистое ускорение от бОльшего количества потоков, что, собственно, буквально можно соотнести с работой стандартного или физического рендерера в C4D.

Вместе с тем, новый 3900х рипер хоть и немного сдает позиции в однопоточном режиме, но смотрится весьма достойно. Технические ограничения обычно не позволяют сохранить большие частоты для однопоточных задач и большое количество ядер для многопоточных задач в рамках одного процессора.

Обратите внимание, насколько бледнее выглядит тот же Xeon Platinum 8180 в однопоточных тестах, уступая 3990х целых 28%. И это при том, что ядер у него значительно меньше

Цена вопроса

На момент подготовки обзора, материнская плата ASRock X399D8A-2T стоила примерно столько же, сколько и ASRockRack EPYCD8-2T, в районе 550$, а это значит, что на платформе для процессоров AMD Threadripper не сэкономишь. Намного интереснее ситуация с самими процессорами:

  • EPYC 7551p — 1300$
  • Threadripper 2990wx — 1525$
  • EPYC 7532 — 3250$

Вообще, на момент подготовки обзора, у AMD в продаже было 9 (!) Вариантов 32-ядерных процессоров первого и второго поколения: для односокетных серверов, для двухсокетных серверов, на ядре первого поколения, на ядре второго поколения со 128 мб кэша L3, на ядре второго поколения с 256 мб кэша L3, — настоящий рай для любителей повыбирать в ценовом диапазоне от 1300$ за EPYC 7551p и до 3400$ за EPYC 7542, ну а самый доступный epyc rome серии 7452 обойдётся всего в 2025$.

Не забываем, что epyc поддерживают память типа Registered, а Threadripper — нет.

  • 16 ГБ ECC Registered DDR4 2666 MHz — 80$
  • 16 ГБ ECC Unbuffered DDR4 2666MHz — 110$
  • 16 ГБ Non-ECC Unbuffered DDR4 2666 MHz — 70$

 Простейшая конфигурация из процессора, материнской платы и 256 ГБ ОЗУ получится следующей:

  • EPYC 7551p + AsrockRack EPYCD8-2T + 256GB ECC RDIMM DDR4 = 2490$
  • Threadripper 2990wx + ASRockRack X399D8A-2T + 256gb ECC DIMM DDR4 = 2955$
  • Threadripper 2990wx + ASRockRack X399D8A-2T + 256gb Non-ECC DIMM DDR4 = 2660$
  • Epyc 7532 + ASrockRack EPYCD8-2T + 256GB ECC RDIMM DDR4 = 4440$

Так же не забывайте, что под epyc 7532 имеет cмысл покупать самую быструю память ddr4 3200, что ещё больше прибавит к стоимости машины.

Разница между SoC и традиционным CPU

Закрыв глаза и взяв в левую руку Threadripper X2990, а в правую — EPYC, и вы не почувствуете разницы: у этих процессоров почти одинаковый сокет, размеры и вес, с той лишь разницей, что EPYC — это полноценный SoC, не требующий установки южного моста на материнскую плату, а Threadripper — это CPU, которому всё же нужен чипсет. Южный мост отвечает за шину PCI Express, разведённую к некоторым слотам, за SATA порты и обвязку. Давайте сравним топологию типичной материнской платы под EPYC с платой под Threadripper:

На плате ASRock Rack X399D8A-2T чипсет стоит тот же, что и на геймерских материнках: AMD X399, который продвинутые игроманы уже списали в утиль, а в серверах он, как говорится, ещё послужит. С точки зрения функционала обвязки, сравнивая с той же платой EPYC8D-2T, здесь нет никаких недостатков: 2 SATA порта с поддержкой DOM для загрузки гипервизора, плюс ещё 8 SATA портов, из которых 4 выведены разъёмом Mini-SAS для подключения к корзине или бэкплейну, 2 порта M-Key, из которых один может работать как OCULink и даже USB порт под флешку с VMware ESXi распаян на материнке так, чтоб не мешать видеокартам. Да, здесь один из M.2 слотов в режиме SATA будет использовать линию из южного моста, но давайте будем объективны: нет смысла занимать этот слот SATA накопителем — туда просится NVME формата 2280, а в этом случае накопитель обменивается данными с процессором. Кстати, вы можете объединить два M.2 накопителя в RAID 0/1 из BIOS материнки.

Естественно, у ASRockRack X399D8A-2T меньше PCI Express 16x слотов, чем у материнских плат под EPYC, где все слоты имеют ширину шины 16x (PCI Express 3.0 для первого поколения EPYC и PCI Express 4.0 для второго). С практической точки зрения это означает, что платформа на процессорах Threadripper явно не предназначена для 3 и более GPU типа Nvidia Tesla V100, использующих PCI-E 3.0 16x, но в то же время вы можете использовать и сетевые карты и HBA, которые требуют ширину шины PCI Express 8x.

Слоты памяти установлены вдоль воздушного потока для оптимальной продувки в стоечном корпусе. При нехватке сетевых портов коммутатора в стойке, вы можете подключаться к IPMI-интерфейсу чипа ASpeed AST2500 через любой из 10-гигабитных портов в Out-of-band режиме. В общем, данная материнская плата имеет всё то же, к чему вы привыкли в традиционном сервере, а плюс ещё 1 порт USB Type-C, которого не бывает на материнских на платах под EPYC, и к которому можно подключить аж целую дисковую полку типа QNAP TR-004U. Также на плате имеется звуковой кодек Realtek ALC892, который сгодится для передачи аудио на RDP-сервере, но не более того.

Тестирование 1С Предприятие 8.3

Если рассуждать с точки зрения среднего бизнеса, то важнейшее преимущество 32-ядерных процессоров состоит в том, что старый кластер из 2-х или 4-х серверов вы сегодня можете заменить на 1 машину, совмещающую в себе и сервер приложения и сервер баз данных, а виртуализация даст дополнительную гибкость и удобство построения отказоустойчивого кластера. Если смотреть с точки зрения Cloud-провайдеров, то 32-ядерный CPU можно «нарезать» на 32 виртуальные машины для малого бизнеса, с жёсткой привязкой ядер и сдавать в аренду тем пользователям, кто ведёт свой учёт в облаке. Два разных подхода требуют двух разных тестов, и начнём мы как раз со второго.

Мелкие потребители 1С Предприятия используют самый простой, но в то же время быстрый способ хранения данных: в файлах

Как правило, их нагрузка является 1-поточной, и пользователю важно, чтобы программная платформа быстро обработала его запрос на выставление счёта или формирование отчётности. Для тестирования подобных конфигураций применяется известный тест Гилева, который в своей сути является 1-поточным, но показывает максимальную скорость при использовании 2 процессорных ядер на систему

И если вы сдаёте в аренду VPS под 1С Предприятие, то «Тест Гилёва» — это первое, что запустит ваш будущий клиент, чтобы оценить скорость сервиса.

Об авторе методики тестирования:

Вячеслав Гилев, руководитель лаборатории тюнинга 1С, компании ООО «ЦТП», сайт gilev.ru

И хотя Вячеслав Гилёв многократно высказывался о том, что виртуализация — лучший способ замедлить работу 1С, в наших тестовых условиях, когда на сервере используется 1 виртуалка для снятия показаний скорости, различий в скорости с «чистым железом» нет, и более того, под VMware у нас оно работает даже быстрее. Есть мнение, что 1С Предприятие сильно нагружает дисковую подсистему, и для устранения бутылочного горлышка использовал Ramdisk от компании SoftPerfect и сравнил его с самым простым 30-долларовым NVME SSD от компании DEXP на контроллере Phison E12. Разницы по скорости не было, а это лишний раз подтверждает, что для современного сервера приложений скорости типичного NVME накопителя достаточно, чтобы удерживать параметр IOWait на уровне, когда он не влияет на производительность. Другими словами, покупать дорогой RAID-контроллер ради роста производительности приложения уже нет смысла: проще использовать NVME накопители, а освободившийся бюджет направить на более производительный процессор.

На скриншоте выше вы видите типичный вывод результатов «теста Гилева»: очки, набранные вашей системой (столбик слева) сравниваются со значениями, которые по мнению Вячеслава Гилева характеризуют работу сервера, как плохую, удовлетворительную, хорошую или просто замечательную. Тест оценивает не только аппаратную, но и программную составляющую сервера, поэтому для чистоты эксперимента мы использовали все значения программного обеспечения, установленные по умолчанию. Если ваша система набирает в тесте Гилева более 40 очков — вы можете собой гордиться, а мы гордимся тем, что превзошли его максимальную оценку «замечательно».

Гипервизор

VMware ESXi 6.7U3

Клиентская платформа

VM, 8 vCPU, 8 Gb Windows Server 2016 1C Предприятие 8.3.13.1690

Серверная платформа

VM, 32 vCPU, 8 Gb Windows Server 2016 1C Предприятие 8.3.13.1690 сервер Microsoft SQL Server Developer

С настройками по умолчанию в тесте Гилёва на процессорах EPYC 7532 вы получаете оценку «замечательно», и имейте в виду, что тюнинг программной платформы и базы данных может дать вам ещё больше.

Второй тест так же является 1-поточным, но в качестве хранилища данных используется Microsoft SQL Server и сервер 1С Предприятия, установленные на отдельной виртуальной машине на том же хосте. До начала тестирования я убедился, что наибольшие показатели получаются, если выделить каждой виртуальной машине по 32 vCPU. В этом тесте лидирует новый EPYC 7532, и забегая вперёд, скажу что и в других базах данных он раскрыл себя с лучшей стороны.

Многопоточность 1С мы будем измерять с помощью теста Fragster.ru, на 2-уровневой конфигурации «Сервер 1С + сервер SQL». Разработчики поясняют, что мерилом является производительность каждого потока в очках, и значение в 400-500 — это тот нижний порог, при котором работа всё ещё терпима. Учитывая, что речь идёт об одновременных потоках, которые обрабатывает сервер, число пользователей, которые могут быть обслужены данной конфигурацией, может быть и в 4-5 раз больше, в зависимости от структуры работы вашей компании.

Результат говорит сам за себя: для сервера 1С Предприятие лучшим выбором будет EPYC, а не Threadripper, причём вы можете существенно сэкономить, выбрав процессоры первого поколения.

ElasticSearch 7.6.0

Если мы говорим, что 32 ядра нужны для обработки Big Data, то Elastiс — лучший тому пример. Написанный на Java, — этот стек для работы со статистическими данными и логами приложений, является одним из самых востребованных инструментов среди DevOps и Data Science специалистов.

Гипервизор

VMware ESXi 6.7U3

Тестовая виртуалка

VM, 64 vCPU, 30 Gb Ubuntu Linux 18.04 LTS JAVA Runtime 11 ElasticSearch 7.6.0

Из встроенных тестов пакета Rally я выбрал http_logs, поскольку этот тест достаточно большой: 32 Гб данных в развёрнутом виде, и примерно столько же занимают результаты тестирования. За основу измерений мы берём две метрики, первая из которых — добавление документов в индекс.

 

При тестировании в реальных приложениях какие-то результаты, выбивающиеся из общего тренда, просто не поддаются логическому объяснению. Отчасти это вина разработчиков, которые ставят своей целью написать приложение, а не точный бенчмарк. Отчасти, на погрешность влияют накапливающиеся задержки в программном стеке, и если смотреть на задержки, приняв результаты этого же процессора за единицу, то разброс становится просто колоссальным.

Компания AMD постоянно подчёркивает, что новая архитектура процессоров epyc rome даёт до 40% больше скорости в Java приложениях по сравнению с первым поколением epyc, и в тесте range мне есть чем их порадовать: преимущество почти 10-кратное, но явного победителя в битве между новым серверным и старым игровым процессором нет.

Китай догоняет США

Китайский производитель процессоров Loongson готовится к выпуску нового процессора 3A6000, по своим возможностям сопоставимого с чипами компании AMD линейки Ryzen 5000. По данным портала Tom’s Hardware, премьера процессора состоится в первой половине 2023 г., пока без более точной даты.

Для Китая это очень значительный прорыв в «процессоростроении». Ryzen 5000 – это 7-нанометровые процессоры, которые AMD выпустила осенью 2020 г., и которые в настоящее время пользуются спросом во всем мире за счет сравнительно невысокой цены и одновременно хорошей производительности.

Таким образом, китайская Loongson по возможностям своих CPU отстает от AMD менее чем на три года. С одной стороны, это гигантский временной промежуток, с другой – AMD является одним из двух крупнейших игроков в сегментах настольных, мобильных и серверных процессоров, уступая по доле рынка лишь Intel. К тому же работа над чипами Loongson ведется с 2002 г., а AMD была основана в 1969 г.

Loongson развивается невероятно быстро

К слову, скорый выпуск 3A6000 – это повод задуматься еще и для Intel. Как пишет Tom’s Hardware, этот чип может оказаться на уровне Core 11 поколения образца сентября 2020 г., за месяц до премьеры Ryzen 5000. Intel до сих пор производит и продает их.

Выводы

Разные по своей природе приложения показывают совершенно разные результаты, и не всегда комбинация «быстрее/дороже» оказывается лучше. Мы выяснили, что:

  • для протестированных простых малопоточных приложений лучшим выбором является epyc rome 7532, и для аренды vps под 1c — это лучшее решение. Скорее всего, тенденция сохранится и на других программных продуктах с тем же характером нагрузки.
  • — ровно то же самое можно сказать про работу1с Предприятие в связке с сервером MySQL в средней компании на сотню пользователей
  • — в то же время, в многопоточной связке 1C-MSSQL первый Epyc 7531p показывает ту же скорость, что и EPYC Rome 7532, так что здесь можно круто сэкономить

Для баз данных с большим числом подключений Threadripper 2990wx с его высокими частотами подходит лучше, и в приложениях, связанных с big data и machine learning он работает быстре. Новые Epyc-и с увеличенным до 256 мб кэшем третьего уровня устанавливаются в те же материнские платы, что и первые epyc с ядром «неаполь», и всё что вам нужно — это прошить новейший bios. Если у вас уже работает сервер на первом epyc, и вы хотите поменять процессор на epyc rome, то сначала убедитесь, что BIOS с поддержкой ZEN-2 может быть залит именно на вашу материнскую плату, т.к. Первые материнки имели 16-мегабайтный чип ROM, а под новые процессоры нужен 32-мегабайтный. Приобретая платформу под Threadripper для сервера, вы можете взять материнку, которая сделана на той же производственной линии, что и самые серверные в мире платы, у вас будет ecc память и NVME RAID. Для подобных инсталляций, Asrock Rack X399D8A-2T — единственная, а потому самая лучшая покупка.

Ну а что касается психологических барьеров и предрассудков, то я был бы рад вам перечислить, как много вы теряете, выбирая игровой cpu вместо серверного, да кроме официальной поддержки от vmware ничего не могу вспомнить. Предвосхищая вопросы типа «а как же новое поколение threadripper»… Скажу просто: пока что для них нет серверных материнских плат. Как только появятся — обязательно протестируем.

Михаил Дегтярёв (aka LIKE OFF)

16/03.2020

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Союз-Маркет
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: