Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

IBM поделился новыми деталями на предстоящем процессоре Telum в горячих чипах, а новая микроархитектура выглядит значительным продвижением на более чем старше Z15. Это будет первым 7 нм процессором IBM, построенный с использованием EUV Samsung, и огромный шаг вперед для Samsung насколько демонстрируют свои пособия EUV.

IBM Telum - это CPU мэйнфрейма, что означает, что он работает в очень разных вычислительных средах, чем чип X86. Оба мэйнфрейма, так и сервера являются встроенной платформой с большим пулом близлежащих DRAM, различных форм прилагаемого хранения и большого количества ядер CPU, но Mainframes Arcisted для очень разных целей, чем ваш типичный сервер X86.

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Mainframes предназначены для максимизации пропускной способности и надежности системы в определенной степени, которую серверы X86 не совпадают. Там, где традиционная система X86 переместила столько переработки от ускорителей, а в ЦП или графический процессор, основныефреймы откроют широкое использование аппаратного обеспечения разгрузки, чтобы поддерживать доступу CPU. Mainframes подчеркивают пропускную способность, избыточность, а также безопасность с функциями, позволяющими для подключения горячей замены процессоров или других компонентов в виде систем X86 не поддерживают. Производительность и сравнения функций между основнымифрами и серверами могут поддерживать либо мэйнфрейм, либо систему X86, в зависимости от того, что она пытается выполнить.

Вообще говоря, Mainframes развернуты в средах, где требования к пропускной способности и надежности высоки, отказ компонентов недопустимо, и лучше платить за оборудование, которое может выдерживать CPU или RAM DIMM сбой без сбоя, чем при необходимости взять систему в автономном режиме для любой длины времени. Гейнфреймы также поддерживают реагирование процессора на очень высоком уровне нагрузки. Они берут меньше штрафов задержки, чем ядра X86, и они жонглируют оперативные нагрузки ввода / вывода более адроитом.

IBM Telum укладывается по-разному, чем типичный процессор X86, потому что он имеет несколько разную роль в системе, и поскольку Mainframes выделяет ресурсы очень иначе, чем типичный сервер.

Telum построен на 7 нм технологии и составляет 530 кв. Мм. Чип, такой как ZEN 2 EPYC AMD с восемью Chublets и умиранием ввода / вывода, составляет примерно 592 кв. Мм для Chiblets и 407 мм кв. Для умирания ввода-вывода. Поскольку EPYC - это разбивленная чип и система z использует контроллеры вытекания для обработки определенной задачи, даже сравнивая размер умирания немного сложно. Каждый телеум содержит восемь ядер CPU с включенным SMT2, в течение всего 16 потоков на чип. Ящик с четырьмя сокетами содержит восемь фишек в модулях двойных чипов (всего 64 ядра), с виртуальным кешем 2 ГБ, а четыре ящики могут быть подключены в общей сложности 32 чипсы (256 ядер / 512 потоков).

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Telum является значительным отъездом из предыдущей архитектуры IBM Z-15. Z-15 использовал большой кэш-накопитель Off-Die и отдельный чип управления системой с 12 ядрами на гнездо. Разве Telum не только увеличивает это на 16 ядер, но он также интегрирует новые функциональные возможности по сравнению с предыдущими Z-машинами.

Каждый тележка имеет свой собственный L1 и 32 МБ L2. Поскольку данные кэша L2, прикрепленные к одному сердечнику CPU, могут быть выселены в кэш L2 различного ядра, весь кеш может также функционировать как 256 МБ «Виртуальный» L3 для каждого телема. Аналогичным образом, кэш L2 ящика с четырьмя сокетами может быть адресована как 2 ГБ виртуальный кэш L4 между всеми чипами в ящике. Кэш L2 использует двунаправленную кольцевую шину 320 ГБ / с со средней задержкой всего в 12 н. IBM утверждает, что Telum будет работать выше 5 ГГц, что не является небольшим достижением для чипового комплекса.

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Одна новая функция на Telum - которая также служит для иллюстрации другого подхода IBM, принимает к проекту чипов, в отличие от Intel - это новый механизм ускорения AI. Новый двигатель содержит 128 перерабатывающих плиток, предназначенных для операций с 8-сторонами FP16 и 32 плитки для 8-контактных расчетов FP32 / FP16, подключенных через шину 600 ГБ / с. Если Intel или AMD когда-либо построили единицу ускорения AI, мы, скорее всего, увидим, что добавленные функциональные возможности на ядро. Например, набор инструкций Intel AVX-512 предназначен для повышения производительности расчета AI, а также встроен в каждый CPU CPU X86. Если микроархитектура предлагает 1 × 512-битный реестр на CPU Core и у вас есть 12 ядер, у вас есть 12 регистров. Если у вас есть 24 ядра, у вас есть 24 регистрия.

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Устройство IBM AI, напротив, одинаково рассматривается от любого ядра CPU. Вместо этого устройства AI сразу подают несколько ядер CPU, без данных, когда-либо оставляющих чип, он обрабатывается. Хотя это также будет верно для инструкций AVX-512, работающих на Intel или Future AMD CPU, многие рабочие нагрузки AI работают на GPUS сегодня. Следовательно, данные поступают от процессора по необходимости, а Mainframes предназначены для обеспечения безопасности на каждом уровне таким образом, чтобы оборудование для потребителей и серверов не. Сохранение данных на-Die - это ценный актив в этом пространстве. IBM особенно играет в эту возможность в качестве добавления ценностей для клиентов, которые хотят запустить фоновые задачи AI без ущерба для наличия или отзывчивов ЦП.

Новая система IBM Z CPU предлагает на 40 процентов больше производительности на розетку, интегрированные AI

Существуют статьи, которые работают в обоих направлениях на том, могут ли серверы X86 могут заменить IBM Mainframes или наоборот IBM, и оба утверждают, что каждое решение может управлять кругами вокруг другого. Хотя это может быть правдой, это не может быть наилучшим способом сравнения. Майнфрейты и типичные системы предприятия X86 продаются для разных целей. Они управляют разными операционными системами, а после десятилетий дифференцировки они сосредоточены на доставке верхней производительности в конкретных метриках. Если вам не нужна способность к горячей обмене CPU и RAM или 99,999999%% времени, Mainframes может быть не соответствующим решением. Если вам нужны эти вещи, мэйнфрейма может быть самым важным выбором.

Всегда интересно посмотреть, на чем работает IBM, даже если он не влияет на рынок X86 многое. Если больше ничего, Z-система IBM представляет дорогу, не предпринимающую в истории потребительской вычислительной машины, а также тип процессора, который оставался актуальным в мире, доминирующим в X86, будучи очень хорошим в том, что он делает. Telum, предположительно, обеспечивает увеличение на 40 процентов производительности каждого сокета, что, вероятно, отражает смещение с 14:00 до 7 нм, а также улучшенную системную архитектуру.

Читать далее

Обзор MSI Nvidia RTX 3070 Gaming X Trio: производительность 2080 Ti, цены на Pascal
Обзор MSI Nvidia RTX 3070 Gaming X Trio: производительность 2080 Ti, цены на Pascal

Новый RTX 3070 от Nvidia - потрясающий графический процессор по хорошей цене, и MSI RTX 3070 Gaming X Trio хорошо это демонстрирует.

Обзор Ryzen 9 5950X и 5900X: AMD демонстрирует Zen 3 против последних бастионов производительности Intel
Обзор Ryzen 9 5950X и 5900X: AMD демонстрирует Zen 3 против последних бастионов производительности Intel

AMD продолжает натиск на то, что когда-то было бесспорным дерн Intel.

Intel распространяет FUD о якобы огромном падении производительности Ryzen 4000 от батареи
Intel распространяет FUD о якобы огромном падении производительности Ryzen 4000 от батареи

Intel считает, что представила доказательства, опровергающие ценность стека продуктов AMD Ryzen 4000. Intel ошибается.

Текущие измерения производительности x86 и Apple M1 ошибочны
Текущие измерения производительности x86 и Apple M1 ошибочны

Между архитектурами процессоров x86 и ARM существует внутренняя разница, которая затрудняет сравнение производительности - и это не было замечено на первоначальной волне освещения.