Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

IBM поділився новими деталями щодо його майбутньої телораторської процесора на гарячих чіпсах, а нова мікроархітектура виглядає значним прогресом над старшим Z15. Це буде першим процесорним процесором IBM, побудований за допомогою EUV Samsung та величезного кроку вперед для Samsung, наскільки це демонструє свої відбивні EUV.

Тело IBM - це центральний процесор, що означає, що він працює в дуже іншому обчислювальному середовищі, ніж чіп x86. Обидва мейнфреймі, так і сервер є інтегрованою платформою з великим басейном поблизу DRAM, різними формами прикріпленого зберігання, а також великою кількістю сердечників процесорів, але основні рамки є архітектурою для дуже різних цілей, ніж ваш типовий сервер x86.

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

Mainframes призначені для максимізації пропускної спроможності системи та надійності до ступеня, що сервери X86 не збігаються. Там, де традиційна система X86 перемістилася як велика обробка від прискорювачів, а також в процесор або графічний процесор, магістральними рамками забезпечують широке використання апаратного забезпечення для перевантаження, щоб зберегти КПУ. Мейнфрами підкреслюють пропускну здатність, надмірність та безпеку з функціями, які дозволяють процесорам, що перевозяться, або інші компоненти у способах систем X86 не підтримують. Продуктивність та порівняння функцій між Mainframes and Servers можуть виступати ні до основної частини, або X86 системи залежно від того, що ви намагаєтеся виконати.

Взагалі, основні рамки розгорнуті в середовищах, де вимоги до пропускної спроможності та надійності є високими, недостатність компонентів є неприйнятним, і краще платити за обладнання, яке може витримувати процесор або RAM DIMM невдачу, не збиваючи, ніж потрібно взяти систему офлайн для будь-якої довжини часу. Головна рамки також підтримують реакцію ЦП на дуже високих рівнях навантаження. Вони беруть менше затримки кара, ніж X86 сердечників, і вони жонглюватимуть я / виводу навантаження більш сприятливо.

IBM Telum викладено по-різному, ніж типовий процесор X86, оскільки він має дещо іншу роль у системі, і тому, що основні рамки виділяють ресурси дуже по-різному, ніж типовий сервер.

Тело побудована на 7NM технології і становить 530 кв. Мм. Чіп, як AMD ZEN 2 EPYC з восьми киплетами, і вмирання вводу / виводу, приблизно 592 кв. М мм для киплети та 407 мм кв. Для вмирання. Оскільки EPYC є дезагрегованим чіпом, і система Z використовує контролери від Die для обробки певного завдання, навіть порівнюючи розмір гину трохи складно. Кожна теломація містить восьми сердечників процесорів з SMT2, що увімкнено, на загальну суму 16 ниток на чіп. Ящик з чотирма розетками містить вісім мікросхем у подвійних мікросхем (загальна кількість 64 сердечників), з 2 Гб віртуальним кеш-пам'яті, а чотири ящики можуть бути з'єднані на загальну суму 32 чіпів (256 сердечників / 512 ниток).

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

Тело - це значний від'їзд від попередньої архітектури Z-15 IBM. Z-15 використовується великим кеш-пам'яті, а окремий системний контрольний чіп з лише 12 сердечників на розетку. Не тільки теломальна тело збільшується, що до 16 сердечників, але він також інтегрує нову функціональність померти порівняно з попередніми Z-машинами.

Кожна телеканала має свою власну L1 і 32 Мб L2. Оскільки дані кешу L2, прикріплені до одного сердечника процесора, можуть бути виселені до кешу L2 різного ядра, весь кеш також може функціонувати як 256 Мб "віртуальний" L3 для кожного телемочного чіпа. Аналогічним чином, кеш L2 з чотирьох-гніздового ящика може бути вирішений як 3 Гб віртуальний кеш L4 між усіма чіпсами в ящику. Кеш L2 використовує 320GB / S двонаправлений кільцевий автобус з середньою затримкою всього 12-н. IBM стверджує, що телекомунікація буде працювати вище 5 ГГц, що не є невеликим досягненням для чіпа цього комплексу.

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

Одна нова функція на теломуму, яка також служить для ілюстрації різного підходу IBM, який приймає до чіп-дизайну, на відміну від Intel - це новий двигун AI прискорення. Новий двигун містить 128 оброблювальних плиток, призначених для 8-тобтових операцій FP16 та 32 плитки для 8-способу розрахунків FP32 / FP16, підключеного через шину 600GB / S. Якщо Intel або AMD коли-небудь побудували пристрій AI Acceleration, ми, швидше за все, побачимо, що додана функціональність на основі. Набір інструкцій Intel AVX-512 призначений для збільшення ефективності розрахунку AI, наприклад, і він вбудований у кожний CPU X86. Якщо мікроархітектура пропонує 1 × 512-бітну реєстру за CPU Core, і у вас є 12 ядер, у вас є 12 регістрів. Якщо у вас є 24 ядра, у вас є 24 регістри.

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

IBM AI AUROT, На відміну від цього, однаково адресний з будь-якого CPU Core. Замість цього пристрій AI обслуговує декілька серцевих ядер відразу, без даних, які коли-небудь залишають чіп, він обробляється. Хоча це також буде вірним для інструкцій AVX-512, що працюють на Intel або Future AMD CPU, багато робочих навантажень AI працюють на GPUS сьогодні. Отже, дані, таким чином, витікає з процесора за необхідності, а основні рамки призначені для забезпечення на кожному рівні таким чином, щоб споживачеві та серверні апаратні засоби не є. Зберігання даних на померти є цінним активом у цьому просторі. IBM особливо грає в цю можливість, як вартість додавання для клієнтів, які хочуть запустити фонові завдання, без шкоди для наявності та чуйності.

Нова система IBM Z CPU пропонує 40 відсотків більше продуктивності за роз'єм, інтегрований AI

Є статті, які працюють в обох напрямках, чи можуть X86 серверів можуть замінити IBM Mainframes або навпаки, і обидва заявляють, що кожен розчин може запустити круг навколо іншого. Хоча це може бути правдою, це, здається, найкращим способом рамки порівняння. Основні рамки та типові системи X86 продаються для різних цілей. Вони запускають різні операційні системи, а після десятиліть диференціації вони зосереджуються на доставці вищої продуктивності в конкретних показниках. Якщо вам не потрібна здатність до гарячої заміни процесора та оперативної пам'яті або 99,999999 відсотка до простою часу, основні рамки не можуть бути відповідним рішенням. Якщо вам потрібні ці речі, основний фрагмент може бути найрозумнішим вибором.

Це завжди цікаво, щоб побачити, що працює IBM, навіть якщо він не безпосередньо впливає на ринок X86. Якщо ніщо інше, Z-Systems IBM представляє дорогу, яка не приймається в історії споживчих обчислень, а також тип процесора, який залишився актуальним у світі X86, будучи дуже добре, що він робить. Тело нібито доставляє 40 відсотків збільшення продуктивності, що, ймовірно, відображає зсув від 14 нм до 7 ° С, а також покращену системну архітектуру.

Читати далі

Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel
Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel

AMD продовжує натиск на те, що колись було безперечним торфом Intel.

Intel поширює FUD щодо нібито величезних падінь продуктивності Ryzen 4000 на батареї
Intel поширює FUD щодо нібито величезних падінь продуктивності Ryzen 4000 на батареї

Intel вважає, що представила докази, які заперечують цінність набору продуктів Ryzen 4000 від AMD. Intel помиляється.

Поточні виміри продуктивності x86 порівняно з Apple M1 неправомірні
Поточні виміри продуктивності x86 порівняно з Apple M1 неправомірні

Існує внутрішня різниця між процесорами процесорів x86 та ARM, що ускладнює порівняння продуктивності - і це не помітили в початковій хвилі покриття.

Огляди мобільних RTX 3070 показують варіації продуктивності в іграх
Огляди мобільних RTX 3070 показують варіації продуктивності в іграх

Зараз мобільні RTX 3070 і RTX 3070 Max-Q від Nvidia запускаються в мобільних системах. Карти пропонують високу продуктивність, але гравці повинні порівняти ефективність певних ноутбуків, які вони хочуть придбати, перш ніж натискати на курок.