Samsung вкладає процесор AI 1.2TFLOP у HBM2 для підвищення ефективності та швидкості

Samsung вкладає процесор AI 1.2TFLOP у HBM2 для підвищення ефективності та швидкості

Компанія Samsung оголосила про доступність нової версії Aquabolt. На відміну від типового стрибка тактової частоти або покращення пропускної здатності, яке ви очікуєте, цей новий HBM-PIM може виконувати обчислення безпосередньо на мікросхемі, які в іншому випадку обробляються приєднаним процесором, графічним процесором або FPGA.

PIM розшифровується як «Процесор в пам’яті», і Samsung заслуговує на увагу в цьому. В даний час процесори спалюють величезну кількість енергії, переміщуючи дані з одного місця в інше. Переміщення даних вимагає часу та витрат. Чим менше часу процесор витрачає на переміщення даних (або очікування на іншому мікросхемі для доставки даних), тим більше часу він може витратити на виконання обчислювально корисної роботи.

Розробники процесорів роками вирішували цю проблему, розгортаючи різні рівні кеш-пам’яті та інтегруючи функціональність, яка колись жила у власному сокеті. Як FPU, так і контролери пам'яті колись були встановлені на материнській платі, а не безпосередньо інтегровані в центральний процесор. Чіплети насправді працюють безпосередньо проти цієї тенденції агрегування, саме тому AMD довелося бути обережним, щоб його конструкції Zen 2 і Zen 3 могли підвищити загальну продуктивність, одночасно дезагрегуючи планку процесора.

Якщо зблизити центральний процесор і пам’ять добре, створення елементів обробки безпосередньо в пам’яті було б ще кращим. Історично це було важко, оскільки логіка та DRAM зазвичай будуються дуже по-різному. Samsung, мабуть, вирішила цю проблему, і вона використала можливості HBM для укладання штампів, щоб зберегти доступну щільність пам'яті досить високою, щоб зацікавити клієнтів. Samsung заявляє, що може забезпечити більш ніж вдвічі поліпшення продуктивності при 70-відсотковому зниженні потужності одночасно, без необхідних змін обладнання та програмного забезпечення. Компанія очікує, що перевірка буде завершена до кінця першої половини цього року.

Samsung вкладає процесор AI 1.2TFLOP у HBM2 для підвищення ефективності та швидкості

THG має деякі подробиці про нове рішення HBM-PIM, висвітлене на презентації ISSCC Samsung цього тижня. Новий чіп включає програмований обчислювальний блок (PCU) з тактовою частотою лише 300 МГц. Хост керує PCU за допомогою звичайних команд пам'яті і може використовувати його для обчислення FP16 безпосередньо в DRAM. Сам HBM може працювати як звичайна оперативна пам'ять, так і в режимі FIM (функція в пам'яті).

Включення PCU зменшує загальний обсяг доступної пам’яті, саме тому FIMDRAM (це інший термін, який Samsung використовує для цього рішення) пропонує лише 6 ГБ ємності на стек замість 8 ГБ, які ви отримаєте зі стандартним HBM2. Всі показані рішення побудовані на 20 нм DRAM-процесі.

Samsung вкладає процесор AI 1.2TFLOP у HBM2 для підвищення ефективності та швидкості

У статті Samsung описується дизайн як "DRAM з функціональною пам'яттю (FIMDRAM), який інтегрує 16-широкий механізм множинного обміну даними з однією інструкцією в банках пам'яті і використовує паралельність на рівні банку, щоб забезпечити в 4 рази більшу пропускну здатність обробки, ніж рішення для чіп-пам'яті ".

Samsung вкладає процесор AI 1.2TFLOP у HBM2 для підвищення ефективності та швидкості

Одне питання, на яке Samsung не відповів, - це спосіб боротьби з тепловіддачею, що є основною причиною того, чому історично складно було побудувати логіку обробки всередині DRAM. Це може бути вдвічі складніше з HBM, коли кожен шар укладається поверх іншого. Порівняно низька тактова частота на PIM може бути способом збереження DRAM в прохолоді.

Ми не бачили розгортання HBM для центральних процесорів, незважаючи на Hades Canyon, але кілька високоякісних графічних процесорів від Nvidia та AMD обрали HBM / HBM2 як основну пам’ять. Незрозуміло, чи виграє звичайний графічний процесор від цієї можливості розвантаження або як така функція буде інтегрована у власні вражаючі обчислювальні потужності графічних процесорів. Якщо Samsung може запропонувати покращення продуктивності та потужності, як вона заявляє, для ряду клієнтів, ми, безсумнівно, побачимо, що цей новий HBM-PIM з’явиться у продуктах через рік-два. Покращення продуктивності вдвічі у поєднанні із зменшенням споживання енергії на 70 відсотків є видом переходів літографічного вузла в старі школи, що використовуються для регулярного забезпечення. Не зрозуміло, чи вдасться PIM від Samsung конкретно встигнути, але будь-яка обіцянка про класичне вдосконалення повних вузлів приверне увагу, якщо нічого іншого.

Читати далі

Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет
Бета-тести швидкості Starlink бета-тестують традиційний супутниковий Інтернет

За даними Ookla Speedtest та проаналізованими нашими колегами з PCMag, Starlink відповідає своїм високим вимогам щодо швидкості.

Western Digital змінює свої зареєстровані швидкості руху, щоб відобразити реальність
Western Digital змінює свої зареєстровані швидкості руху, щоб відобразити реальність

Western Digital випустила нові моделі WD Red Plus, щоб виправити попередні повідомлення про неточності щодо швидкості обертання шпинделя на своїх продуктах 8TB-14TB у цій родині.

300 nvidia gpus захопив після високої швидкості човна погоні
300 nvidia gpus захопив після високої швидкості човна погоні

Ми потрапили в "Гонконгські митні органи, що ловлять контрабандистів ГПУ" частиною дефіциту напівпровідника. Не можу чекати, щоб дізнатися, що хтось побудував підводний човен PlayStation 5.

Android чи iOS: хто виграє перемогу у швидкості?
Android чи iOS: хто виграє перемогу у швидкості?

Ookla створила всеосяжну глобальну карту продуктивності між iOS і Android. Подивіться, як складаються два в усьому світі.