Cerebras представляє 2-й двигун масштабу Gen Wafer: 850 000 ядер, 2.6 трильйони транзисторів

Cerebras представляє 2-й двигун масштабу Gen Wafer: 850 000 ядер, 2.6 трильйони транзисторів

Церебрас повернувся з другим поколінням його вафельного двигуна. WSE 2.0 - На жаль, назва "Син вафельно-масштабу", як видається, помер у комітеті - це 7nm зменшення оригіналу, з набагато більше сердечників, більше оперативної пам'яті та 2,6 трильйону транзисторів, з "Т." Робить 54 мільярди у середньому NVIDIA A100 виглядає трохи пішоходів, за певну цінність "пішохода".

Концепція двигуна вафельного масштабу є простим: замість травлення десятків або сотень чіпів у пластину, а потім упаковує ці процесори або графік для індивідуального перепродажу, чому б не використовувати цілу пластину (або більшу частину пластини, у цьому випадку) Для одного величезного процесора?

Люди випробували цей трюк раніше, без успіху, але це було до того, як сучасні врожайності покращилися до того, де будівництво 850 000 сердечників на шматок кремнію розмір ріжучої дошки був розумною ідеєю. У минулому році церебрас WSE-1 підняв брови, пропонуючи 400 000 сердечників, 18 ГБ на чіп-пам'яті та 9pb / S пропускну здатність пам'яті, з 100pb / S пропускною здатністю тканини через пластину. Сьогодні WSE-2 пропонує 850 000 сердечників, 40 Гб он-чіп SRAM-пам'яті, а також 20pb / s пропускної здатності пам'яті. Загальна пропускна здатність тканини збільшилася до 220pb / s.

Cerebras представляє 2-й двигун масштабу Gen Wafer: 850 000 ядер, 2.6 трильйони транзисторів

Незважаючи на те, що новий WSE-2, безумовно, більший, немає знака, це відрізняється. Покращення першокласного стану є всіма вражаючими, але прибутки є відповідними по всій раті, яка повинна сказати: збільшення кваліфікації Core, що відповідає збільшенню оперативної пам'яті 2,2x, 2,2-х збільшення пропускної здатності пам'яті, а також 2.2x збільшення пропускної здатності тканини. Фактична кількість оперативної пам'яті, пропускна здатність оперативної пам'яті або пропускна здатність тканини, оцінена на основі першої основи, практично ідентична між двома WSES.

Зазвичай, з дизайном другого покоління, як це, ми очікуємо, що компанія зробить деякі зміни ресурсів, або масштабувати певний конкретний аспект дизайну, такий як коригування співвідношень між основними підрахунками, пропускною здатністю пам'яті та загальної оперативної пам'яті. Той факт, що церебрас вирішив масштабувати WSE-1 вгору у WSE-2, не коригуючи жодного іншого аспекту дизайну, передбачає, що компанія спрямована на початкові апаратні засоби, і змогла масштабувати його вгору, щоб задовольнити бажання її клієнтської бази без компромісу або зміна інших аспектів архітектури WSE.

Одним з аргументів Церебраса на користь власних конструкцій є простота масштабування робочого навантаження через єдину WSE, а не намагатися масштабувати через десятки або сотні GPU, які можуть знадобитися, щоб відповідати його продуктивності. Не зрозуміло, наскільки легко адаптувати робочі навантаження до WSE-1 або WSE-2, і, здається, не було багато незалежних орієнтирів, але для порівняння масштабування між WSE-1 або WSE-2 і Еквівалентні картки NVIDIA. Ми б очікували, що WSE-2 має перевагу у масштабування, припускаючи, що відповідне робоче навантаження відповідає характеристикам обох систем однаково, завдяки внутрішньою складністю, щоб ефективно розщеплювати робочу навантаження через все більшу кількість карт акселераторів.

Cerebras не публічно опублікував будь-які орієнтири WSE-1 або WSE-2, порівнюючи її з іншими системами, тому ми все ще перебуваємо у візерунках, наскільки це різновид даних. Однак рухатися з WSE-1 до WSE-2, однак, означає деякий інтерес клієнтів у чіпі.

Читати далі

MIT створює масштабований об'єктив без рухомих частин
MIT створює масштабований об'єктив без рухомих частин

Наука оптики розкривала масштаби і деталі Всесвіту протягом століть. За допомогою правильного шматочка скла ви можете подивитися на далеку галактику або хитаються джгутики на одній бактерії. Але лінзи повинні фокусуватись - вони повинні рухатися. Інженери MIT розробили "металенс", який може змінити спосіб побудови камер і телескопів.

Темна матерія може вирішити таємницю надмасштабного утворення чорного діра
Темна матерія може вирішити таємницю надмасштабного утворення чорного діра

Ця робота все залежить від моделювання, але ми могли б мати засоби перевірки роботи ЮУ експериментально до довгого.

NVIDIA оголошує про масштабування зображень з відкритим вихідним кодом, нові DLSS та безкоштовний інструмен
NVIDIA оголошує про масштабування зображень з відкритим вихідним кодом, нові DLSS та безкоштовний інструмен

Це великий день новин для NVIDIA, оскільки компанія розв'язала заборону оновленого програмного забезпечення, включаючи деякі безкоштовні інструменти.

Новий суперкомп'ютер "Андромеда" у масштабі вафельних церебрів має 13,5 мільйонів ядер
Новий суперкомп'ютер "Андромеда" у масштабі вафельних церебрів має 13,5 мільйонів ядер

Маючи понад тринадцять мільйонів ядер, Андромеда може похвалитися екзафлопом обчислення AI та 120 петфлопами щільного обчислення.