Tachyum підвищує $ 25 млн. Для універсального процесора "Швидше, ніж Xeon, менший за ARM"
Стартова компанія Tachyum підняла $ 25 млн. В рамках фінансування серії A для нового дизайну процесорів, який він називає процесором Universal Prodigy. Prodigy нібито швидше в однопоточному коді, ніж Xeon, з меншими ядрами процесора, ніж ARM. Він може бути використаний для моделювання нейронних мереж розміром людського мозку в режимі реального часу. Він перевершує процесори, графічні процесори та ТПУ Google. Він може працювати на 64 ядрах на частоті 4 ГГц, вміщує всього 290 мм2 простору (вдвічі менше, ніж 7-дюймовий дизайн AMD на одному вузлі), підтримує вісім каналів DDR5, 72 PCIe 5.0, 2x 400G Ethernet і має підтримку HBM3.
Сказати, що Tachyum не довів ці претензії, було б заниженим. Стверджуючи, що зможе перевершити Intel або AMD в однопоточній продуктивності або ARM на розмірі фільтрів і енергоефективності, це було б підняття брови в кращих обставинах. Ствердження того, що ми робимо це одночасно з чіпом, якого ви навіть не створили, вимагає кращого докази, ніж ми бачили, щоб цей аргумент серйозно прийняти. Компанія стверджує, що в кінцевому підсумку вона випустить CPU з 128 ядрами на частоті 4 ГГц в одному гнізді з 12x DDR5 контролерами.
Минулого року компанія Hot Chips виступила з презентацією, яка стала публічною; ми відтворили деякі з його слайдів у слайд-шоу нижче.
Копія PR у Tachyum стверджує, що Prodigy скорочує TCO на дата-центр на 4x “через руйнівну апаратну архітектуру та розумний компілятор, який зробив багато частин апаратних засобів, знайдених у типовому процесорі, зайвим. Менше дротів і коротших дротів, завдяки меншому, простішому ядру, перетворюється на набагато більшу швидкість і енергоефективність для процесора.
Відповідно до сесії Q&A після Hot Chips, ці процесори втрачають 40% продуктивності під час роботи коду x86, що здається основною проблемою для всього аргументу "Швидше, ніж Xeon". Компанія стверджує, що “бінарні 4,0 ГГц емуляції все ще перевершують 2,5 ГГц Xeon”, що було б більш проблемою для Intel (або AMD), якщо Xeon 2,5 ГГц представляв певний об'єктивно складний порог продуктивності. Фрази, такі як «Вихід з програмного забезпечення» - це вигадливий спосіб сказати: «Ми вклали всю роботу з досягнення високої продуктивності в компілятор, і ми сподіваємося, що наш компілятор зможе отримати достатню продуктивність, щоб зробити цю роботу». саме ця стратегія з Itanium. Це не спрацювало.
З огляду на це, багато чого про архітектуру Prodigy зараз незрозуміла. Існують аргументи на різних форумах про те, наскільки він нагадує або не нагадує Itanium, або ж його архітектуру слід більш правильно розуміти як VLIW, модифікований VLIW, EDGE або щось інше.
Prodigy Tachyum's, заснований на тому, що ми бачили на сьогоднішній день, дуже довгий на шипіння. Це, мабуть, найкращий паралельний процесор і найкращий послідовний процесор, незважаючи на те, що процесори та графічні процесори виконують дуже різні типи коду. Він може збігатися або перевищувати цінні чіпи Intel, але працює в конвертах потужності та розмірів краще, ніж будь-яке поле ARM або AMD.
Надзвичайні вимоги вимагають надзвичайних доказів. Ми поки що не маємо багато чого з цього.