Лінус Торвальдс звинувачує Intel у вбивстві пам'яті ECC в споживчих системах
Лінус Торвальдс не задоволений тим, як Intel ставився до підтримки пам'яті коду виправлення помилок (ECC), і він звинувачує кремній-гіганта в тому, що він фактично вбив технологію поза серверами. Пам'ять ECC використовується для лову та виправлення однобітових помилок у пам'яті. Він не може виправити багатобітові помилки, але лише виправлення одного біта може суттєво змінити стабільність системи.
Був час, коли ви могли придбати підтримку ECC на основних наборах мікросхем, але Intel поступово припинила цю можливість на платформах, що не належать до Xeon, кілька років тому. Можливо, 975X був останньою споживчою платформою Intel, яка підтримувала його, і ця сім'я була запущена 15 років тому. Набір мікросхем Xeon 3450 був перехресно сумісним з деякими процесорами високого класу в сімействі Nehalem, але це все ще чіпсет Xeon - не основна частина.
В результаті підтримка ECC у споживчих товарах - і наявність оперативної пам'яті ECC для споживчих товарів - впали зі скелі. Лінус резюмує свою справу в досить обширній публікації, стверджуючи, що продовження наполегливості Роухаммера та той факт, що однобітові помилки ніколи не зникали, щоб оголосити політику Intel ECC "поганою та помилковою". Він насправді бере на себе всю індустрію DRAM, написавши:
Виробники пам'яті стверджують, що це через економію та меншу потужність. А вони брехливі сволоти - дозвольте мені ще раз вказати на те, як ці проблеми існують вже кілька поколінь, але ці ебани із задоволенням продавали зламане обладнання споживачам і заявляли, що це "атака", коли це завжди було “Ми ріжемо кути.
Торвальдс також посилається на численні випадки ядерних "яхт", які, на його думку, можна пояснити апаратною помилкою. Хоча об’єктивні дані про подібні речі важко отримати, у звіті Google про помилки пам’яті за 2009 рік є певні докази того, що він правий, хоча очевидно, що стаття 2009 року може мати обмежену застосовність до оперативної пам'яті DDR4 у 2020 році.
Висновок Google від 2009 року був прямолінійним: "Ми виявили, що частота помилок пам'яті та діапазон частот помилок у різних модулях DIMM (подвійні вбудовані модулі пам'яті) набагато вище, ніж повідомлялося раніше ... Помилки пам'яті не є рідкістю". Команда виявила рівень помилок, який він описує як "порядок вище, ніж повідомлялося раніше".
Вони роблять висновок: "Коди, що виправляють помилки, мають вирішальне значення для зменшення великої кількості помилок пам'яті до керованої кількості невиправлених помилок".
Поточна підтримка AMD з обмеженою вартістю
На папері сімейство Ryzen AMD підтримує ECC неофіційно (Threadripper має офіційну підтримку ECC). Однак, як зазначає Ian Cutress далі в потоці, те, що материнська плата стверджує, що підтримка ECC не означає, що підтримка насправді увімкнена. Ми не часто стикаємося з цією ситуацією, але центральні процесори та материнські плати повідомляють про свої різні набори функцій за допомогою реєстрів, які додатки, такі як CPUID, потім перевіряють, щоб визначити та повідомити, які функції підтримує чіп. Додаток, який претендує на перевірку, щоб переконатись, що певна функція підтримується (SSE, AVX, ECC тощо), може повідомляти лише те, що заявляє ЦП або материнська плата про власну роботу через прапори реєстру. Насправді він не може перевірити, чи існує підтримка, якщо додаток насправді не містить тесту функцій - наприклад, скажімо, невеликий орієнтир, який буквально не може працювати, якщо підтримка AVX не працює.
Оскільки підтримка AMD є неофіційною, це означає, що ніхто не стоїть над виробниками з батогом, щоб переконатися, що вони належним чином реалізують цю функцію, і вони не тестують, щоб переконатися, що ця функція справді працює. Оскільки можна встановити біт для «Підтримує ECC» у реєстрі материнської плати, не використовуючи фактично функціональний ECC, є материнські плати, які стверджують, що підтримують стандарт і, здається, роблять це, якщо сканувати їх за допомогою утиліти, але не фактично впровадити ECC взагалі. Єдиний спосіб гарантувати, що сумісність ECC працює на материнській платі AMD Ryzen, - це запустити утиліту, яка змушує помилку ECC.
Щодо того, чи побачимо ми, що ця функція повернеться до робочих столів Intel або офіційно дебютує для Ryzen, це незрозуміло. Це вимагало б придбання у виробників пам’яті, і невідомо, чи багато людей на ринку ПК спричинять це. Більшість людей купують за ціну, і оскільки ви ніколи не знаєте про збої ПК, яких у вас немає, важко продати людей на вигоду. Знову ж таки, ми побачимо виробників процесорів x86, які стикаються з набагато жорсткішими проблемами ARM протягом наступних 2–5 років, ніж ми коли-небудь бачили раніше. Не дивно, що Intel та / або AMD “перевідкривають” деякі функції, особливо якщо ці функції дозволяють їм заявляти про підвищену стабільність порівняно з попередніми продуктами.
На зображенні представлені зареєстровані модулі DDR4-2133 DIMM. Зареєстровані модулі DIMM часто також підтримують ECC, але можна знайти і буферизовану ECC RAM.
Читати далі
Раджа Кодурі від Intel представить на майбутній конференції Samsung Foundry
Цього тижня Раджа Кодурі від Intel виступить на ливарному заході Samsung - і це не те, що сталося б, якби Intel не мала чого сказати.
Нові відомості про Intel Rocket Lake: Сумісність із зворотною стороною, Xe Graphics, Cypress Cove
Intel опублікувала трохи більше інформації про Rocket Lake та його 10-нм процесор, який було перенесено назад на 14 нм.
Intel випускає нові мобільні графічні процесори Xe Max для творців вмісту початкового рівня
Intel випустила новий споживчий мобільний графічний процесор, але він має дуже конкретний варіант використання, принаймні зараз.
Огляд Ryzen 9 5950X та 5900X: AMD розв’язує Zen 3 проти останніх бастіонів продуктивності Intel
AMD продовжує натиск на те, що колись було безперечним торфом Intel.