YouTube разработал свое собственное оборудование для транскодирования видео

YouTube разработал свое собственное оборудование для транскодирования видео

Скорость видео в Интернете взорвалась вверх, в год после года, как и количество видео YouTube, обслуживает в год. К сожалению, CPU и GPU не доставляют рода годовых улучшений производительности, которые они когда-то делали. Столкнувшись со скоростью замедления кремния улучшения кремния и быстро увеличивающихся количества видео, YouTube решил создать собственное блок транскодирования видео или VCU, CodeNamed Argos.

Компания раскрыла свои усилия ARGOS как в блоге, так и в бумаге, в зависимости от того, насколько глубоко в деталях вы чувствуете себя как копание. Согласно YouTube, движущиеся рабочие нагрузки на VCU улучшили эффективность на 20-33x в зависимости от точных отведений потока. Новый чип YouTube предназначен для того, чтобы он был способен транскодированием в одну цель разрешения одновременно или нацеливаться на несколько резолюций одновременно.

Ключевым компонентом энергосбережения YouTube является тот факт, что программные и аппаратные стеки явно разработаны для работы друг с другом. Физическая архитектура системы показана ниже:

YouTube разработал свое собственное оборудование для транскодирования видео

Есть больше кодирования, чем декодируют ядра на каждой итерации ASIC, и более одного ASIC на каждой карте VCU. Это решение было разработано для плотного масштабирования. Транскодирование видео для нескольких выходных резолюций одновременно является частью того, как YouTube достигает своих улучшений эффективности энергопотребления, как оно «обеспечивает эффективное совместное использование контрольных параметров, полученных путем анализа источника (например, обнаружение исчезновения / вспышек)», - в соответствии с компанией. Обработка этих транскодеров параллельно (MOT) очень предпочтительнее делать их по одному за раз (SOT), поскольку он избегает избыточного декодирования. По крайней мере, некоторые из заявленных улучшений энергоэффективности приступят от предотвращения избыточной работы. MOT обычно предпочтительнее SOT, так как он избегает избыточных декодов для той же группы выходов.

YouTube разработал свое собственное оборудование для транскодирования видео

В MOT видео один раз декодируется, масштабирован ко всем целевым разрешениям, а затем кодирован во всех соответствующих целях. YouTube отмечает, что он также разработал ASIC, чтобы иметь возможность обрабатывать несколько мотов и SOTS одновременно для дальнейшего повышения эффективности. Фактический кодировщик предназначен для оборудования кодирования H.264 и VP9 при поиске трех опорных кадров. Он имеет трубопроводную архитектуру, местные справочные магазины для оценки движения, а также могут ускорить кодировку энтропии, но Google Notes Chip «оптимизирован для целей мощности / производительности / площади». Каждый ядро ​​кодировщика способен кодировать 4К на 60FPS в режиме реального времени, с 10 ядрами на asic, а также несколько ASIC на карту.

YouTube уже собирает планы на акселератор следующего поколения, который также может быть способен декодировать AV1 в аппаратном обеспечении. VP9, как правило, считается конкурентом с открытым исходным кодом для HEVC, в то время как AV1 является более продвинутым последующим наблюдением, чтобы обеспечить большую экономию пропускной способности.

ARGOS представляет собой вид проекта, специфичного компанией, мы увидели больше в последние годы, так как Intel изо всех сил пытается улучшить свою производительность процессора, но это не является строго проблемой ЦП. Блоки декодирования GPU, встроенные в Ampere или RDNA2 GPU, четко не специализировались с учетом задачи Youtube. Это тот вид полустранциальной работы, которую можно было теоретически видеть AMD, но AMD, по-видимому, не преследует вне производственных сделок для его IP-адресов всего этого агрессивно. Мы знаем, что компания работает на сделке с Samsung для мобильного графического решения, основанного на Radeon IP, а также партнерам с Sony и Microsoft для консольных игр, но не так много, по крайней мере, не публично.

Десять лет назад Google, Facebook и Amazon начали спокойно революционизировать серверный рынок, оплатив ODMS, чтобы построить серверы для них прямо, а не покупать стандартизированные аппаратные изделия из таких как Dell или HPE. Сегодня эти же компании разработают свой собственный настраивающий кремний для заполнения различных случаев использования облачной промышленности. CPU и GPU по-прежнему доминируют над потребительским пространством, но специализированные ускорители и специально построенные чипсы ползут на предприятии в постоянно растущих числах. Также интересно увидеть YouTube, скорее, не поддерживая HEVC или даже обсуждать будущую поддержку VVC / H.266. Любое избежание этих стандартов, скорее всего, будет связано с роялтингами и лицензионными сбору.

Изображение функции YouTube.

Читать далее

Sony ненавидел идею Crossplay на PS4, просочившихся Docs Show
Sony ненавидел идею Crossplay на PS4, просочившихся Docs Show

Оказывается, Sony, оказывается именно ровно, как враждебным к идее Crossflay, поскольку мы думали, что это было.

Посмотрите вверх: сегодня вечером вы можете увидеть все планеты в нашей солнечной системе
Посмотрите вверх: сегодня вечером вы можете увидеть все планеты в нашей солнечной системе

Вы, наверное, видели схемы Солнечной системы, на которых планеты расположены красивыми, упорядоченными линиями, но на самом деле они часто находятся по ту сторону Солнца от Земли. Мы переживаем период, когда все планеты видны. Просто нужно знать, где и когда смотреть.

Как повысить производительность старых видеокарт
Как повысить производительность старых видеокарт

Поскольку коронавирус разрушает мировую экономику, вы, вероятно, не планируете в ближайшем будущем серьезное обновление графического процессора. Если вы застряли дома на старом оборудовании и вам нужно сэкономить свои копейки, это руководство может помочь вам выжать немного больше производительности из старой видеокарты.

Как работают видеокарты?
Как работают видеокарты?

Графические процессоры критически важны для игр, но как видеокарты делают то, что они делают? Мы подробно рассмотрим четыре основных компонента графического процессора: ядра, обработку текстур и пикселей, пропускную способность памяти и объем памяти.