Google EfficientNet предлагает 10-кратное повышение эффективности анализа изображений

Google EfficientNet предлагает 10-кратное повышение эффективности анализа изображений

Google заслужил репутацию выдающихся новых технологий и обновлений искусственного интеллекта в удивительном темпе, и их объявление EfficientNet служит последним примером. Используя свою работу с AutoML, ученые Google применили метод масштабирования, который позволяет повысить эффективность сети в 10 раз.

Компания пишет: «Обычная практика масштабирования моделей заключается в произвольном увеличении глубины или ширины CNN или использовании большего разрешения входного изображения для обучения и оценки. Хотя эти методы улучшают точность, они обычно требуют утомительной ручной настройки и все же часто дают неоптимальную производительность. Что, если вместо этого мы могли бы найти более принципиальный метод увеличения CNN для получения большей точности и эффективности? »

Изображение предоставлено Google
Изображение предоставлено Google

Инженер Google Mingxing Tan объясняет новую разработку:

В отличие от традиционных подходов, которые произвольно масштабируют размеры сети, такие как ширина, глубина и разрешение, наш метод равномерно масштабирует каждое измерение с фиксированным набором коэффициентов масштабирования. На основе этого нового метода масштабирования и недавнего прогресса в AutoML мы разработали семейство моделей под названием EfficientNets, которые превосходят [sic] современную точность с до 10 раз большей эффективностью (меньше и быстрее).

Эти сети хорошо подходят для таких задач, как классификация изображений и распознавание лиц, которые предлагают преимущества для сценариев с высокой нагрузкой, а также использования более точных и эффективных моделей в мобильных технологиях. Как и большинство ИИ в своем роде, EfficientNet использует предварительно обученные CNN (сверточные нейронные сети), предназначенные для выполнения задач, связанных с изображениями, в качестве базовой сети. Эти базовые сети могут извлекать уроки из ряда более обобщенных наборов визуальных данных, что позволяет быстрее создавать более конкретные модели с ограниченными данными обучения.

Хотя стандартный процесс произвольного масштабирования по-прежнему дает функциональные результаты, EfficientNet сначала выполняет поиск в сетке базовой сети, чтобы определить взаимосвязи между различными размерами масштабирования сети (например, шириной и высотой), учитывая при этом как размер модели, так и доступные вычислительные ресурсы. Затем EfficientNet расширяет базовую сеть на основе этой оценки. Результаты первоначального тестирования указывают на более высокий уровень точности и скорости в большинстве случаев.

Изображение предоставлено Google
Изображение предоставлено Google

EfficientNet также продемонстрировал исключительно хорошие результаты благодаря более чем половине из восьми наиболее часто используемых наборов данных изображений, таких как CIFAR-100 (91,7%) и цветы (98,8%). Поскольку этот новый метод может значительно улучшить задачи компьютерного зрения по всем направлениям, Google имеет открытый исходный код EfficientNet с доступом через GitHub.

Учитывая, что модели распознавания изображений имеют репутацию совершающих странные ошибки, EfficientNet может помочь смягчить эту проблему по всем направлениям, поскольку разработчики искусственного интеллекта опираются на последние усилия Google.

Читать далее

Samsung вставляет процессор AI 1,2TFLOP в HBM2 для повышения эффективности и скорости
Samsung вставляет процессор AI 1,2TFLOP в HBM2 для повышения эффективности и скорости

Samsung разработала новый тип процессора в памяти, построенный на базе HBM2. Это новое достижение для разгрузки ИИ, которое может повысить производительность до 2 раз при снижении энергопотребления на 71 процент.

Повышение FPS от Microsoft значительно ускорит старые игры для Xbox
Повышение FPS от Microsoft значительно ускорит старые игры для Xbox

Microsoft представляет новую функцию повышения частоты кадров в определенных играх. В настоящее время FPS Boost распространяется на пять игр, и этой весной появятся новые.

Apple и TSMC намерены перейти на 3-нанометровое производство с повышенным риском к концу 2021 года
Apple и TSMC намерены перейти на 3-нанометровое производство с повышенным риском к концу 2021 года

3-нанометровый узел TSMC готов к выпуску с повышенным риском к концу 2021 года, при этом массовые поставки и Apple в качестве партнера по запуску ожидаются в 2022 году.

GTX 1050 Ti снова едет: бюджетный GPU 2016 года возвращается с нулевыми улучшениями, повышенной ценой
GTX 1050 Ti снова едет: бюджетный GPU 2016 года возвращается с нулевыми улучшениями, повышенной ценой

Это конец Q1 2021. Давайте отметим продолжающуюся не доступность видеокарт, наслаждаясь Relaunch GTX 1050 TI, 4,5-летнего GPU, продаваемая почти в 1,5 раза больше денег, чем в начале.