Google EfficientNet предлагает 10-кратное повышение эффективности анализа изображений

Google EfficientNet предлагает 10-кратное повышение эффективности анализа изображений

Google заслужил репутацию выдающихся новых технологий и обновлений искусственного интеллекта в удивительном темпе, и их объявление EfficientNet служит последним примером. Используя свою работу с AutoML, ученые Google применили метод масштабирования, который позволяет повысить эффективность сети в 10 раз.

Компания пишет: «Обычная практика масштабирования моделей заключается в произвольном увеличении глубины или ширины CNN или использовании большего разрешения входного изображения для обучения и оценки. Хотя эти методы улучшают точность, они обычно требуют утомительной ручной настройки и все же часто дают неоптимальную производительность. Что, если вместо этого мы могли бы найти более принципиальный метод увеличения CNN для получения большей точности и эффективности? »

Изображение предоставлено Google
Изображение предоставлено Google

Инженер Google Mingxing Tan объясняет новую разработку:

В отличие от традиционных подходов, которые произвольно масштабируют размеры сети, такие как ширина, глубина и разрешение, наш метод равномерно масштабирует каждое измерение с фиксированным набором коэффициентов масштабирования. На основе этого нового метода масштабирования и недавнего прогресса в AutoML мы разработали семейство моделей под названием EfficientNets, которые превосходят [sic] современную точность с до 10 раз большей эффективностью (меньше и быстрее).

Эти сети хорошо подходят для таких задач, как классификация изображений и распознавание лиц, которые предлагают преимущества для сценариев с высокой нагрузкой, а также использования более точных и эффективных моделей в мобильных технологиях. Как и большинство ИИ в своем роде, EfficientNet использует предварительно обученные CNN (сверточные нейронные сети), предназначенные для выполнения задач, связанных с изображениями, в качестве базовой сети. Эти базовые сети могут извлекать уроки из ряда более обобщенных наборов визуальных данных, что позволяет быстрее создавать более конкретные модели с ограниченными данными обучения.

Хотя стандартный процесс произвольного масштабирования по-прежнему дает функциональные результаты, EfficientNet сначала выполняет поиск в сетке базовой сети, чтобы определить взаимосвязи между различными размерами масштабирования сети (например, шириной и высотой), учитывая при этом как размер модели, так и доступные вычислительные ресурсы. Затем EfficientNet расширяет базовую сеть на основе этой оценки. Результаты первоначального тестирования указывают на более высокий уровень точности и скорости в большинстве случаев.

Изображение предоставлено Google
Изображение предоставлено Google

EfficientNet также продемонстрировал исключительно хорошие результаты благодаря более чем половине из восьми наиболее часто используемых наборов данных изображений, таких как CIFAR-100 (91,7%) и цветы (98,8%). Поскольку этот новый метод может значительно улучшить задачи компьютерного зрения по всем направлениям, Google имеет открытый исходный код EfficientNet с доступом через GitHub.

Учитывая, что модели распознавания изображений имеют репутацию совершающих странные ошибки, EfficientNet может помочь смягчить эту проблему по всем направлениям, поскольку разработчики искусственного интеллекта опираются на последние усилия Google.

Читать далее

Cyberpunk 2077: CDPR «приносит извинения» за выпуск неработающей игры и предлагает возврат средств
Cyberpunk 2077: CDPR «приносит извинения» за выпуск неработающей игры и предлагает возврат средств

Версия Cyberpunk 2077 для PS4 и Xbox One S настолько плохая, что теперь компания предлагает возмещение. Мы рекомендуем консольным игрокам последнего поколения заняться им, а не ждать.

Sony продает Cyberpunk 2077 и предлагает возмещение; CDPR ввел в заблуждение инвесторов в октябре
Sony продает Cyberpunk 2077 и предлагает возмещение; CDPR ввел в заблуждение инвесторов в октябре

Sony объявила, что уберет Cyberpunk 2077 из PlayStation Store и вернет деньги всем, кто этого захочет. Между тем события прошлой недели доказали, что CD Projekt Red ввела инвесторов в заблуждение относительно состояния игры, когда объявила о последней трехнедельной отсрочке в октябре 2020 года.

Новая плата Beagle Board предлагает двухъядерный RISC-V, предназначенный для приложений AI
Новая плата Beagle Board предлагает двухъядерный RISC-V, предназначенный для приложений AI

Бюджетное оборудование RISC-V уже на подходе, и оно намного более доступно, чем все, что мы видели в прошлом, с достаточной мощностью процессора, чтобы любитель мог бы что-то с ним сделать. Более поздние модели могут конкурировать с такими чипами, как Raspberry Pi, хотя, вероятно, по более высокой цене.

В просочившейся записке LG предлагает уйти с рынка смартфонов
В просочившейся записке LG предлагает уйти с рынка смартфонов

В служебной записке, распространенной в LG, говорится, что после 4,5 миллиардов долларов убытков за последние пять лет необходимо принять несколько трудных решений. В меморандуме перечислены несколько возможных вариантов действий, в том числе прекращение мобильного бизнеса LG.