Google EfficientNet предлагает 10-кратное повышение эффективности анализа изображений

Google заслужил репутацию выдающихся новых технологий и обновлений искусственного интеллекта в удивительном темпе, и их объявление EfficientNet служит последним примером. Используя свою работу с AutoML, ученые Google применили метод масштабирования, который позволяет повысить эффективность сети в 10 раз.
Компания пишет: «Обычная практика масштабирования моделей заключается в произвольном увеличении глубины или ширины CNN или использовании большего разрешения входного изображения для обучения и оценки. Хотя эти методы улучшают точность, они обычно требуют утомительной ручной настройки и все же часто дают неоптимальную производительность. Что, если вместо этого мы могли бы найти более принципиальный метод увеличения CNN для получения большей точности и эффективности? »

Инженер Google Mingxing Tan объясняет новую разработку:
В отличие от традиционных подходов, которые произвольно масштабируют размеры сети, такие как ширина, глубина и разрешение, наш метод равномерно масштабирует каждое измерение с фиксированным набором коэффициентов масштабирования. На основе этого нового метода масштабирования и недавнего прогресса в AutoML мы разработали семейство моделей под названием EfficientNets, которые превосходят [sic] современную точность с до 10 раз большей эффективностью (меньше и быстрее).
Эти сети хорошо подходят для таких задач, как классификация изображений и распознавание лиц, которые предлагают преимущества для сценариев с высокой нагрузкой, а также использования более точных и эффективных моделей в мобильных технологиях. Как и большинство ИИ в своем роде, EfficientNet использует предварительно обученные CNN (сверточные нейронные сети), предназначенные для выполнения задач, связанных с изображениями, в качестве базовой сети. Эти базовые сети могут извлекать уроки из ряда более обобщенных наборов визуальных данных, что позволяет быстрее создавать более конкретные модели с ограниченными данными обучения.
Хотя стандартный процесс произвольного масштабирования по-прежнему дает функциональные результаты, EfficientNet сначала выполняет поиск в сетке базовой сети, чтобы определить взаимосвязи между различными размерами масштабирования сети (например, шириной и высотой), учитывая при этом как размер модели, так и доступные вычислительные ресурсы. Затем EfficientNet расширяет базовую сеть на основе этой оценки. Результаты первоначального тестирования указывают на более высокий уровень точности и скорости в большинстве случаев.

EfficientNet также продемонстрировал исключительно хорошие результаты благодаря более чем половине из восьми наиболее часто используемых наборов данных изображений, таких как CIFAR-100 (91,7%) и цветы (98,8%). Поскольку этот новый метод может значительно улучшить задачи компьютерного зрения по всем направлениям, Google имеет открытый исходный код EfficientNet с доступом через GitHub.
Учитывая, что модели распознавания изображений имеют репутацию совершающих странные ошибки, EfficientNet может помочь смягчить эту проблему по всем направлениям, поскольку разработчики искусственного интеллекта опираются на последние усилия Google.
Читать далее

Oppo представляет 10-кратную телеобъективную камеру в стиле перископа
Китайский производитель смартфонов Oppo рассказывает о своей последней установке с тремя камерами, которая, по его утверждению, будет иметь первый в мире 10-кратный телеобъектив на телефоне.