Четверг, 22 апреля 2021 16:30больше 3 лет назад
Онлайн семинар: Vision Transformers
Online
Организатор: Xperience AI
Участники: 11
Поделиться в
29
Используется сторонняя регистрация. После клика вы будете перенаправлены на другой сайт, не пугайтесь.
За последние несколько лет архитектуры на базе Transformer заняли важное место в задачах обработки естественного языка. Однако использование механизма self-attention в задачах компьютерного зрения ограничено из-за квадратичной сложности данной операции.
Мы рассмотрим основные идеи и трюки, использованные в Vision Transformer (ViT), которые позволяют решать задачу классификации изображений без использования свёрточных слоёв. Также кратко посмотрим на архитектуры, которые используют ViT в таких задачах как детектирование объектов(Swin Transformer) и генерация изображений(TransGAN).
Спикер: Илья Контаев (Deep Learning Engineer, Xperience.AI)