Четверг, 22 апреля 2021 16:30
больше 3 лет назад

Онлайн семинар: Vision Transformers

Online

Организатор: Xperience AI

Участники: 11

Поделиться в

29


За последние несколько лет архитектуры на базе Transformer заняли важное место в задачах обработки естественного языка. Однако использование механизма self-attention в задачах компьютерного зрения ограничено из-за квадратичной сложности данной операции.
Мы рассмотрим основные идеи и трюки, использованные в Vision Transformer (ViT), которые позволяют решать задачу классификации изображений без использования свёрточных слоёв. Также кратко посмотрим на архитектуры, которые используют ViT в таких задачах как детектирование объектов(Swin Transformer) и генерация изображений(TransGAN).
Спикер: Илья Контаев (Deep Learning Engineer, Xperience.AI)

Участники 11

  • Virus Virus
  • Алексей Воробьёв
  • mnorton@mail.ru
  • denispurv@rambler.ru
  • nnreene@mail.ru
  • dmitryzhelonkin@gmail.com
  • Sizonenko Timofey
  • voronin_artem_valerievich@mail.ru
  • Lev Evtodienko
  • Vladimir Loginov
  • Batyrkhan Botaev