[Vision Transformer] Vision Transformer : AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
드디어 Vision Transformer 를 정리한다..! 요근래 MoE, CoT 등 LLM 분야에서 엄청나게 많은 개념들이 등장하고 있는데, 이 모든 것은 “응용” 이고, 이 빠른 변화에 발 맞추기 위해서는 이론적으로 탄탄히하면 적어도 미끄러지지는 않을 것이다. Vision Transformer 는 Transformer 를 Vision 분야에 적용시킨 첫 모델로, 그 의미가 깊다. 논문을 기반으로 정리해보자.
댓글 남기기