일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Transformer
- Attention
- machine learning
- python practice
- pytorch
- NLP
- overfitting
- Set Transformer
- Self-loop attention
- GNN
- neural net
- abstraction
- word2vec
- sentence embedding
- Python
- elif
- deep learning
- sigmoid
- Classificaion
- XOR
- Today
- Total
목록Encoder (2)
Research Notes

Transformer Transformer's contribution 이전의 RNN model이 불가능했던 병렬 처리를 가능하게 함 Attention 개념을 도입해 특정 시점에 집중 Positional Encoding을 사용해 sequential한 위치 정보 보존 masking을 적용해 이전 시점의 값만이 이후에 영향을 미치도록 제한 Transformer 모델 Transformer의 구조 : input sentence를 넣어서 output sentence를 생성해내는 모델. input과 동일한 sentence, input의 역방향인 sentence, 같은 의미의 다른 언어로된 sentence를 만들 수 있음. 이는 train 과정에서 어떤 것을 label로 두고 학습하느냐에 따라 다름. Encoder E..

Transformer는 구글이 발표한 논문인 "Attention is All you Need"에서 나온 모델이며, Encoder-Decoder를 따르면서도 Attention만으로 구현한 모델이며 자연어 처리의 한 획을 그은 개념입니다. 자연어처리(NLP: Natural Language Processing) 분야를 발전시킨 모델이며, BERT 등의 최신 Text 모델에서 기본적으로 사용하는 구조입니다. 이 논문을 읽는 이유: 모델을 Explainable하게 설계할 수 있는 Attention 개념을 공부하여, 이 개념이 적용된 다른 DL(Deep Learning) 알고리즘을 이해하여 응용하기 위함입니다. 기존 자연어처리..