'positional encoding' 태그의 글 목록

positional encoding 1

[Transformer] Sinusoidal Positional Encoding

한 번 할 때 제대로 이해해놓기 위한 정리. 다음에 가물가물할 때 다시 볼 수 있도록. class PositionalEncoding(nn.Module): def __init__(self, d_model, max_len=5000): super(PositionalEncoding, self).__init__() pe = torch.zeros(max_len, d_model) position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1) div_term = torch.exp( torch.arange(0, d_model, 2).float() * (-math.log(10000.0) / d_model)..

Deep Learning/Transformer 2025.01.14

MongTae

10950번, 이코테, transformer, positional encoding, 10718번, 백준, multi-head attention, 2884번, 10818번, Gradient Vanishing, working tree, 10172번, 2753번, 10926번, 모델경량화, 모험가길드, 10869번, 10871번, 기울기 소실, 파이썬,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

positional encoding 1

티스토리툴바