.

  • 홈
  • CS
  • CS231n
  • 논문리뷰
  • 수학
  • 주저리

2026/02/05 1

[기본이론] Transformer가 단어 하나를 생성할 때 거치는 계산과정

Transformer 구조를 쭉 따라가면서 계산을 해봤다. 'I love deep learning'이라는 문장이 transformer에 들어갔을 때 과정은 아래와 같다.(하트 그릴 정도로 딥러닝을 사랑하지는 않지만 그냥 그려봄) 이후에 삘받아서 설명도 그냥 쭉 써봤다. 1~8이 Encoder 6개 중 1개의 단계이다.그래서 이게 6번 반복되고 또 이게 decoder에 들어가서 decoder 나름의 계산으로 6번 반복된다.이렇게 보니 새삼 계산량이 미쳤다.단어 하나 생성하는데 이렇게 계산을 많이한다고?? 그리고 GPT는 이걸 해낸다고???노예부리듯이 GPT를 부렸던 날들이 생각나면서 GPT에게 조금 미안해졌다너무 구박하지 말아야지 너도 매우 열심히 사는구나덕분에 이런 계산 과정도 이해를 한다 내가 (+ ..

기본기 다지기 2026.02.05
이전
1
다음
더보기
프로필사진

.

잡식성 학습블로그 #AI #CV #GIS #CS #대학원 #논문 #취준

  • 분류 전체보기 (132) N
    • 기본기 다지기 (93)
      • CNN~Attention 구현 (7)
      • Optimization (6)
      • CS231n (10)
      • CS (7)
      • Mathematics for ML (40)
      • PyTorch for DL (0)
      • GIS (5)
      • 코테 오답노트 (13)
    • 논문리뷰 (16) N
    • 주저리 (18)
      • 성적, 자격증 (5)
      • 인턴 및 연구실 생활 기록 (2)
      • 취준 (2)
    • 프로젝트 (5)
      • 챌린지, 경진대회 (1)
      • 토이프로젝트 (3)

Calendar

«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28

최근글과 인기글

  • 최근글
  • 인기글

방문자수Total

  • Today :
  • Yesterday :

Tag

오블완, 최적화, 토이프로젝트, 티스토리챌린지, paperreview, mml, 코테, 선형대수, optimization, Linear Algebra, 파이썬, 논문리뷰, 프로그래머스, cs231n, AI,

Copyright © Kakao Corp. All rights reserved.

티스토리툴바