구글 BERT의 정석 Ch.1 트랜스포머 입문
트랜스포머 소개 트랜스포머의 인코더 이해하기 셀프 어텐션의 작동 원리 입력 행렬 표현 각 단어의 임베딩 추출 ex) 단어 'I'에 대한 임베딩 $x_1 = [1.76, 2.22, ..., 6.66]$ (1 x 512) 단어 'am'에 대한 임베딩 $x_2 = [7.77, 0.63, ..., 5.35]$ (1 x 512) 입력 행렬(=임베딩 행렬) X ex) 쿼리행렬 $Q$, 키행렬 $K$, 밸류행렬 $V$ 생성 $X\cdot W^Q=Q$ //(3x512) · (512x512) = (3x512) $X\cdot W^K=K$ $X\cdot W^V=V$ * $W^Q, W^K , W^V $는 (512x512) 가중치 행렬로, 처음에 임의 값을 가지며 학습 중에 업데이트 되면서 최적값을 얻음. 셀프 어텐션의 작동 ..
AI+머신러닝+딥러닝/언어AI
2024. 1. 13. 13:45
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 이클립스메모리분석툴
- anaconda설치
- 여러 파일 하나로 합치기
- 인쇄열고정
- graph traversals
- minor GC
- ICPC
- DP
- Divide&Conquer
- ipynb
- 동시설치
- Open ID Connect
- 엑셀
- type명령어
- anaconda2
- SecurityContextPersistenceFilter
- 메모리제한
- 스도쿠
- Python
- Bruteforce
- Note App
- Excel
- Markdown Note
- 인쇄행고정
- backtracking
- SecurityContextRepository
- unreachable object
- dynamic programming
- nbconvert
- greedy
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함