Model Parallelism

Review-Log

Model Parallelism

hellcat 2023. 10. 3. 08:03

모델 parallelism

Tensor Parallelism

Column Parallelism

Input 텐서: 복사
Weight 텐서: 수직방향으로 분할
내적 후 Concatenation 수행

Row Parallelism

Input 텐서: 수직방향
Weight 텐서: 수평방향으로 분할
내적 후 add 수행

All-Gather와 Scatter 통신 생략하는 방법

Column-Row 순서대로 2개의 Liner 레이어를 연결함 : All-Gather와 Scatter 통신 생략 가능함

Attention 레이어를 Tensor Parallelism

QKV projection: Column 방향으로 병렬화함
Output projection: Row 방향으로 병렬화함
Column-Row 순으로 연결 시 All-Gather와 Scatter 통신 생략 가능함

'Review-Log' 카테고리의 다른 글

FlashAttention: Fast and Memory-Efficient Exact Attentionwith IO-Awareness (0)	2023.04.16
18B 파라미터 GPT 모델을 Single GPU로 학습하기 (Colossal-AI) (0)	2022.05.24

현재글Model Parallelism

AI, Quant 투자 공부

글쓰기 좋아하는 AI 엔지니어의 AI와 Quant 투자 스터디를 위한 공간

vscode, ChatGPT, gpt-4, transformer, etf, mdd, QLORA, 삼프로tv, 퀀트투자, llm, llma, 정채진프로, State of GPT, LLaMA-Adapter, jupyter notebook, Generative-AI, training, GPT, 강환국, 거인의포트폴리오,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

AI, Quant 투자 공부

Model Parallelism

모델 parallelism

Tensor Parallelism

Column Parallelism

Row Parallelism

All-Gather와 Scatter 통신 생략하는 방법

Attention 레이어를 Tensor Parallelism

'Review-Log' 카테고리의 다른 글

'Review-Log'의 다른글

티스토리툴바

Model Parallelism

모델 parallelism

Tensor Parallelism

Column Parallelism

Row Parallelism

All-Gather와 Scatter 통신 생략하는 방법

Attention 레이어를 Tensor Parallelism

'Review-Log' 카테고리의 다른 글

'Review-Log'의 다른글

관련글

티스토리툴바