2023/05/17: Dr.LLaMA, 100k Context Windows, PaLM2 MEGABYTE (0)	2023.05.17
2023/05/10: LLM Tech Stack, Open LLMs, 8bit MM 등 (0)	2023.05.10
2023/05/03: Autonomous Agents, AI Compute의 높은 비용 등 (0)	2023.05.03
2023/04/22: AI 모델 데이터 문제, StableLM 등 (0)	2023.04.22
2023/4/20: 생성 에이전트 (0)	2023.04.20

현재글2023/05/07: Single GPU로 LLM 추론하기, 효율적인 Transformers 등

AI, Quant 투자 공부

글쓰기 좋아하는 AI 엔지니어의 AI와 Quant 투자 스터디를 위한 공간

GPT, llm, jupyter notebook, LLaMA-Adapter, training, 삼프로tv, etf, 강환국, vscode, llma, State of GPT, QLORA, gpt-4, ChatGPT, 정채진프로, transformer, Generative-AI, 퀀트투자, 거인의포트폴리오, mdd,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

AI, Quant 투자 공부

2023/05/07: Single GPU로 LLM 추론하기, 효율적인 Transformers 등

1. High-throughput Generative Inference of Large Language Models with a Single GPU

2. Deploying Large NLP Models: Infrastructure Cost Optimization

3. What Are Transformer Models and How Do They Work?

4. Efficient Transformers: A Survey

5. HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face

6. Andrej Karpathy's twitter - 최근 opensource LLM ecosystem에 대한 의견

7. Why we should train smaller LLMs on more tokens

8. LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

9. 그림으로 이해하는 스테이블 디퓨전

'Daily-Trend-Review' 카테고리의 다른 글

'Daily-Trend-Review'의 다른글

티스토리툴바