2023/05/17: Dr.LLaMA, 100k Context Windows, PaLM2 MEGABYTE (0)	2023.05.17
2023/05/10: LLM Tech Stack, Open LLMs, 8bit MM 등 (0)	2023.05.10
2023/05/03: Autonomous Agents, AI Compute의 높은 비용 등 (0)	2023.05.03
2023/04/22: AI 모델 데이터 문제, StableLM 등 (0)	2023.04.22
2023/4/20: 생성 에이전트 (0)	2023.04.20

현재글2023/05/07: Single GPU로 LLM 추론하기, 효율적인 Transformers 등

AI, Quant 투자 공부

글쓰기 좋아하는 AI 엔지니어의 AI와 Quant 투자 스터디를 위한 공간

vscode, 강환국, 정채진프로, mdd, 삼프로tv, transformer, LLaMA-Adapter, llma, Generative-AI, GPT, ChatGPT, State of GPT, 거인의포트폴리오, 퀀트투자, etf, gpt-4, QLORA, jupyter notebook, llm, training,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

AI, Quant 투자 공부

2023/05/07: Single GPU로 LLM 추론하기, 효율적인 Transformers 등

1. High-throughput Generative Inference of Large Language Models with a Single GPU

2. Deploying Large NLP Models: Infrastructure Cost Optimization

3. What Are Transformer Models and How Do They Work?

4. Efficient Transformers: A Survey

5. HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face

6. Andrej Karpathy's twitter - 최근 opensource LLM ecosystem에 대한 의견

7. Why we should train smaller LLMs on more tokens

8. LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

9. 그림으로 이해하는 스테이블 디퓨전

'Daily-Trend-Review' 카테고리의 다른 글

'Daily-Trend-Review'의 다른글

티스토리툴바