AI, Quant 투자 공부

  • 홈
  • 태그
  • 방명록

Daily-Trend-Review

2023/12/23: optimizing your llm in production

hellcat 2023. 12. 23. 07:47

https://huggingface.co/blog/optimize-llm

 

Optimizing your LLM in production

Optimizing your LLM in production Note: This blog post is also available as a documentation page on Transformers. Large Language Models (LLMs) such as GPT3/4, Falcon, and LLama are rapidly advancing in their ability to tackle human-centric tasks, establish

huggingface.co

 

'Daily-Trend-Review' 카테고리의 다른 글

2024/01/02: Transformer inference tricks  (0) 2024.01.02
2023/12/25: Towards 100x Speedup: Full Stack Transformer Inference Optimization  (0) 2023.12.25
2023/12/23: RAG 101  (0) 2023.12.23
2023/12/23: how to make LLMs go fast  (0) 2023.12.23
2023/12/18: Mixtral 8x7B  (1) 2023.12.18

'Daily-Trend-Review'의 다른글

  • 현재글2023/12/23: optimizing your llm in production

관련글

  • 2024/01/02: Transformer inference tricks 2024.01.02
  • 2023/12/25: Towards 100x Speedup: Full Stack Transformer Inference Optimization 2023.12.25
  • 2023/12/23: RAG 101 2023.12.23
  • 2023/12/23: how to make LLMs go fast 2023.12.23
프로필사진

AI, Quant 투자 공부

글쓰기 좋아하는 AI 엔지니어의 AI와 Quant 투자 스터디를 위한 공간

  • 분류 전체보기 (135)
    • AI 동향 (0)
    • AI 알고리즘 (0)
    • Quant 투자기법 (0)
    • 투자의 기본지식 (8)
    • 책리뷰 (2)
    • ML for Algorithmic Trading (0)
    • 신의악수 (1)
    • 개발 TIPS (1)
    • Review-Log (3)
    • Mac 개발환경 (2)
    • Python (2)
    • Daily-Trend-Review (107)
    • 집필 (0)
    • Nonstop (0)

Tag

퀀트투자, QLORA, training, vscode, 강환국, 거인의포트폴리오, ChatGPT, gpt-4, LLaMA-Adapter, State of GPT, transformer, llma, llm, 정채진프로, 삼프로tv, jupyter notebook, Generative-AI, mdd, GPT, etf,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/09   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바