Daily-Trend-Review 107

24/05/29: MS build 2024

Microsoft CopilotMicrosoft Copilot은 AI 기반의 도우미로, 사용자들이 더 빠르고 효율적으로 작업을 수행할 수 있도록 돕는 다양한 기능을 제공합니다. Copilot은 Microsoft 365, Dynamics 365, Power Platform 등 여러 Microsoft 제품에 통합되어 있으며, 다양한 작업 환경에서 사용자의 생산성을 높이는 데 기여합니다. 다음은 Copilot의 주요 기능과 활용 사례에 대한 설명입니다.### 주요 기능1. **텍스트 생성**   - Copilot은 자연어 처리(NLP) 기술을 활용하여 사용자가 입력한 간단한 지시에 따라 이메일, 보고서, 제안서 등 다양한 문서를 작성할 수 있습니다. 사용자는 몇 가지 키워드나 문장을 제공하기만 하면 Copil..

Daily-Trend-Review 2024.05.29

24/03/31: Transformer math 101

Transformer math 101 Transformer Math 101 We present basic math related to computation and memory usage for transformers blog.eleuther.ai LLM inference - HW/SW Optimizations LLM Inference - HW/SW Optimizations | Notion Linkedin의 원저자(Sharada Yeluri)의 허락을 받아 원문을 번역 및 검수중입니다. tulip-phalange-a1e.notion.site Optimizing your LLM in production Optimizing your LLM in production Optimizing your LLM in pr..

Daily-Trend-Review 2024.03.31

24/03/10: AGI의 정의

LLM inference serives 5 disecting model performance 네 가지 종류의 성능 병목 현상 compute-bound memory bandwidth bound communications bound overhead bound : software-induced limitations 대부문의 처리 시간이 작업 일정을 계획하고 이를 HW에 제출하는데 소요 런타임에 필요한 모든 정보(텐서 데이터 유형, 장치, 호출할 커널)를 명시적으로 지정할 필요가 없는 유연한 언어(python)이나 프레임워크(pytorch)를 사용할 때 오버헤드 바인딩이 발생할 가능성이 높아짐 병목 현상 유형에 따라 지연 시간을 단축하도록 최적화 compute-bound 높은 peak FLOPS의 칩으로 업그레..

Daily-Trend-Review 2024.03.10

24/03/09: Transformer Alternatives

Transfomer Alternatives 더 긴 context가 sub-quadratic을 위한 동기가 아님 transformer는 context size에 강한 제약을 가지고 있지 않지만 context size가 클수록 극단적으로 비쌈 Hyena와 같은 sub-quadratic architecture는 추론과 학습면에서 더 값 쌈 하이브리드 아키텍처의 emergence 하이브리드 아키텍처란 transformer-baed와 state-space으로 레이어를 분리함 당면 과제 중 하나는 많은 하드웨어 커널이 transformer operation에 최적화되었기 때문에 이를 떠나면 완벽하게 많은 것을 잃음 더 높은 속도 = 더 높은 GPU throughput subquadratic architecture ..

Daily-Trend-Review 2024.03.10