Daily-Trend-Review

2023/12/18: Mixtral 8x7B

hellcat 2023. 12. 18. 09:09

https://mistral.ai/news/mixtral-of-experts 

 

Mixtral of experts

A high quality Sparse Mixture-of-Experts.

mistral.ai

 

Total Parameteters : 46.7B

실제 토큰 생성 시 활성화되는 파라미터는 12.9B

 

Perfromance

벤치마크 결과, LLaMA2 70B과 GPT-3.5에 비해 더 좋은 성능을 보여준다.