#llm
3 posts found

GLM-5.2 - Le nouveau LLM open weights de reference
GLM-5.2 de Z.ai est le nouveau modele open weights de reference sur l'Artificial Analysis Intelligence Index, avec 51 points, licence MIT et contexte de 1M tokens.
June 18, 2026

DeepSeek V4: modele MoE 1,6T avec contexte 1M sur serveur EU
DeepSeek V4 introduit les modeles MoE Pro (1,6T) et Flash (284B) avec un contexte de 1M tokens, une attention hybride et trois modes de raisonnement pour l'UE.
April 24, 2026

TurboQuant: la compression IA de Google qui fonctionne desormais sur CPU
TurboQuant de Google atteint une compression 6x du cache KV sans perte de precision, rendant l'inference IA sur CPU standard viable en production.
April 1, 2026