#llm
3 posts found

GLM-5.2 - Нова провідна модель з відкритими вагами
GLM-5.2 від Z.ai - нова провідна модель з відкритими вагами в індексі Artificial Analysis, з оцінкою 51, ліцензією MIT та контекстом 1M токенів.
June 18, 2026

DeepSeek V4: модель 1,6T MoE з контекстом 1M токенів
DeepSeek V4 представляє моделі Pro (1,6T) та Flash (284B) MoE з контекстом 1M токенів, гібридною увагою та трьома режимами мислення для самохостингу в ЄС.
April 24, 2026

TurboQuant: стиснення ШI вiд Google, яке тепер працює на CPU
TurboQuant вiд Google досягає 6-кратного стиснення KV-кешу без втрати точностi, роблячи iнференс ШI на звичайних CPU реальнiстю для продакшену.
April 1, 2026