#llm

3 posts found

GLM-5.2 - Нова провідна модель з відкритими вагами
aillmopen-sourceglmCloud

GLM-5.2 - Нова провідна модель з відкритими вагами

GLM-5.2 від Z.ai - нова провідна модель з відкритими вагами в індексі Artificial Analysis, з оцінкою 51, ліцензією MIT та контекстом 1M токенів.

DeepSeek V4: модель 1,6T MoE з контекстом 1M токенів
aideepseekllm

DeepSeek V4: модель 1,6T MoE з контекстом 1M токенів

DeepSeek V4 представляє моделі Pro (1,6T) та Flash (284B) MoE з контекстом 1M токенів, гібридною увагою та трьома режимами мислення для самохостингу в ЄС.

TurboQuant: стиснення ШI вiд Google, яке тепер працює на CPU
aicompressionquantizationllmgooglecloud

TurboQuant: стиснення ШI вiд Google, яке тепер працює на CPU

TurboQuant вiд Google досягає 6-кратного стиснення KV-кешу без втрати точностi, роблячи iнференс ШI на звичайних CPU реальнiстю для продакшену.