#llm

3 posts found

GLM-5.2 - Das neue fuhrende Open-Weights-LLM
aillmopen-sourceglmCloud

GLM-5.2 - Das neue fuhrende Open-Weights-LLM

GLM-5.2 von Z.ai ist das neue fuhrende Open-Weights-Modell im Artificial Analysis Intelligence Index, mit 51 Punkten, MIT-Lizenz und 1M Token Kontext.

DeepSeek V4: 1,6T MoE-Modell mit 1M-Kontext auf EU-Server
aideepseekllm

DeepSeek V4: 1,6T MoE-Modell mit 1M-Kontext auf EU-Server

DeepSeek V4 stellt Pro (1,6T) und Flash (284B) MoE-Modelle mit 1M-Token-Kontext, Hybrid-Attention und drei Reasoning-Modi fur EU-Self-Hosting vor.

TurboQuant: Googles KI-Komprimierung lauft jetzt auf der CPU
aicompressionquantizationllmgooglecloud

TurboQuant: Googles KI-Komprimierung lauft jetzt auf der CPU

Googles TurboQuant erreicht 6-fache KV-Cache-Komprimierung ohne Genauigkeitsverlust und macht KI-Inferenz auf normalen CPUs zur Produktionsrealitat.