🤖 r/LocalLLaMAAI News AI Kodavimas Atviras Kodas

Gemma 4 31B GGUF kvantizacijos vertinamos pagal KL divergenciją (unsloth, bartowski, lmstudio-community, ggml-org)

r/LocalLLaMA·oobabooga4·07.04.2026 15:16

Santrauka lietuviškai

Straipsnyje pateikiamas Gemma 4 31B modelio GGUF kvantizacijų palyginimas pagal KL divergencijos metriką. Vertinami keturi skirtingi kvantizacijos variantai, kuriuos sukūrė unsloth, bartowski, lmstudio-community ir ggml-org bendruomenės. Analizė leidžia nustatyti, kuris kvantizacijos metodas išsaugo daugiausia pradinio modelio informacijos, o tai ypač svarbu efektyviam modelio naudojimui su ribotais ištekliais.

Originalus pavadinimas

Gemma 4 31B GGUF quants ranked by KL divergence (unsloth, bartowski, lmstudio-community, ggml-org)

💬 Reddit diskusija ↗

Susijusios naujienos

Daugiau nereikia debesijos LLM greitam interneto tyrimui Atnaujinimas apie Gemma 4 su MTP: Atvirkštinio inžinerijos pastangos Galutiniai Qwen 3.6 balsavimo rezultatai Qwen3.5-122B veikia 198 ženklų per sekundę naudojant 2 RTX PRO 6000 Blackwell — biudžetinė sistema, patvirtinti rezultatai

Dalintis

𝕏 Twitter LinkedIn