Gemma 4 31B GGUF kvantizacijos vertinamos pagal KL divergenciją (unsloth, bartowski, lmstudio-community, ggml-org)

Gemma 4 31B GGUF kvantizacijos vertinamos pagal KL divergenciją (unsloth, bartowski, lmstudio-community, ggml-org)

r/LocalLLaMA·oobabooga4·07.04.2026 15:16

Santrauka lietuviškai

Straipsnyje pateikiamas Gemma 4 31B modelio GGUF kvantizacijų palyginimas pagal KL divergencijos metriką. Vertinami keturi skirtingi kvantizacijos variantai, kuriuos sukūrė unsloth, bartowski, lmstudio-community ir ggml-org bendruomenės. Analizė leidžia nustatyti, kuris kvantizacijos metodas išsaugo daugiausia pradinio modelio informacijos, o tai ypač svarbu efektyviam modelio naudojimui su ribotais ištekliais.

Originalus pavadinimas

Gemma 4 31B GGUF quants ranked by KL divergence (unsloth, bartowski, lmstudio-community, ggml-org)