🤖 r/LocalLLaMAAI KodavimasAtviras Kodas
kv-cache: palaikymas dėmesio sukimui nevienalyčiam iSWA

kv-cache: palaikymas dėmesio sukimui nevienalyčiam iSWA

r/LocalLLaMA·jacek2023·07.04.2026 22:26

Santrauka lietuviškai

Šis pull request įgyvendina kv-cache palaikymą dėmesio sukimui nevienalyčiam iSWA (sliding window attention) algoritme. Funkcionalumas leidžia efektyviai valdyti atminties talpyklą dirbant su kintamo ilgio įvesties sekomis. Įdiegimas optimizuoja resursų panaudojimą ir pagerina modelio našumą apdorojant ilgas teksto sekas.

Originalus pavadinimas

kv-cache : support attention rotation for heterogeneous iSWA by ggerganov · Pull Request #21513 · ggml-org/llama.cpp