Išaiškinau didelį talpyklos pakartotinio naudojimo problemą, kuri kyla dėl Qwen 3.5 pokalbių šablono
r/LocalLLaMA·onil_gova·08.04.2026 20:51
Santrauka lietuviškai
Straipsnyje aprašoma, kaip autorius atrado rimtą talpyklos pakartotinio naudojimo problemą, susijusią su Qwen 3.5 modelio pokalbių šablonu. Ši klaida gali sukelti netikėtus rezultatus arba sistemos veikimo sutrikimus. Problema buvo išspręsta atlikus detalią šablono analizę ir pataisius jo konfigūraciją.
Originalus pavadinimas
I tracked a major cache reuse issue down to Qwen 3.5’s chat template
Susijusios naujienos
Atnaujinimas apie Gemma 4 su MTP: Atvirkštinio inžinerijos pastangosGalutiniai Qwen 3.6 balsavimo rezultataiQwen3.5-122B veikia 198 ženklų per sekundę naudojant 2 RTX PRO 6000 Blackwell — biudžetinė sistema, patvirtinti rezultataiNeprisijungęs prie interneto palydovas robotas mano neįgaliam vyrui (su 8GB RAM apribojimais) – ieškau optimizavimo patarimų