Show HN: Didelių kalbos modelių haliucinacijų aptikimas per geometrinį dreifą (0.9 AUC, 1% papildomos apkrovos)

yubainu·1·24.02.2026 17:59

Santrauka lietuviškai

Sukurtas SIB-ENGINE – realaus laiko haliucinacijų aptikimo sistema, kuri stebi didelių kalbos modelių vidinę struktūrą, o ne išvesties turinį. Sistema veikia stebėdama geometrinį dreifą paslėptose būsenose generacijos metu, identifikuodama latentinės erdvės struktūrinį žlugimą prieš pirmą neteisingą žetoną. Metodas pasižymi minimalia 1% skaičiavimo apkrova, veikia vartotojų įrangoje ir yra kalbai nepriklausomas bei privatumą saugantis. Sistema gali sustabdyti generavimą realiuoju laiku, kai aptinkamas struktūrinis nestabilumas.

Originalus pavadinimas

Show HN: Detect LLM hallucinations via geometric drift (0.9 AUC, 1% overhead)