Realaus Laiko Dirbtinio Intelekto Dizaino Vertinimas

kemyd·2·24.02.2026 13:35

Santrauka lietuviškai

Sukurta nauja AI vertinimo sistema, skirta vartotojo sąsajų generavimui, kuri leidžia realiu laiku stebėti, kaip skirtingi modeliai (Anthropic Opus, OpenAI GPT, Google Gemini, Moonshot AI Kimi) kuria tą patį dizainą. Vietoje statinių reitingų ar paruoštų ekrano nuotraukų, sistema pateikia redaguojamus projektus su Tailwind CSS, kuriuos galima eksportuoti į Next.js, Laravel, Symfony, WordPress ar paprastą HTML. Svarbiausia yra ne modelių reitingavimas, o vizualus palyginimas, atskleidžiantis, kad kiekvienas modelis turi savų ypatumų – vieni per daug naudoja apvalkalus, kiti sukuria netikras išdėstymo apribojimus, o Kimi netgi mėgsta kirilicos raides.

Originalus pavadinimas

Show HN: Real-Time AI Design Benchmark