TechMITiDAR: Új megközelítés a nyelvi modellezésben diffúzióval és autoregresszióvalYannic Kilcher15 napja
TechMIÚj szemlélet a generatív nyelvi modellezésben: a Free Transformer és a rejtett változók szerepeYannic Kilcher71 napja
TechMIA Cloudflare új code mode rendszere és a mesterséges intelligencia kihívásai az eszközhívások terénYannic Kilcher84 napja
TechMIMiért nem mindenható az embedding-alapú keresés? Elméleti és gyakorlati korlátok elemzéseYannic Kilcher92 napja
TechMIÚj OpenAI modellek és az AI jelenlegi állapota: szintetikus adatok és „tool calling” képességekYannic Kilcher155 napja
TechMIHogyan befolyásolja a szöveg hossza és szerkezete az LLM-ek teljesítményét?Yannic Kilcher172 napja
TechMIEnergia-alapú transzformerek: új szint a mesterséges intelligencia gondolkodásában és skálázásábanYannic Kilcher176 napja
TechMIDeep learning és matematika: a DeepSeekMath projekt áttörései és a GRPO algoritmus szerepeYannic Kilcher350 napja
TechMIÚjítás a nyelvfeldolgozásban: Byte Latent Transformer és a dinamikus patch-alapú megközelítésYannic Kilcher383 napja
TechMIA nagy nyelvi modellek biztonsági kihívásai és sebezhetőségei az első tokeneken keresztülYannic Kilcher397 napja
TechMIMennyire értenek a matekhoz a nyelvi modellek? Új kutatás az LLM-ek logikai képességeirőlYannic Kilcher449 napja
TechMISzükségünk van-e az új, bonyolult RNN-modellekre, vagy elég a régieket frissíteni?Yannic Kilcher456 napja
TechMIHogyan optimalizáljuk a nyelvi modellek tesztelését: modellméret vs. számítási stratégiaYannic Kilcher463 napja
TechMIAdatvédelmi hátsó kapuk: hogyan szivárogtathatók ki finomhangolt modellekből az adatokYannic Kilcher525 napja
TechMIÚj nyelvi modellek mátrixszorzás nélkül: hatékonyabb lehetőségek és hardveres kihívásokYannic Kilcher552 napja
TechMIMennyire bízhatunk az AI-jogi kutatásokban a hibák és hallucinációk árnyékában?Yannic Kilcher564 napja
TechMIOpenAI botrányok és Scarlett Johansson hangjának jogi ügye a GPT-4o kapcsánYannic Kilcher600 napja