TechMIDeep learning és matematika: a DeepSeekMath projekt áttörései és a GRPO algoritmus szerepeYannic Kilcher156 napja
TechMIÚjítás a nyelvfeldolgozásban: Byte Latent Transformer és a dinamikus patch-alapú megközelítésYannic Kilcher188 napja
TechMIA nagy nyelvi modellek biztonsági kihívásai és sebezhetőségei az első tokeneken keresztülYannic Kilcher203 napja
TechMIMennyire értenek a matekhoz a nyelvi modellek? Új kutatás az LLM-ek logikai képességeirőlYannic Kilcher254 napja
TechMISzükségünk van-e az új, bonyolult RNN-modellekre, vagy elég a régieket frissíteni?Yannic Kilcher262 napja
TechMIHogyan optimalizáljuk a nyelvi modellek tesztelését: modellméret vs. számítási stratégiaYannic Kilcher268 napja
TechMIAdatvédelmi hátsó kapuk: hogyan szivárogtathatók ki finomhangolt modellekből az adatokYannic Kilcher331 napja
TechMIÚj nyelvi modellek mátrixszorzás nélkül: hatékonyabb lehetőségek és hardveres kihívásokYannic Kilcher357 napja
TechMIMennyire bízhatunk az AI-jogi kutatásokban a hibák és hallucinációk árnyékában?Yannic Kilcher369 napja
TechMIOpenAI botrányok és Scarlett Johansson hangjának jogi ügye a GPT-4o kapcsánYannic Kilcher405 napja