Yannic Kilcher

Nvidia Spark alapú mesterséges intelligencia a mindennapi tévedések javítására

Yannic Kilcher37 napja

TiDAR: Új megközelítés a nyelvi modellezésben diffúzióval és autoregresszióval

Yannic Kilcher106 napja

Titans modell: újrafogalmazott memória a gépi tanulásban

Yannic Kilcher119 napja

Új szemlélet a generatív nyelvi modellezésben: a Free Transformer és a rejtett változók szerepe

Yannic Kilcher162 napja

A Cloudflare új code mode rendszere és a mesterséges intelligencia kihívásai az eszközhívások terén

Yannic Kilcher175 napja

Miért nem mindenható az embedding-alapú keresés? Elméleti és gyakorlati korlátok elemzése

Yannic Kilcher183 napja

Új OpenAI modellek és az AI jelenlegi állapota: szintetikus adatok és „tool calling” képességek

Yannic Kilcher246 napja

Hogyan befolyásolja a szöveg hossza és szerkezete az LLM-ek teljesítményét?

Yannic Kilcher263 napja

Energia-alapú transzformerek: új szint a mesterséges intelligencia gondolkodásában és skálázásában

Yannic Kilcher267 napja

Hogyan működik belülről az Anthropic Claude 3.5 Haiku nyelvi modell?

Yannic Kilcher344 napja

Hogyan gondolkodnak a nagy nyelvi modellek belülről?

Yannic Kilcher372 napja

Deep learning és matematika: a DeepSeekMath projekt áttörései és a GRPO algoritmus szerepe

Yannic Kilcher441 napja

Minecraft és mesterséges intelligencia: ünnepi élő stream vitákkal

Yannic Kilcher472 napja

Újítás a nyelvfeldolgozásban: Byte Latent Transformer és a dinamikus patch-alapú megközelítés

Yannic Kilcher474 napja

A nagy nyelvi modellek biztonsági kihívásai és sebezhetőségei az első tokeneken keresztül

Yannic Kilcher488 napja

TokenFormer: egy új megközelítés a Transformer skálázhatóságára

Yannic Kilcher505 napja

Mennyire értenek a matekhoz a nyelvi modellek? Új kutatás az LLM-ek logikai képességeiről

Yannic Kilcher540 napja

Szükségünk van-e az új, bonyolult RNN-modellekre, vagy elég a régieket frissíteni?

Yannic Kilcher547 napja

Hogyan optimalizáljuk a nyelvi modellek tesztelését: modellméret vs. számítási stratégia

Yannic Kilcher554 napja

Adatvédelmi hátsó kapuk: hogyan szivárogtathatók ki finomhangolt modellekből az adatok

Yannic Kilcher616 napja

Új nyelvi modellek mátrixszorzás nélkül: hatékonyabb lehetőségek és hardveres kihívások

Yannic Kilcher643 napja

Mennyire bízhatunk az AI-jogi kutatásokban a hibák és hallucinációk árnyékában?

Yannic Kilcher655 napja

xLSTM: A régi LSTM-ek újragondolása a modern technológiával

Yannic Kilcher680 napja

OpenAI botrányok és Scarlett Johansson hangjának jogi ügye a GPT-4o kapcsán

Yannic Kilcher691 napja