Egy új kínai vállalat bemutatott egy innovatív, LongCat Flash Chat nevű MI-modellt, amely egyedülálló módon ötvözi a méretet, a hatékonyságot és a kreativitást. Alapját saját, hatalmas ételkiszállítási adatbázisuk adja, a modell pedig egyedi, szakértőkeverék-architektúrát alkalmaz, ahol mindig csak a legrelevánsabb részlegek aktívak.
A LongCat ikonikus internetes mém, amelyet a modell névadásában is felhasználtak, ezzel utalva a hatalmas paraméterszámra és a játékosságra. A rendszer okosan kezeli a számítási kapacitást: csak akkor aktivál jelentős számú paramétert, amikor tényleg szükség van rá, így gyorsan és hatékonyan működik, például kódgenerálás vagy kreatív szövegalkotás feladataiban is.
A tesztben kiemelkedő kreativitást és utasításkövetést mutatott: képes volt színes, animált rakéta generálására p5.js használatával, vagy sajátos módon oldotta meg a durian, az ellentmondásos kelet-ázsiai gyümölcs népszerűsítésének kérdését. A modell emellett biztonságos válaszokat ad kényes kérdésekben, a többnyelvűségben pedig remekelt – nagy pontossággal fordított számos világnyelvre és kreatív módon készített kulturális jegyzeteket.
Felmerülő témák például: milyen sajátos előnnyel jár, ha egy nem technológiai profilú cég fejleszt mesterséges intelligenciát saját big data alapokon; hogyan valósítható meg a számítási hatékonyság egy sok milliárd paraméteres modell esetén; vagy miként válhatnak ezek a modellek egyre általánosabban hozzáférhetővé szerte Kínában és a világban.










