A
A
  • Angol
  • Magyar
  • 9 perc

Cohere Command A+ modell: újítások, erősségek és kihívások

A Cohere Command A+ nevű új, nagyméretű nyelvi modelljét vizsgálja a videó, kiemelve a legfontosabb fejlesztéseket, erősségeket és hiányosságokat.

A Cohere új, nagy nyelvi modellje, a Command A+, jelentős paraméterezéssel érkezett, hiszen 218 milliárd paramétert tartalmaz, ám egyszerre csak 25 milliárdot aktivál. Ezzel a fejlesztők az ún. ‘mixture of experts’ architektúrát alkalmazzák, amely hatékonyabb működést tesz lehetővé.

Ez a modell már 128 ezer szavas kontextusablakkal bír, képes szöveg- és képalapú inputok feldolgozására, emellett 48 nyelvet támogat – dupláját az elődjének. A teljesítményét tesztelve főként a többnyelvűség és a viszonylag erős érvelési képességek emelhetők ki. Kódgenerálás terén azonban még akadnak hiányosságok, mivel a kimenet gyakran használhatatlan vagy zavaros.

Külön érdekesség, hogy a matematikai kézírás felismerése és a vizuális feladatok során magabiztosan dolgozik, ám sokszor túl óvatos, amikor bizonytalan egy válaszban. Hasznos, strukturált elemzéseket tud adni adatábrázolásokra vagy trendekre, de a logika néha inkább leíró jellegű, nem igazán hoz meglepő vagy eredeti meglátásokat. Érdekes kérdés, hogy egy ekkora modell vajon elegendő-e a mai elvárásokhoz, vagy más szereplők – például a Claude vagy a DeepC – jobban teljesítenek, főleg a stratégiai következtetésekben.