A
A
  • Angol
  • Magyar
  • 12 perc

Tencent Hi3 Preview: Az új nyílt forráskódú AI modell bemutatkozik

A Tencent új, nyílt forráskódú mesterséges intelligencia modellje izgalmas kihívásokat és változatos felhasználási lehetőségeket kínál, különösen a kódolás, a kutatási feladatok és a többnyelvű kreativitás területén.

1998-ban egy egyetemi kollégiumi szobából indult a Tencent, mára pedig a világ egyik legnagyobb vállalatává nőtte ki magát, és most piacra dobta legsokoldalúbb, nyílt forráskódú AI modelljét, a Hi3 Preview-t. Ez a modell 295 milliárd paramétert tartalmaz, ám egyszerre csak 21 milliárd paramétert aktivál, így a teljes méretéhez képest hatékonyabban futtatható.

Az új Hi3 Preview lehetővé teszi akár 256 000 token hosszú szövegek kezelését, ami azt jelenti, hogy például teljes szoftver kódbázisokat is képes egyben feldolgozni. Beépített ‘reasoning mode’-ja testreszabható, így különböző feladatoknál alkalmazható különféle gondolkodási szinteken.

Kiemelten érdekes kérdés, hogy miként teljesít a modell valós szoftvermérnöki feladatokban: példaként HTML-ben ant szimuláció generálását, valamint összetett matematikai és tudományos problémák megoldását tesztelik. Érdemes figyelni arra, vajon képes-e a modell megbirkózni a világ legnehezebb matematikai vizsgáival vagy tudományos kérdéseivel úgy, hogy közben nagyobb vetélytársaihoz képest is versenyképes tud maradni.

A bemutató azt is megmutatja, hogyan tud a Hi3 Preview kutatóügynökként viselkedni, például történelmi utakat felgöngyölíteni, vagy személyre szabott kreatív szövegeket írni többnyelvű környezetben. Ezen felül felmerül a kérdés, hogy mennyire megbízható a többnyelvűség terén – különösen ritkábban használt nyelveken – illetve hogyan újul meg a modell a nyelvi kifejezésmódban és a tartalmi kreativitásban.