Az amerikai Acri AI startup egyedi módon próbálja meg kihasználni az open source AI modellek piacát, kiemelve azokat a stratégiákat, amelyekkel lehetséges bevételt generálni nyílt modellekből. A vállalat tapasztalata és eddigi bevételei alapvetően a poszt-tréninghez kötődnek, ügyféligény szerinti testreszabásokkal.
Most azonban új utat választottak: nagyobb teljesítményű, előre tanított, nyílt modelleket fejlesztenek amerikai infrastruktúrán, saját adatkészletekkel. E váltás keretében született meg a Trinity Large modell, amely a jelenlegi nyugati startup környezetben szokatlanul merész vállalkozás: az alapoktól saját bázismodellt tréningelnek, nem csupán finomhangolnak meglévőket.
A bemutató során kiemelt érdeklődést kelt a Trinity Large technológiai felépítése: a kevert szakértői (mixture of experts) architektúra, az extrém sparsity alkalmazása, valamint az, hogy egyszerre viszonylag kevés paraméter aktiválódik. Ez jelentős hatékonyságnövekedést eredményez, amit a videó konkrét benchmarkokkal mutat be a kínai riválisokkal szemben.
A témák között szó esik az amerikai és kínai AI fejlesztési stratégiák különbségeiről, az iparági trendekről, valamint arról, hogy mekkora jelentősége van annak, hogy a cégek maguk trenírozzák meg alapmodelljeiket. Az is felvetődik, hogyan alakítják át a nyílt forráskódú modellek a versenyt, valamint milyen megfelelőségi, jogi és gazdasági szempontok miatt fontos a független, nyugati fejlesztésű megoldás.








