Az OpenRouter platformon egy új, eddig ismeretlen nyílt forráskódú nyelvi modell, a Horizon Alpha jelent meg, amelyről sokan úgy vélik, hogy az OpenAI első nyílt forrású modellje lehet. Az alkotó különböző teszteken mutatja be a modell képességeit, például fizikai szimulációban, vizuális felismerésben és kreatív feladatokban.
Az AI-motor rugalmasságát olyan példákon keresztül vizsgálják, mint a dinamikus fizikai objektumok kezelése, térbeli forgatások vizualizációja vagy képértékelési feladatok, ahol egy gyermekkönyv oldalán kellett felismernie szokatlan tárgyakat. Felmerül a multimodalitás kérdése is: a modell egyszerre tud szöveget és képeket is értelmezni, és rendkívül gyorsan válaszol mindkét esetben.
Különféle logikai, kreatív és programozási kihívásokat is megold, például a Tower of Hanoi-rejtvényt vagy különböző programozási feladatokat (például Tetris játék létrehozása, SVG-rajzok generálása). Ugyanakkor bemutatkoznak a modell korlátai is: egyszerű számolási, logikai vagy következtetési hibák, „gotcha” kérdésekre adott válaszai sokszor tévesek lehetnek.
A bemutatott teszteredmények alapján szó esik arról, hogy mennyire „szervilis” (kérdés nélkül kiszolgálja a felhasználót), illetve mennyire kerüli a politikai vagy jogellenes témákat, valamint, hogy tudja-e jelezni saját bizonytalanságát. Összehasonlítva más csúcskategóriás modellekkel (Gemini 2.5 Pro, Claude 4 Opus stb.), a kreatív írás és vizuális feladatok terén kiemelkedő teljesítményt mutat.
Vágóképek, felhasználói visszajelzések és további szakértők véleményei is megjelennek, amelyek új szempontokat kínálnak a modell viselkedésével kapcsolatban, különösen abban, hogy mikor vallja be: nem tud valamit.