Egy izgalmas technológiai kísérlet során három új M5 Max MacBook Pro-t kötnek össze Thunderbolt 5 kábelekkel egy fürtbe, hogy együtt futtassanak hatalmas, több százmilliárd paraméteres nyelvi modelleket. Kiderül, hogyan lehet két vagy három különálló gép számítási kapacitását egyesíteni, amikor egyetlen gép már nem bírja el ezeket a feladatokat, és milyen előnyökkel vagy korlátokkal jár ez a megközelítés.
Bemutatásra kerülnek különböző mesterséges intelligencia modellek, köztük a Quen, GLM és Llama, valamint azok terhelése különböző MacBook-kombinációkon. Felmerülnek kérdések a fürtözés megvalósításához szükséges szoftveres környezetről, mint például az MLX vagy az Exo, illetve a használt párhuzamosítási stratégiákról – tensor vagy pipeline parallelism –, amelyek eltérően működtethetők és különböző kihívásokkal járnak.
Az összehasonlítás arra is fókuszál, hogy mennyivel gyorsabb egy M5 Max fürt a korábbi M3 Ultra Mac Studio-khoz képest, és milyen szoftveres és hardveres trükkök kellenek a maximális teljesítmény kiaknázásához. Kiderül az is, meddig skálázható egy ilyen fürt, és mi történik, ha a modell mérete túllépi a rendelkezésre álló memóriát.
Az egész bemutató nem csak a gépi tanulás szempontjából izgalmas, hanem felvet olyan kérdéseket is, mint hogy mikor érdemes új hardvert vásárolni, vagy mik a jelenlegi Apple gépek reális határai. Kísérleti úton mutat be kevéssé ismert architekturális elveket és azok gyakorlati eredményeit, így a géprajongók és fejlesztők számára is hasznos gondolatokat ébreszt.










