Ebben a videóban kézzelfogható példákon és élő bemutatón keresztül ismerhetjük meg, hogyan próbálják a Qwen 3.5-ös modelleket Claude gondolkodásmódjára hangolni desztilláció segítségével. A házigazda részletesen bemutatja a Qwen3.5-9B modellt, amelyet a Claude Opus 4.6-os gondolatmenetének stílusával finomhangoltak.
Közelebbről megismerhető, mi is az a knowledge distillation: a módszer lényege, hogy egy kisebb modellt tanítanak meg követni egy fejlettebb, nagyobb modell gondolati folyamatait, szisztematikus példák segítségével. Különösen a belső, lépésről lépésre történő gondolkodási struktúrát hangsúlyozza a Qwen3.5-9B kiértékelése, ami elválasztja az egyszerű válaszadástól.
Felmerül az izgalmas kérdés, hogy mennyire képes egy ilyen desztillált modell valóban magáévá tenni egy másik modell gondolkodási stílusát. A videó teszteken keresztül mutatja be, hogyan viselkedik az új Qwen3.5-9B különböző problémákban, miközben összehasonlítják az eredetivel és a tanító Claude-ral. Kiemelkedik a modell bizonyos feladatokban mutatott magabiztossága, strukturált gondolkodása, de szóba kerülnek a gyengeségek is, például a kihagyott helyes válaszok vagy a magabiztossággal párosuló téves következtetések.
Az összehasonlítás mellett a videó érinti az etikai kérdéseket is, például a modelldesztillációval kapcsolatos feszültségeket és a nyílt vádakat az egyes fejlesztői csoportok között. Ezek a témák nemcsak a technológia működésére, hanem annak jövőjére és társadalmi vonatkozásaira is ráirányítják a figyelmet.










