A
A

Csak YouTube-on nézhető meg

  • Angol
  • Magyar
  • 10 perc

Qwen 3.5 és Claude találkozása: Amikor a mesterséges intelligencia újragondolja a gondolkodást

A Qwen3.5-9B modell finomhangolásán keresztül betekintést nyerhetünk abba, hogyan próbálják elérni, hogy egy AI gondolkodása egy másik modellre hasonlítson, mindezt éles példákkal és izgalmas tesztekkel szemléltetve.

Ebben a videóban kézzelfogható példákon és élő bemutatón keresztül ismerhetjük meg, hogyan próbálják a Qwen 3.5-ös modelleket Claude gondolkodásmódjára hangolni desztilláció segítségével. A házigazda részletesen bemutatja a Qwen3.5-9B modellt, amelyet a Claude Opus 4.6-os gondolatmenetének stílusával finomhangoltak.

Közelebbről megismerhető, mi is az a knowledge distillation: a módszer lényege, hogy egy kisebb modellt tanítanak meg követni egy fejlettebb, nagyobb modell gondolati folyamatait, szisztematikus példák segítségével. Különösen a belső, lépésről lépésre történő gondolkodási struktúrát hangsúlyozza a Qwen3.5-9B kiértékelése, ami elválasztja az egyszerű válaszadástól.

Felmerül az izgalmas kérdés, hogy mennyire képes egy ilyen desztillált modell valóban magáévá tenni egy másik modell gondolkodási stílusát. A videó teszteken keresztül mutatja be, hogyan viselkedik az új Qwen3.5-9B különböző problémákban, miközben összehasonlítják az eredetivel és a tanító Claude-ral. Kiemelkedik a modell bizonyos feladatokban mutatott magabiztossága, strukturált gondolkodása, de szóba kerülnek a gyengeségek is, például a kihagyott helyes válaszok vagy a magabiztossággal párosuló téves következtetések.

Az összehasonlítás mellett a videó érinti az etikai kérdéseket is, például a modelldesztillációval kapcsolatos feszültségeket és a nyílt vádakat az egyes fejlesztői csoportok között. Ezek a témák nemcsak a technológia működésére, hanem annak jövőjére és társadalmi vonatkozásaira is ráirányítják a figyelmet.