Az utóbbi időszakban új, fejlett karakter- és tárgy-referencia funkciók jelentek meg a két ismert mesterséges intelligencia-alapú képgenerátorban, a Midjourney-ben és a Runway-ben. Ezek a frissítések lehetővé teszik, hogy képeken keresztül pontosabb karakter- vagy tárgyazonosítás és -megjelenítés történjen az alkotásokban.
A tartalom kiemelten foglalkozik a Midjourney omni reference nevű funkciójával, amely ugyan még nem teljesen omni, hiszen jelenleg csak egyetlen referenciakép használható. A semleges háttér és különböző súlyértékek beállítása alapvető fontosságú ahhoz, hogy a generált képek minél inkább megfeleljenek az elvárásoknak. Érdekes kérdések merülnek fel a karakterek következetes visszaadásáról, a plasztikusságról vagy a stílusreferenciák változtatásáról.
Emellett szó esik a Runway referenciaszolgáltatásáról is, különféle tippekkel – például címkártyák, akciójelenetek vagy időbélyeges képszekvenciák létrehozásáról. A videó demonstrálja, hogyan használhatók ezek a rendszerek akár együtt is, különös tekintettel arra, amikor egy karaktert több eszköz kombinálásával jelenítenek meg különféle stílusban.
Bemutatásra kerül egy új nyílt forráskódú videómodell is, amely gyorsabb és szerteágazóbb lehetőségeket kínál akár hétköznapi gépeken is. Külön hangsúly kerül a közösség számára hasznos trükkökre, valamint az együttműködés szerepére az AI-eszközök használatában.