A műholdképek régóta lehetőséget adnak arra, hogy a Föld felszínét globális szinten leképezzük, azonban ezek a technológiák korlátozottak voltak a részletesség terén. Különösen a városi környezetekben okozott gondot, hogy csak a tetők voltak jól láthatók, az épületek homlokzatai és utcai részletei rejtve maradtak.
Egy kutatócsoport most új megoldást dolgozott ki e probléma orvoslására: a többnézetes műholdképekből indulnak ki, amelyeket Gaussián-splattálás módszerekkel dolgoznak fel. Azonban a városi utcák szintjén a feldolgozott képek még tele vannak hibákkal és anomáliákkal. Ahelyett, hogy megpróbálnák ezeket a szabálytalanságokat technikailag kijavítani, kreatív lépést tettek: az így létrejött hibás képeket képszintű diffúziós modelleknek (mint például a Flux) adják át, hogy az AI kiegészítse a hiányzó vagy hibás elemeket.
Az eljárás során több különféle változatot generálnak egy adott nézetből, majd ezek konszenzusalapú összeolvasztásával egyre részletesebb, valósághűbb városmodelleket hoznak létre. Ez az iteratív, „curriculum” jellegű tanulás magas szintről indulva fokozatosan halad az utcaszintig, minden lépésben javítva a részletességet és a textúrákat.
Ez a fejlesztés nemcsak kutatási szempontból jelentős, hanem gyakorlati alkalmazásai is lehetnek, például a Google Earth-höz hasonló 3D világmodellezésben vagy akár katonai célú, világszintű 3D térképezési programokban is. Az újdonság lényege, hogy sérült vagy hiányos adatokból is egységes, vizuálisan meggyőző 3D környezeteket állít elő, mindezt utcai szintű fényképezés vagy légi felvétel nélkül.









