Mindenki ismeri, milyen érzés az, amikor egy ceruzát vagy egy kanalat a kezébe vesz. Az ember számára természetes dolog, hogy fel tudjuk dolgozni azt a milliónyi idegi impulzust, amit a mechanoreceptoraink generálnak a legegyszerűbb mozdulataink kapcsán is. A robotok számára viszont ezek a fajta interakciók korábban elképzelhetetlen komplexitást jelentettek. Ma ez a jég megtörni látszik. És hogy mi lesz ebből?!
A kérdés felettébb izgalmas, ám mielőtt nagyon előre szaladnánk, ismerkedjünk meg egy új fogalommal! Az ún. „generatív világalapmodell” (World Foundation Model - WFM) fizikai AI-rendszerek, például autonóm járművek és robotok fejlesztésének felgyorsítását szolgálja. Erről nemrégiben Jensen Huang, a NVIDIA CEO-ja mesélt a CES-en vállalata Cosmos™ nevű WFM-platformja kapcsán. Huang előadásban ráadásul azt is elárulta, hogy a Cosmost 20 millió órányi olyan videóanyaggal tanították fel, amin kifejezetten fizikai interakció – szerelés, manipuláció, gördülés, járás, futás, ugrálás – látható. Vagyis csupa olyan dolog, ami ahhoz kell, hogy egy numerikus fizikai szimulációból, egy nagyon butított vizualizációból olyan típusú videókat tudjon egy generatív AI készíteni, ami megtévesztésig hasonlít a való világhoz. Az NVIDIA ugyanis ebben látja azt az infrastruktúrát, amivel a fizikai generatív AI-t, s így a jövő robotjait is meg lehet valósítani.
Videókon keresztül kódolják le azt a tudásesszenciát, ami a mozdulatokhoz kapcsolódóan az emberi egyedekben a csecsemőkortól kezdődően szépen fokozatosan kifejlődik, hogy szintetikus adatokon tanuló AI modelleket hozzanak létre – magyarázza Prof. Dr. Galambos Péter, az Óbudai Egyetem innovációkért felelős rektorhelyettese podcast stúdiónkban legfrissebb epizódunk rögzítése alkalmával.
Beke Zoltán: Tehát szintetikusan állítunk elő olyan környezetet, amivel tanítani lehet a fizikai AI-t. Ezek szerint ez a jövő.
Galambos Péter: Volt egy olyan közvélekedés tudományos körökben is évekkel ezelőtt, hogy a szintetikus adatokkal nem lehet jól tanítani, merthogy lényegében nem viszünk be új információt a rendszerbe. Közben viszont eléggé nyilvánvalóvá vált, hogy az önvezető autózásban, a robotikában és még számos olyan megtestesült mesterséges intelligencia környezetben, ami fizikai interakciót céloz, nincs más megoldás. Nem fogunk tudni annyi nem exoskeletonos manipulációval tanító adatot gyártani, hogy aztán azt felvegyük kamerával, tapintó érzékelővel és mindennel. Ez egy végeláthatatlan folyamat lenne. Ehelyett viszont tudjuk azt csinálni, hogy a YouTube-ról meg mindenhonnan nagyon sok millió órányi videóanyagot átszűrünk egy nagy léptékű tanítási folyamaton. Megteremtjük azt a fundamentális modellt, ami a fizikai interakciók vizualitásáról szól, és egy olyan domain randomizációra leszünk képesek, ami hatalmas variabilitással tudja ezeket az alapvetően vizuális inputokat legenerálni. Ott sajnos még mindig nem tartunk, hogy a tapintást is le tudjuk képezni, de azt már tudjuk más kognitív tudomány vizsgálati módszerekből, hogy a vizualitás adja meg a bázisát igazából annak, hogy hogyan létezünk a világban. Minden más sokat hozzátesz, de a vizualitás a lényeg. Ezért lehet például az, hogy a Da Vinci sebészrobotban évtizedekig semmiféle force feedback nem volt, tehát precíz sebészeti beavatkozásokat lehet elvégezni úgy, hogy csak vizuális visszacsatolás van. A robotok is fognak tudni jól működni egy csomó helyzetben, csak kameraképből.
Beke Zoltán: Tehát gyakorlatilag az NVIDIA Cosmos-a olyan szintetikus tanító környezetet hoz létre, amiben a mesterséges intelligenciák meg tudják tanulni, hogy a fizikai valóságban hogyan kell működniük. Vélhetően ezek hatása olyan lesz, mint a ChatGPT esetében a sok milliárdnyi dokumentum elolvasása vagy tanítással való felhasználása, jól értem?
Galambos Péter: Jelentős hátrányból indul a folyamat, de igen, az az NVIDIA állítása, hogy a fizikai AI-nak el fog jönni a ChatGPT-pillanata. Nagyon hamar, nem évtizedek múlva, hanem a belátható időn belül lesz ez, és ez a robotikában fog kicsattanni leginkább.
Beke Zoltán: Hol tart ma a robotika a mozgó, guruló vagy haladó, autonóm eszközökkel?
Galambos Péter: Ez is egy elég komplex kérdés. Jensen Huang azt mondja, hogy vége van annak a korszaknak, hogy zöldmezős beruházásként egy speciális környezetet építsünk a robotok számára, ahogy ezt jelen pillanatban a gyárak többségében tesszük. Ott van mindenkinek a munkahelyén a PC az asztalán, a okostelefon a zsebében,– és ez az eszközrendszer alkalmas arra, hogy „barnamezős” beruházásként erre egy robotikus munkakörnyezetet hozzunk létre. A közutakon ott vannak a hagyományos autók, a hagyományos közlekedési rendszer, minden ki van találva – ehhez sem lehet úgy hozzáállni, hogy valami extra dolgot vigyünk bele! Ergo az önvezető autózás is egy barnamezős robotika kell, hogy legyen, amihez majd Jensen Huang szerint az NVIDIA fogja a megfelelő eszközöket megcsinálni. És aztán a következő fázis: a gyárak, az otthonok világa, a segítő szociális környezetek világa, kórház, idősek otthona és a többi, ahol nem lesz szükség arra, hogy a robotok számára alakítsuk ki a környezetet, vagy a robotok kedvéért másképp alakítsuk ki a környezetet, hanem a meglévő környezetbe kell tudni azoknak a robotoknak mozogni! Fel szoktam tenni a kérdést szakembereknek és hallgatóknak is, hogy miért van szükség az ember alakú robotokra. Hiszen nagyon komplex, egy csomó hibalehetősége van, veszélyeket is rejt magában az, hogy egy nem stabil dologról beszélünk.
Beke Zoltán: Nem egy hatékony konstrukció ránézésre...
Galambos Péter: Nem tűnik egy túl hatékony konstrukciónak. De ha merünk egy nagyot gondolni, akkor lehet, hogy az lesz a megfejtés, hogy tényleg emberszerűnek vagy valamilyen biológiai konstrukcióhoz hasonlónak kell lennie ahhoz, hogy a mi világunkban tudjon jól létezni egy robot. Persze ebben valószínűleg nagyobb fokozatosság lesz, hiszen az ipari rendszerek hatalmas befektetések, és nehezen változnak. Gazdasági szempontból valószínűleg nem lesznek olyan érdekek, hogy gyárak egyik percről a másikra teljesen új technológiákkal szülessenek újjá. A lábakon járó, humanoid robotos világ ma még nem tudja azt a termelékenységet és biztonságot nyújtani, amire az iparnak szüksége lenne. Az a tudás viszont, ami a humanoid hype-on keresztül a robotika sajátja lesz, beépül ennek a mérnöki területnek a centrumába, és használható lesz a hagyományos eszközökkel megvalósuló ipari automatizálásban is. És ez egy szépen előre gördülő, nagyon dinamikus fejlődést feltételez szerintem.
Beke Zoltán: Ezért szerinted nem biztos, hogy a gyárakban humanoid robotok jelennek meg nagy számban, de a humanoid technológia, ami egyébként a robotokban jól működik, részben meg fog jelenni az automatizálásban?
Galambos Péter: Igen. Nagyon nagy erők mozognak annak érdekében, hogy egyre robusztusabbak és gyorsabbak legyenek azok a multimodális neurális hálózatok, amik egy humanoid robot irányításához szükségesek. És ezt a tudást bármikor könnyűszerrel át lehet ültetni egy kamerával felszerelt robotkarba.
Beke Zoltán: Vagy egy AGV-be. Érdekes, hogy még 2021-ben jelentette be Elon Musk, hogy a Tesla elkezdett robotokat gyártani. És ugyanaz a technológia, amivel ők ma már az autonóm működést tesztelik a valós életben, kint az utakon, ugyanaz a technológia fogja működtetni az autonóm robotokat. Jensen is mondott egy nagyon érdekes dolgot: „minden, ami mozog, robot lesz egy napon, és ez már nagyon közeli nap”... Gyakorlatilag a robot és autó közötti a határ az simán lehet, hogy el fog tűnni. Jól értem?
Galambos Péter: Igen, és ez nem újdonság, hanem egy régóta jól látszó folyamatnak az eredménye. A drónokat is ide venném kapásból. A drón is, az önvezető autó is egy nagyon komplex, autonóm ágens, mint gyakorlatilag az összes eszközünk. És tényleg mindenre, mindenre ráfogható az, hogy robot! A fiatalok, a diákjaim már egészen más fogalmi rendszerben gondolkodnak. Nekik már kimondjuk azt, hogy robot, és nem is az jut eszükbe, ami nekünk, akik a gyárakban láttunk először robotot.
Beke Zoltán: Mit kereshetnek a humanoid robotok a gyárakban? Jensen keynote beszédében 12 humanoid robot állt virtuálisan oda a színpadra. Tehát legalább 12 db ilyen gyártó van jelen pillanatban, ugye?
Galambos Péter: Én 14-et számoltam. Biztos, hogy Kínában vannak olyan cégek, amikről még nem hallottunk, vagy nem olyan erős a marketingjük, hogy a CES színpadán megjelenhettek volna, de léteznek és nagyon erősek.
Beke Zoltán: Nem lehet, hogy éppen az fogja segíteni a humanoid robotok bejövetelét, hogy ők tudnak alkalmazkodni a környezethez, és szinte bármely környezetben képesek akár ki is váltani az embereket?
Galambos Péter: De igen, csak ehhez egyfajta kvantumugrás kell, hogy bekövetkezzen… Szerintem arra, amíg fölépül a bizalom és kiszámíthatóvá válik egy ilyen beruházás megtérülése, arra kell még egy kicsit várni. A meghatározó cégek, mint például a FigureAI - akik egy amerikai, kifejezetten humanoid robotok fejlesztésére specializálódott vállalat - azt tűzték ki célul, hogy az elkövetkezendő 30 évben alapjaiban forgatják fel az emberiségnek a munkához való viszonyát. Nem kisebbet állítanak, mint azt, hogy a humán munka az szükségtelenné válik.
Beke Zoltán: Mármint a fizikai.
Galambos Péter: Igen, a fizikai munka. És ez egy elképesztő állítás! Társadalmi meg műszaki, meg minden, szempontból. Brett Adcock, a vállalat vezérigazgatója nagyon ambiciózus kijelentéseket tesz még ezen túl is: ha jól emlékszem, azt mondta az egyik interjúban, hogy ők ma egy hét alatt tudnak legyártani egy robotot. De épít egy gyárat most Kaliforniában, ahol egy év alatt 1000 robotot szeretne legyártani, és a következő 4 évben 100.000 robotot szeretne üzembe helyezni! Ez a FigureAI ambíciója. Jelenleg a BMW gyárakban tesztelik ezeket a robotokat. Egyre több videó jelenik meg arról, hogy hogyan dolgoznak ezek a robotok a gyárban, ami egészen megdöbbentő, és hatására az, aki klasszikus ipari automatizálással foglalkozik, átgondolja az egész szakmaiságát. Mert azt látja, hogy van egy présgép vagy valamilyen lemezösszeállítást fogadó készülékrendszer, és ilyen futurisztikus lények megfogják a lemezeket és beillesztik a készülékbe néhány milliméteres pontossággal! És nem csak hogy beillesztik, hanem látszik a mozdulataikon, hogy azok röptében megkonstruált mozdulatok.
Forrás: images.ctfassets.net/qx5k … =webp&w=3000&q=70
Beke Zoltán: És finomhangoltak is akár.
Galambos Péter: Igen. A műveletvégzés közben igazít, látja, hogy minek kell történnie, és mit kell annak érdekében tenni, hogy az a lemez az pontosan a fészekbe illeszkedjen. A munkafolyamat közbeni tanulás, önfejlesztés működni kezd ezeknél a robotoknál. Kicsit úgy van ez szerintem, mint a Tesla az önvezetéssel: van egy nagyon dinamikus fejlődési szakasz, amikor elképesztően látványos dolgok születnek, és aztán egy picit lelassul a fejlődés. Mert ahhoz, hogy egy ilyen robotot tömegével lehessen beengedni a gyárba, ahhoz nagyon nagy üzembiztonság, és nagyon nagy munkabiztonság kell. És ez lesz szerintem az a kritikus része a fejlődésnek, ami nem is annyira az AI-on múlik, hanem sokkal hagyományosabb dolgokon.
Beke Zoltán: Más autóipari gyárról is lehet tudni, hogy humanoid robotokat tesztel Magyarországon? Milyen információk szivároghattak ki eddig?
Credit: Apptronic (forrás: cdn.prod.website-files.co … ronik-Mercedes-Apollo.jpg)
Galambos Péter: Nagyon kevés megbízható információ szivárog ki erről, valószínűleg explicit hírzárlat övezi ezeknek a robotoknak a tesztjeit. Mégis le lehet vonni azért következtetéseket arról, hogy hogyan állhatnak ezek a tesztek. A FigureAI-t már említettem, de van egy Apptronic nevű cég is, amelyik pedig a Mercedesszel tesztel. És hát ezekről a felvételekről azért az jól kivehető, hogy a munkának a sebessége, termelékenysége még nem tart ott valószínűleg, hogy megtérülésről beszélhessünk, és a robotok megbízhatósága is szerintem még kérdéses. Ezek annyira precíz mechatronikai eszközök, amiknél a hőleadás, a különböző alkatrészek szilárdsága még nem lehet annyira kiforrott, hogy ne legyenek gyakori meghibásodások. Ezeket a gyermekbetegségeket biztosan le kell még küzdeni. Régi vesszőparipám az energiaellátás kérdése a humanoid robotoknál. Ami most bevallott, az az, hogy kétórás üzemidőt tud a legtöbb humanoid. Ez még nem elég ahhoz, hogy 0-24-ben lehessen őket üzemeltetni, még akkor sem, ha egyébként cserélhető az akkumulátor, és ez automatizált folyamatot jelent. Tehát két óránként mindenképp meg kell szakítani a munkavégzést. Ennek is fejlődnie kell valószínűleg.
Beke Zoltán: De hát akkor a humanoid robotok még nem holnap fogják átvenni a feladatokat...
Galambos Péter: Nem, de azért szerintem nagyon óvatosan kell bánni az optimista és a pesszimista jóslatokkal is. Már nem lepődnék meg nagyon, ha megjelenne a piacon egy értelmezhető árú humanoid, amire rá lehet valamilyen gyártási feladatot bízni.
Hallgasd meg a teljes beszélgetést az Ipar 4.0 Backstage podcast csatornáján!
Az AI, robotika, big data, cloud, már napjaink része. De mit hoz a jövő, és milyen hatással van ez a termelő szektorra? Ezzel foglalkozunk az Ipar 4.0 Backstage podcastben, amelyben iparvállalatok kulcsszereplői és szakértők történetei mentén mutatjuk be, hogy merre tart az ipar! Tarts velünk!