Google frigiver en “GPT-lignende” robotmodel, RT-1

Følgende artikel hjælper dig med: Google frigiver en “GPT-lignende” robotmodel, RT-1

Google har frigivet en ny robotmodel, RT-1, som ligner GPT-modellen, der bruges i dets OpenAI kunstige intelligens-program. Den nye model er designet med Googles andre robotprogrammer, herunder dets førerløse bilprogram, i tankerne. RT-1-modellen præsenteret her er et skridt mod generative AI-modeller inden for robotteknologi. I den virkelige verden kan RT-1 udføre over 700 instruktioner med en succesrate på 97 %.

Google frigiver en "GPT-lignende" robotmodel, RT-1

De seneste fremskridt inden for forskning i maskinlæring (ML), såsom computersyn og naturlig sprogbehandling, er blevet muliggjort af en fælles fælles tilgang, der bruger store, forskellige datasæt og ekspressive modeller. Selvom der har været forskellige forsøg på at anvende denne tilgang til robotteknologi, har robotter indtil videre ikke brugt meget dygtige modeller så meget som andre underområder.

Modellen koder en skriftlig kommando og et sæt billeder som tokens ved hjælp af en forudtrænet FiLM EfficientNet-model, før de komprimeres ved hjælp af TokenLearner. Dette er arkitekturen i RT-1. Transformeren modtager derefter disse og producerer handlingstegn.

Udviklere samlede et betydeligt, varieret datasæt af robotbaner for at udvikle et system, der kunne generalisere til nye opgaver og demonstrere robusthed over for forskellige distraktioner og baggrunde. For at samle 130.000 episoder over 17 måneder indsatte de 13 EDR-robotmanipulatorer, som hver har en 7-frihedsgradsarm, en to-fingers griber og en mobil base. Forskerne brugte menneskelige eksempler opnået ved fjernoperation, og de markerede hver begivenhed med en skriftlig forklaring på kommandoen, som robotten netop havde udført. At plukke og arrangere genstande, åbne og lukke skuffer, få genstande ind og ud af skuffer, placere aflange genstande oprejst, vælte genstande, trække servietter og åbne krukker er blandt de færdigheder på højt niveau, der er inkluderet i datasættet.

Den følgende video viser et par eksempler på PaLM-SayCan-RT1-opgaver med lang horisont i flere egentlige køkkener.

🔥 Anbefalede:  Microsoft vs Google: Tech Giants' strid om fremtiden for søgning bekymrer SEO-professionelle

På alle fire områder yder RT-1 sig væsentligt bedre end baselines og viser exceptionelle niveauer af generalisering og modstandskraft.

RT-1 Robotics Transformer er en actiongenerationsmodel til robotopgaver i den virkelige verden, der er enkel og skalerbar. Det tokeniserer alle input og output og komprimerer dem ved hjælp af en forudtrænet EfficientNet-model med tidlig sprogfusion og en token-elev. RT-1 demonstrerer stærk ydeevne på tværs af hundredvis af opgaver, såvel som omfattende generalisering og robusthed i den virkelige verden.

Lær mere: