Zabudnuté heslo?
Prihlásenie

Humanoidi vykonávajú rôzne úlohy zadávané jazykovým rozhraním

Autor:
Roman Mališka
Zverejnené:
6. 6. 2024
Hodnotenie:
Už ste hlasovali.

Robotická spoločnosť 1X s podporou OpenAI zverejnila video s množstvom servisných robotov na kolieskach, ktoré sa bez problémov presúvajú z jednej jednoduchej úlohy na druhú, keď upratujú kancelársky priestor, pričom ich k činnosti prinúti hlasom ovládané rozhranie prirodzeného jazyka.

Spoločnosť Halodi Robotics bola založená v roku 2014 s cieľom vyvinúť univerzálne roboty, ktoré budú pracovať spolu s ľuďmi na pracovisku. Spoločnosť pôvodne sídlila v Nórsku a v roku 2019 zriadila druhú základňu operácií v Kalifornii, kedy prvýkrát odhalila predprodukčný prototyp kolesového humanoida s názvom Eve.

Spoločnosť Halodi sa stala 1X a v roku 2022 sa spojila s OpenAI, „aby spojila robotiku a umelú inteligenciu a položila základy pre stelesnené učenie“. Hoci má spoločnosť v rukách dvojnohého robota a robotické ruky podobné ľudským, zdá sa, že veľká časť vývoja sa momentálne sústreďuje na školenie humanoidného robota Eve, aby bol užitočný na pracovisku, kde roboty „pochopia prirodzený jazyk aj fyzický priestor, takže môžu robiť skutočné úlohy na vašom pracovisku a vo vašom svete.“

Spoločnosť 1X teraz hlási, že bolo vytvorené rozhranie v prirodzenom jazyku, ktoré umožňuje operátorovi ovládať viacero humanoidov pomocou hlasových príkazov, pričom robotický pomocník potom spája množstvo naučených akcií na dokončenie zložitých úloh.

Vo februári spoločnosť oznámila, že sa jej podarilo dosiahnuť pôsobivý krok k autonómnej práci prostredníctvom riadenia činností neurónovou sieťou. 1X pritom poznamenáva, že zlepšenie správania jednej úlohy v rámci relatívne malého viacúlohového modelu by mohlo nepriaznivo ovplyvniť správanie iných úloh v rámci tohto modelu. Toto by sa dalo napraviť zvýšením počtu parametrov, ale na úkor predĺženia tréningového času a pomalšieho vývoja.

Spoločnosť 1X vytvorila hlasom ovládané rozhranie prirodzeného jazyka na reťazenie funkcií s krátkym horizontom naprieč viacerými malými modelmi do dlhších.

Namiesto toho zabudovanie hlasom ovládaného rozhrania prirodzeného jazyka do mixu umožňuje operátorom „reťaziť funkcie s krátkym horizontom naprieč viacerými malými modelmi do dlhších“. Tieto jednoúlohové modely sa potom môžu zlúčiť do cieľových modelov, keď vývoj smeruje k jednotnému modelu s konečným cieľom automatizovať akcie na vysokej úrovni pomocou umelej inteligencie.

„Riadenie robotov pomocou tohto vysokoúrovňového jazykového rozhrania ponúka novú používateľskú skúsenosť so zberom údajov,“ uviedol na blogu Eric Jang zo spoločnosti 1X. „Namiesto používania VR na ovládanie jedného robota môže operátor riadiť viacero robotov pomocou jazyka na vysokej úrovni a nechať politiky na nízkej úrovni vykonávať akcie na nízkej úrovni, aby tieto ciele na vysokej úrovni dosiahli. Pretože akcie na vysokej úrovni sa odosielajú zriedka, operátori môžu dokonca ovládať roboty na diaľku.“

Spoločnosť 1X uvádza, že humanoidi Eve vo videu, ktoré si môžete pozrieť na začiatku článku alebo priamo TU, nie sú ovládaní na diaľku a všetky akcie sú riadené neurónovou sieťou. Ďalším vývojovým krokom bude integrácia modelov v jazyku vízie, ako sú GPT-4o, VILA a Gemini Vision do systému.