Umelá inteligencia na vývoj softvéru vytvára a trénuje svoje vlastné klony

Autor:: Roman Mališka
Zverejnené:: 13. 3. 2024
Hodnotenie:
Už ste hlasovali.

Nová umelá inteligencia s názvom Devin dokáže autonómne plánovať a vykonávať úlohy v tisícoch krokov. Dokáže zostaviť a nasadiť celé softvérové projekty úplne samostatne. Dokáže skúmať a opravovať chyby 7x lepšie ako OpenAI GPT-4 a trénuje a nasadzuje svoje vlastné klony na riešenie problémov.

Spoločnosť Cognition Labs oznámila nový model umelej inteligencie s názvom Devin, ktorú opisuje ako „prvého softvérového inžiniera umelej inteligencie na svete“. A aj keď je pravda, že predchádzajúce LLM (veľké jazykové modely) ako GPT-4 a Claude už nejaký čas dokážu písať a spúšťať kód, Devin sa javí ako významná zmena.

Táto nová umelá inteligencia je v podstate navrhnutá tak, aby fungovala ako celý softvérový tím. Poviete jej, čo chcete, a pustí sa do projektového manažmentu a obchodnej analýzy, aby navrhla plán a zostavila požiadavky. Potom vytvorí malých prisluhovačov umelej inteligencie, ktorí budú vykonávať určité kroky a prepínať medzi svojimi vlastnými izolovanými terminálmi, editormi kódu a prehliadačmi. Potom bude testovať, ladiť a opakovať, kým nevyhodnotí, že je celá aplikácia dokončená, a nasadí ju za vás.

Ak chcete, urobí celý tento proces, ktorý môže zahŕňať až tisíce rozhodovacích bodov, úplne autonómne. Jednoducho vám poskytne konečný produkt, na ktorý sa môžete pozrieť a vyžiadať si zmeny. Alebo s umelou inteligenciou môžu skúsení programátori zaobchádzať viac ako s digitálnymi spolupracovníkmi, ktorí sa viac zapájajú do rozhodovania a dizajnu, alebo ju môžu jednoducho použiť ako tím pomocníkov na kódovanie alebo testovanie alebo ako špecialistu na dokumentáciu.

V určitom zmysle to teda vyzerá ako výkonný riaditeľ umelej inteligencie, ktorý je zodpovedný za svoj vlastný tím, ktorý riadi celý projekt od začiatku po koniec. Spoločnosť Cognition Labs tiež tvrdí, že model Devin je schopný spojiť sa s novými technológiami, ktoré môže potrebovať na vykonanie práce.

Spoločnosť Cognition Labs predstavila Devin, mimoriadne komplexný model umelej inteligencie na vývoj softvéru.

Možno ešte podivnejšia je schopnosť vytvárať a trénovať vlastné otrokárske klony umelej inteligencie. Vo zverejnenom videu systém Devin naklonuje verziu modelu jazyka Llama s otvoreným zdrojovým kódom Meta so 7 miliardami parametrov, skontroluje súbor readme, aby sa naučil, ako ho nastaviť, a potom tak urobí. Potom spustí tréning a v priebehu niekoľkých hodín naklonuje a vycvičí nový model umelej inteligencie špeciálne pre danú úlohu.

Vytváranie a trénovanie vlastných agentov umelej inteligencie je pozoruhodne silný nápad a je to presne ten druh vecí, ktoré autonómny programátor novej generácie pravdepodobne potrebuje vedieť, pretože toľko úloh teraz môžu a mali by zvládnuť čoraz schopnejšie vlastné modely umelej inteligencie.

Z hľadiska výkonu sa model umelej inteligencie Devin javí ako obrovský skok vpred. Spoločnosť Cognition Labs už začala poskytovať umelej inteligencie skutočné programovacie úlohy získané z Upwork, z ktorých jedna zahŕňala nastavenie, ladenie a testovanie modelu počítačového videnia.

Tím to porovnal s GPT-4 a ďalšími modelmi v súvislosti s výzvou preberať reálne problémy s open source projektmi v GitHub a autonómne sa ich snažiť vyriešiť. Bez akejkoľvek pomoci dokázal model Devin vyriešiť takmer 14 % svojej podskupiny týchto problémov. Ďalší najlepší testovaný systém, Claude 2, vyriešil 4,8 % a GPT-4 menej ako 2 % problémov. Všetkým testovaným modelom, okrem Devina, bolo pritom presne povedané, ktoré súbory je potrebné upraviť, namiesto toho, aby na to museli prísť sami.

Umelá inteligencia Devin je momentálne v ranom prístupe a spoločnosť Cognition Labs žiada potenciálnych zákazníkov, aby sa skontaktovali priamo.