UI generujú viac nových a zaujímavých výskumných nápadov ako ľudskí experti

Autor:: Roman Mališka
Zverejnené:: 13. 9. 2024
Hodnotenie:
Už ste hlasovali.

Umelé inteligencie (UI) s veľkým jazykovým modelom nielenže dokážu generovať nové vedecké výskumné nápady na úrovni expertov, ale ich nápady sú originálnejšie a vzrušujúcejšie ako tie najlepšie z našich, čo vzišlo z hodnotenia mnohých ľudských expertov.

Boli prezentované prvé štatisticky významné výsledky, že umelé inteligencie (UI) s veľkým jazykovým modelom nielenže dokážu generovať nové vedecké výskumné nápady na úrovni expertov, ale ich nápady sú originálnejšie a vzrušujúcejšie ako tie najlepšie z našich. Tieto výsledky vzišli z hodnotenia mnohých ľudských expertov.

Nedávne prelomové výsledky v oblasti veľkých jazykových modelov (Large Language Model - LLM) nadchli výskumníkov potenciálom revolučne zmeniť vedecké objavy, pričom modely ako ChatGPT a Anthropic Claude vykazujú schopnosť autonómne generovať a overovať nové výskumné nápady.

To bola, samozrejme, jedna z mnohých vecí, u ktorých väčšina ľudí predpokladala, že umelé inteligencie nikdy nemôžu prevziať úlohu za človeka. Čiže schopnosť generovať nové poznatky a robiť nové vedecké objavy, na rozdiel od „jednoduchého“ spájania existujúcich poznatkov z ich natrénovaných údajov.

Ale podobne ako pri umeleckom vyjadrovaní, skladaní hudby, kódovaní, chápaní podtextu a reči tela a pri mnohých ďalších nových schopnostiach sa zdá, že dnešné multimodálne umelé inteligencie sú schopné generovať nové výskumy. V priemere je to dokonca viac nových poznatkov ako dokážu ich ľudské náprotivky.

V tejto oblasti sa až donedávna neuskutočnil žiadny výskum, keď sa viac ako 100 výskumných expertov (doktorandi a postdoktorandi z 36 rôznych uznávaných inštitúcií) na spracovanie prirodzeného jazyka (Natural Language Processing - NLP) postavilo proti „ideovým agentom“ vytvoreným v rámci LLM, aby zistili, čie výskumné nápady sú originálnejšie, zaujímavejšie a realizovateľnejšie. Výsledky vzišli z hodnotenia ľudských expertov.

Oblasť NLP je odvetvie umelej inteligencie, ktoré sa zaoberá komunikáciou medzi ľuďmi a umelými inteligenciami v jazyku, ktorému obe strany „rozumejú“, pokiaľ ide o základnú syntax, ale aj nuansy. A v poslednom čase aj pokiaľ ide o slovný tón a emocionálne odtienky.

49 ľudských expertov písalo myšlienky na 7 tém NLP, zatiaľ čo model LLM vycvičený výskumníkmi generoval myšlienky na tých istých 7 tém. V rámci štúdie sa platilo 300 dolárov (v prepočte 271 euro) za každý nápad a navyše bonus 1 000 dolárov (v prepočte 902 euro) piatim najlepším ľudským nápadom v snahe motivovať ľudí, aby vytvárali legitímne, ľahko realizovateľné a vykonateľné nápady.

Po dokončení sa použil LLM na štandardizáciu štýlov písania každého predloženého príspevku pri zachovaní pôvodného obsahu, aby sa takpovediac vyrovnali podmienky a štúdia zostala čo najviac slepá. Všetky predložené príspevky potom preskúmalo 79 prijatých ľudských expertov a vykonalo sa slepé posúdenie všetkých výskumných nápadov. Porota predložila 298 posudkov, pričom každý nápad dostal dva až štyri nezávislé posudky.

Celkový pohľad na hodnotenie ľudských dokumentov v porovnaní s nápadmi vytvorenými v rámci programu LLM.

A je isté, že pokiaľ ide o novinky a vzrušenie, umelé inteligencie boli v testoch výrazne lepšie ako ľudskí výskumníci. O niečo nižšie ako ľudia sa umiestnili aj v uskutočniteľnosti a o niečo vyššie v efektívnosti. Ani jeden z týchto efektov však nebol štatisticky významný.

Štúdia odhalila aj určité nedostatky, napríklad nedostatočnú rozmanitosť UI pri generovaní nápadov, ako aj ich obmedzenia pri sebahodnotení. Aj pri výslovnom usmernení, aby sa LLM neopakoval, by sa tak rýchlo začalo diať. LLM tiež neboli schopné preskúmať a hodnotiť nápady s veľkou konzistenciou a dosahovali nízke skóre v zhode s ľudskými posudkami.

Štúdia tiež uznáva, že ľudská stránka posudzovania „originality“ nápadu je dosť subjektívna, a to aj v prípade skupiny expertov.

Aby vedci lepšie dokázali teóriu, že LLM môžu, ale nemusia byť lepšie v potenciáli samostatného vedeckého objavu, naberú viac odborných účastníkov. Navrhujú komplexnejšiu následnú štúdiu, v ktorej sa nápady generované umelou inteligenciou aj ľuďmi plne rozvinú do projektov, čo umožní hlbšie preskúmať ich vplyv v reálnych scenároch.

Tieto prvé zistenia sú však určite triezve. Ľudstvo sa ocitlo v situácii, keď sa pozerá do očí podivnému novému protivníkovi. Umelé inteligencie s jazykovým modelom sa stávajú neuveriteľne schopnými nástrojmi. No stále sú notoricky nespoľahlivé a náchylné na to, čo spoločnosti zaoberajúce sa umelou inteligenciou nazývajú ako „halucináciami“. V prísnej vedeckej metóde určite nie je miesto pre „halucinácie“. Veda na tom nemôže stavať. Už teraz je dosť škandalózne, že podľa niektorých odhadov v súčasnosti najmenej 10 % výskumných prác spoluvytvárajú (prinajmenšom) umelé inteligencie.

Na druhej strane nemôžeme podceňovať potenciál umelej inteligencie radikálne urýchliť pokrok v určitých oblastiach. Ide o najrýchlejšie sa rozvíjajúcu technológiu, akú kedy ľudstvo zažilo. Dá sa očakávať, že mnohé jej nedostatky budú v priebehu niekoľkých rokov zaplátané a odstránené. Mnohí výskumníci v oblasti umelej inteligencie sa domnievajú, že sa blížime k všeobecnej superinteligencii, čiže bodu, v ktorom všeobecná umelá inteligencia predbehne expertné znalosti viac-menej vo všetkých oblastiach.