Google sprístupnil umelú inteligenciu na premenu textu na hudbu

Autor:: Roman Mališka
Zverejnené:: 15. 5. 2023
Hodnotenie:
Už ste hlasovali.

Neurónové siete s hĺbkovým učením začali drsne prenikať do odvetví kreatívneho umenia, a ak si hudobníci mysleli, že sú v bezpečí pred touto technológiou, ktorá už vyvoláva nočné mory u spisovateľov, výtvarníkov a ďalších tvorcov, tak sa mýlia.

Začiatkom tohto roka bola zverejnená demonštračná webová stránka umelej inteligencie MusicLM, ktorá dokázala prijať jednoduchý textový podnet a zjavne ho premeniť na plne orchestrovanú, mixovanú a nahratú hudobnú skladbu, doplnenú o nezmyselné vokály. Ide o digitálneho skladateľa soundtracku, ktorému ste mohli jednoducho povedať, kde potrebujete, aby sa na časovej osi objavili a klesli určité nálady.

Teraz spoločnosť Google sprístupnila umelú inteligenciu MusicLM verejnosti ako súčasť svojej AI Test Kitchen. Je zrejmé, že Google mnohé z tejto technológie uzamkol, pravdepodobne preto, že sa obáva problémov s autorskými právami. Podobne ako v prípade ChatGPT je to v jadre plagiátor. Spolu s popismi spracovala umelá inteligencia milióny hodín hudby, ktorú vytvoril niekto iný, a keď „vytvára“ hudbu, viac-menej len háda, čo si myslí, že bude nasledovať.

Rozdiel je v tom, že zatiaľ čo v časti textu vytvoreného umelou inteligenciou to môže byť ťažké rozpoznať, pri počúvaní hudby je to krištáľovo jasné. Vaše ucho dokáže v priebehu niekoľkých sekúnd rozpoznať obľúbeného interpreta cez mizerný stereo systém v hlučnej kaviarni len na základe rytmu bubnov. Keď MusicLM skladá svoje skladby, fragmenty zachytia vaše ucho rovnakým spôsobom a naznačia vám, odkiaľ pochádzajú.

MusicLM: Opíšte hudobnú skladbu a umelá inteligencia sa ju pokúsi vytvoriť.

Google vám v dotazoch nedovolí uviesť meno interpreta a nová ukážka blokuje vokály. Ak sa však spýtate napríklad na „compton gangsta rap with attitude“ alebo „paisley park purple funk“, budete počuť veľmi známe zvuky, pričom v mixe zostane dostatok fragmentov vokálneho dozvuku, aby ste mohli presne určiť interpreta a niekedy aj skladbu, z ktorej umelá inteligencia vybrala konkrétny moment.

Je to síce zábavné, no systém v podobe, v akej je prezentovaný na verejné použitie, jednoducho nie je ani zďaleka taký dobrý, ako sú demo skladby. V mnohých prípadoch totiž úplne ignoruje kľúčové časti textových pokynov, vynecháva nástroje, ktoré ste výslovne požadovali, alebo veselo skladá v 4/4, aj keď ste požadovali 7/8.

Toto je zjavne systém v ranom štádiu, ktorý sa však môže zlepšiť alarmujúcou rýchlosťou, ako zvyšok scény umelej inteligencie naznačuje. A je tiež zjavné, že bol obmedzený v rámci autorských práv. Ale v podobe, v akej je prezentovaný verejnosti, nie je pripravený na prvý ostrý štart. Bude určite zaujímavé sledovať, ako sa táto technológia bude v budúcnosti vyvíjať.