WSE-3 je najrýchlejší čip umelej inteligencie na svete
- Autor:
- Roman Mališka
- Zverejnené:
- 18. 3. 2024
- Hodnotenie:
- Už ste hlasovali.
Nový výkonný čip údajne dokáže trénovať umelú inteligenciu rýchlejšie ako kedykoľvek predtým. Spoločnosť Cerebras Systems predstavila najrýchlejší čip umelej inteligencie na svete s názvom Wafer Scale Engine 3 (WSE-3), ktorý poháňa superpočítač Cerebras CS-3 AI so špičkovým výkonom 125 petaflopov. Navyše je čip škálovateľný do až šialenej miery.
Predtým, ako systém umelej inteligencie dokáže vychrliť výsledky, musí byť vyškolený na ohromujúcom množstve údajov, ktoré spotrebujú energiu pre viac ako 100 domácností. No nový čip a počítače s ním postavené pomôžu urýchliť tento proces a zefektívniť ho.
Každý čip WSE-3, ktorý je veľký asi ako krabica od pizze, obsahuje úžasné štyri bilióny tranzistorov, ktoré poskytujú dvojnásobný výkon oproti predchádzajúcemu modelu spoločnosti (ktorý bol tiež držiteľom predchádzajúceho svetového rekordu) pri rovnakých nákladoch a spotrebe energie. Keď sa tieto čipy začlenia do systému CS-3, môžu zjavne poskytnúť výkon miestnosti plnej serverov v rámci jednej jednotky veľkosti mini-chladničky.
Spoločnosť Cerebras hovorí, že jej superpočítač CS-3 používa 900 000 jadier umelej inteligencie a 44 GB pamäte SRAM na čipe, čo poskytuje až 125 petaflopov špičkového výkonu pre umelú inteligenciu. Teoreticky by to malo stačiť na to, aby sa dostal medzi 10 najlepších superpočítačov na svete, hoci nebol ešte testovaný v benchmarkoch.
Na uloženie všetkých týchto údajov sú možnosti externej pamäte 1,5 TB, 12 TB alebo obrovských 1,2 petabajtov (PB), čo je 1 200 TB. Superpočítač CS-3 dokáže trénovať modely umelej inteligencie zahŕňajúce až 24 biliónov parametrov. Na porovnanie, väčšina modelov umelej inteligencie je v súčasnosti v miliardách parametrov, pričom sa odhaduje, že GPT-4 dosiahne maximum okolo 1,8 bilióna. Spoločnosť Cerebras hovorí, že superpočítač CS-3 by mal byť schopný trénovať model umelej inteligencie s biliónom parametrov tak ľahko, ako súčasné počítače založené na GPU trénujú model s 1 milonom parametrov.
Vďaka procesu výroby plátov čipov WSE-3 je superpočítač CS-3 navrhnutý tak, aby bol škálovateľný. To umožňuje zoskupenie až 2 048 jednotiek do jedného superpočítača. Ten by tak bol schopný výkonu až 256 exaflopov. Špičkové superpočítače na svete v súčasnosti stále dosahujú niečo málo cez jeden exaflop. Spoločnosť tvrdí, že tento druh výkonu by tak mu umožnil trénovať model Llama 70B od nuly za jediný deň.
Už teraz sa zdá, že modely umelej inteligencie napredujú strašnou rýchlosťou, ale tento druh technológie by ich schopnosti mohol vystreliť raketovou rýchlosťou vpred.