IBM umožní tréning umelej inteligencie rýchlosťou svetla za menej energie
- Autor:
- Roman Mališka
- Zverejnené:
- 23. 12. 2024
- Hodnotenie:
- Už ste hlasovali.
Spoločnosť IBM prišla na spôsob, ako päťkrát zrýchliť tréning a spúšťanie generatívnych modelov umelej inteligencie a zvýšiť ich energetickú účinnosť tým, že vymenila medené káble za svetelné lúče na prepojenie komponentov dátového centra.
Paradoxom nášho digitálneho veku je, že s tým, ako sa počítače zmenšujú, problémy sa zväčšujú. Keďže čipy na seba tlačia stále viac tranzistorov, až kým ich počet nedosiahne miliardy, umožnili vznik obrovských dátových centier a výpočtového výkonu potrebného na vytvorenie moderných generatívnych modelov umelej inteligencie. Tieto modely si však s vývojom vyžadujú čoraz väčší výpočtový výkon. Dátové centrá sa tak stali veľkými spotrebiteľmi energie a samotné čipy narážajú nielen na hranice svojej technológie, ale aj fyzikálnych zákonov.
Dve technologické a fyzikálne úzke miesta týchto dátových centier sú obyčajný medený vodič a rýchlosť, akou po ňom môžu prúdiť elektróny. Tie sú jedným z hlavných dôvodov, prečo je elektronika taká kompaktná. Nie je to len kvôli pohodliu. Je to preto, že ako sa počítače stávajú rýchlejšími a výkonnejšími, čas, ktorý potrebujú dáta na prechod od jedného komponentu k druhému, sa stáva hlavným faktorom výkonu.
V skutočnosti sa dáta vo forme elektrónov stali takým úzkym miestom, že väčšina procesorov trávi väčšinu času nečinne a spotrebúva energiu, kým čaká na ďalší dátový balík. Spoločnosť IBM aj preto vyvinula novú generáciu optickej technológie, o ktorej tvrdí, že to urýchli. Používanie optiky na posúvanie dát nie je novinkou. Už desaťročia sa používa na prenos informácií z miesta na miesto pomocou optických káblov. To sa však týkalo najmä veľkých vzdialeností. Po príchode dát a ich vstupe do samotného počítača sa opäť prechádza na medené káble.
Na prekonanie tohto problému sa spoločnosť IBM obracia na nový proces vytvárania takzvanej spojenej optiky (Co-Packaged Optics - CPO) vo forme Polymérneho optického vlnovodu (Polymer Optical Waveguide – PWG), ktorý vedie optické signály medzi fotonickými integrovanými obvodmi a externými spojmi, ako sú jednovidové vlákna. Spoločnosť IBM tvrdí, že testy polymérneho optického vlnovodu ukazujú, že ak by sa použil v dátových centrách, vyžadoval by päťkrát menej energie ako bežné verzie a umožnil by natiahnuť káblové spojenia z jedného metra na stovky, čo by umožnilo flexibilnejšiu architektúru pri prenose terabitov dát za sekundu.
IBM tvrdí, že zníženie spotreby energie na trénovanie jedného modelu umelej inteligencie by stačilo na prevádzku 5 000 amerických domácností počas jedného roka a použitie svetla by skrátilo čas na trénovanie veľkého jazykového modelu umelej inteligencie z troch mesiacov na tri týždne vďaka tomu, že má 80-násobnú šírku pásma oproti konvenčným systémom.,
„Keďže generatívna umelá inteligencia si vyžaduje viac energie a výpočtového výkonu, dátové centrá sa musia vyvíjať - a spojená optika môže zabezpečiť, aby tieto dátové centrá boli odolné voči budúcnosti,“ povedal Dario Gil, SVP a riaditeľ výskumu v IBM. „Vďaka tomuto prelomovému objavu budú čipy zajtrajška komunikovať podobne ako optické káble prenášajúce dáta do dátových centier a z nich, čím sa začne nová éra rýchlejšej a udržateľnejšej komunikácie, ktorá zvládne pracovné zaťaženie umelej inteligencie budúcnosti.“