Zabudnuté heslo?
Prihlásenie

Okuliare s funkciou sonaru čítajú ticho vyslovené hlasové príkazy

Autor:
Roman Mališka
Zverejnené:
12. 4. 2023
Hodnotenie:
Už ste hlasovali.

Niektorí ľudia nemajú dostatok rečových schopností, zatiaľ čo iní sa môžu ocitnúť v hlučnom prostredí, kde hlasné vyslovovanie hlasových príkazov jednoducho nefunguje. Takýmto ľuďom by v budúcnosti mohli pomôcť okuliare EchoSpeech, ktoré čítajú potichu vyslovené slová nositeľa.

Experimentálne okuliare vyvíja tím v laboratóriu SciFi (Smart Computer Interfaces for Future Interactions) na Cornellovej univerzite. Dva miniatúrne reproduktory smerujúce nadol sú umiestnené na spodnej strane rámu pod jednou šošovkou, zatiaľ čo pod druhou sú umiestnené dva miniatúrne mikrofóny. Reproduktory vysielajú nepočuteľné zvukové vlny, ktoré sa odrážajú od pohybujúcich sa úst nositeľa a vracajú sa späť k mikrofónom.

Tieto ozveny sú v reálnom čase analyzované algoritmom hlbokého učenia na bezdrôtovo prepojenom smartfóne. Tento algoritmus bol vycvičený tak, aby priradil špecifické ozveny ku konkrétnym pohybom úst, ktoré sú následne spojené s konkrétnymi ticho vyslovenými príkazmi.

Pretože okuliare EchoSpeech nevyužívajú video súbory, všetko spracovanie údajov sa môže vykonávať na spárovanom smartfóne.

Okuliare EchoSpeech sú v súčasnosti schopné rozpoznať 31 takýchto príkazov s presnosťou približne 95 percent a vyžadujú si len niekoľko minút tréningu pre každého používateľa. A čo je dôležité pre ľudí, ktorí majú obavy o súkromie, systém neobsahuje žiadne kamery ani neodosiela žiadne informácie na internet.

Navyše, keďže okuliare nevyužívajú energeticky náročnú kameru, môžu na jedno nabitie batérie fungovať až 10 hodín. Naproti tomu výskumníci tvrdia, že experimentálne systémy založené na kamerách vydržia na jedno nabitie len približne 30 minút prevádzky.

Univerzita teraz pracuje na komercializácii tejto technológie.

Okuliare EchoSpeech (predvádzané vedúcim vedcom Ruidongom Zhangom) by sa mohli využívať na ovládanie zariadení alebo dokonca na pomoc ľuďom bez hlasu pri komunikácii.

„Pre ľudí, ktorí nemôžu vokalizovať zvuk, by táto technológia tichej reči mohla byť vynikajúcim vstupom pre hlasový syntetizátor,“ povedal doktorand Ruidong Zhang, ktorý vedie štúdiu. „Mohla by pacientom vrátiť ich hlas.“

Technológia EchoSpeech je demonštrovaná vo videu na začiatku článku, ktoré si môže pozrieť aj priamo TU.