Мозочни сигнали преведени во говор – користејќи вештачка интелигенција

Луѓето со парализирачки услови како што се моторно-невронските болести често се потпираат на технологијата за да им помогнe да зборуваат. Во обид да обезбедат глас за луѓето кои не можат да зборуваат, невролозите развија уред кој може да ги трансформира мозочните сигнали во говор.
Оваа технологија се уште не е доволно точна за употреба надвор од лабораторијата, иако може да ги синтетизира целите реченици кои се претежно разбирливи. Неговите творци го опишале уредот за декодирање говор во една студија објавена на 24 април во весникот Nature.

Научниците претходно користеле вештачка интелигенција за да преведат единечни зборови, кои најчесто се состоеле од еден слог, од активноста на мозокот, вели Chethan Pandarinath, невроинженер на универзитетот Емори во Атланта, Џорџија, кој ја коментира студијата. „Изведувањето таков скок од еден слог до реченици е технички доста предизвикувачки и е една од работите што ја прават сегашната работа толку импресивна“ – вели тој.

Мапирање на движења
Многу луѓе кои ја изгубиле способноста да зборуваат комуницираат користејќи технологија која бара од нив да направат мали движења за контрола на курсорот кој избира букви или зборови на екранот. Британскиот физичар Стивен Хокинг, кој имаше моторно-невронска болест, беше еден познат пример за тоа. Тој употребуваше уред за генерирање на говор активиран од мускул во неговиот образ, вели водачот на студијата Едвард Чанг, неврохирург на универзитетот во Калифорнија, Сан Франциско.

Бидејќи луѓето што користат такви уреди мора да пишуваат зборови буква по буква, овие уреди можат да бидат многу бавни, создавајќи до десет зборови во минута, вели Чанг. Природниот орален говор во просек изнесува 150 зборови во минута. “Тоа е ефикасноста на вокалниот тракт што ни овозможува да го сториме тоа”, вели тој. Па така Чанг и неговиот тим одлучија да го моделираат вокалниот систем при конструирањето на нивниот декодер.

Истражувачите имплантираат електроди слични на овие во черепите на учесниците за снимање на нивните мозочни сигнали. Кредит: UCSF

Истражувачите работеа со пет лица кои имале електроди имплантирани на површината на мозокот како дел од третманот против епилепсија. Прво, тимот ја сними активноста на мозокот додека учесниците гласно ги прочитале стотиците реченици. Потоа, Чанг и неговите колеги ги комбинираа овие снимки со податоци од претходните експерименти за да одредат како движењата на јазикот, усните, вилицата и ларинксот создаваат звук.

Тимот обучил алгоритам за длабоко учење на овие податоци, а потоа ја вградил програмата во нивниот декодер. Уредот ги трансформира мозочните сигнали во предвидените движења на вокалниот тракт и потоа ги претвора овие движења во синтетички говор. Луѓето кои слушале 101 синтетизирани реченици може да ги разберат 70% од зборовите во просек, вели Чанг.

Во друг експеримент, истражувачите побараа еден учесник гласно да ги прочита речениците, а потоа да ги имитираа истите реченици со поместување на устата без да произведува звук. Резултатите синтетизирани од овој тест беа со понизок квалитет од оние создадени од звучниот говор, вели Чанг, но резултатите се уште се охрабрувачки.

Разбирлива иднина
Говорот создаден со мапирање на активноста на мозокот и движењето на гласниот тракт и потоа нивно трансформирање во звук е полесно разбран од она што се создава со мапирање на активноста на мозокот директно во звук, вели Стефани Рис, невролог на државниот универзитет во Сан Диего, Калифорнија.

Но, не е јасно дали новиот говорен декодер ќе работи со зборови што луѓето ги мислат само, вели Ејми Орсборн, нервен инженер на универзитетот во Вашингтон, Сиетл. “Студијата прави навистина добра работа да покаже дека ова функционира за имитиран говор”, вели таа. “Но, како ова ќе функционира кога некој нема да ја движи устата?”

Марк Слуцки, невролог на северозападниот универзитет во Чикаго, Илиноис, се согласува и вели дека перформансите на декодерот оставаат простор за подобрување. Тој забележува дека слушателите го идентификуваа синтетизираниот говор со избирање на зборови од множество избори; Но со зголемување на бројот на избори, луѓето имаа поголеми проблеми со разбирањето на зборовите.

Студијата “е навистина важен чекор, но сѐ уште има долг пат пред синтетизираниот говор да биде лесно разбирлив”, вели Slutzky.


Извор: Nature