Naukowy przełom w czytaniu w myślach: Wymyślanie gadżetów, które każdy może kupić
Naukowy przełom w czytaniu w myślach: Wymyślanie gadżetów, które każdy może kupić

Wideo: Naukowy przełom w czytaniu w myślach: Wymyślanie gadżetów, które każdy może kupić

Wideo: Naukowy przełom w czytaniu w myślach: Wymyślanie gadżetów, które każdy może kupić
Wideo: Czym Jest Karma 2024, Może
Anonim

Inżynierom z Instytutu Badań Wyższej Aktywności Nerwowej udało się stworzyć system, który tłumaczy myśli na zrozumiałą i rozpoznawalną mowę. Kontrolując czyjąś aktywność mózgu, technologia przekształca myśli w słowa.

Ten przełom naukowy, w połączeniu z potęgą sztucznej inteligencji i syntezatorów mowy, otwiera nową erę w interakcji między komputerem a mózgiem. Oczywiście otwiera to również nowe możliwości dla osób, które z tego czy innego powodu utraciły zdolność mówienia.

„Nasze głosy pomagają utrzymać kontakt z przyjaciółmi, rodziną i otaczającym nas światem, więc utrata głosu z powodu urazu lub choroby jest katastrofalna dla ludzi. Jednak przy dzisiejszym zasobie wiedzy mamy potencjalny sposób na przywrócenie tej mocy. Pokazaliśmy, że przy odpowiedniej technologii myśli ludzi mogą zostać odszyfrowane i zrozumiane przez każdego słuchacza”- mówi dr Nima Mesgarani i jeden z autorów badania przeprowadzonego w Mortimer B. Zuckerman Institute of Mental Behaviour w Kolumbii Uniwersytet.

Dziesięciolecia badań wykazały, że kiedy ludzie mówią, a nawet wyobrażają sobie, że wypowiadają słowa, w ich mózgach pojawiają się charakterystyczne wzorce aktywności. Wyraźny i rozpoznawalny wzór sygnalizacji pojawia się również, gdy słuchamy kogoś mówiącego lub wyobrażamy sobie, że słuchamy. Eksperci od dziesięcioleci próbują rozszyfrować te wzorce, ale dopiero teraz otworzyła się przed nimi przyszłość, w której myśli nie mogą już być ukryte w mózgu, ale zamiast tego mogą być dowolnie tłumaczone na język mówiony.

Ale osiągnięcie tego wyczynu nie było łatwe. Wczesne próby odszyfrowania sygnałów mózgowych dr Mesgaraniego i innych koncentrowały się na prostych modelach komputerowych, które analizowały spektrogramy, które są wizualnymi reprezentacjami częstotliwości dźwięku.

Jednak ze względu na fakt, że to podejście nie dało nic zbliżonego do zrozumiałej mowy, zespół dr Mesgarani zwrócił się ku wokoderowi, algorytmowi komputerowemu, który może syntetyzować mowę po przeszkoleniu w nagrywaniu rozmów ludzi.

„To ta sama technologia, której używają Amazon Echo i Apple Siri, aby ustnie odpowiedzieć na nasze pytania”, powiedział dr Mesgarani, który jest również profesorem nadzwyczajnym inżynierii elektrycznej w Columbia School of Engineering and Applied Science Fundacji Fu.

Aby nauczyć wokoder interpretować aktywność mózgu, dr Mesgarani połączył siły z dr Asheshem Dineshem Mehtą, neurochirurgiem z Northwell Health Physician Partners' Neuroscience Institute i współautorem dzisiejszego artykułu. Dr Mehta leczy pacjentów z padaczką, z których część musi przechodzić regularne operacje.

„Pracując z dr Mehtą, poprosiliśmy pacjentów z padaczką, którzy przeszli już operację mózgu, aby wysłuchali sugestii różnych osób, podczas gdy mierzyliśmy wzorce aktywności ich mózgu” – mówi dr Mesgarani. „Te wzorce neuronowe wyszkoliły wokoder”.

Następnie naukowcy poprosili tych samych pacjentów o słuchanie głośników wymawiających cyfry od 0 do 9 podczas rejestrowania sygnałów mózgowych, które można następnie przepuścić przez wokoder. Dźwięk wytwarzany przez wokoder w odpowiedzi na te sygnały został przeanalizowany i udoskonalony za pomocą sieci neuronowych, takich jak sztuczna inteligencja, które naśladują strukturę neuronów w biologicznym mózgu.

Efektem końcowym był głos robota powtarzający sekwencję liczb. Aby zweryfikować dokładność nagrania, dr Mesgarani i jej zespół poinstruowali ludzi, aby wysłuchali nagrania i zrelacjonowali to, co usłyszeli.

„Odkryliśmy, że ludzie potrafią rozumieć i powtarzać dźwięki w około 75% przypadków, co znacznie przewyższa wszelkie wcześniejsze próby” – mówi dr Mesgarani. Poprawa zrozumiałości była szczególnie widoczna przy porównaniu nowych nagrań z wcześniejszymi próbami opartymi na spektrogramie. „Czuły wokoder i potężne sieci neuronowe reprezentowały dźwięki, które pacjenci pierwotnie słyszeli z niesamowitą dokładnością”.

Dr Mesgarani i jej zespół planują teraz przetestować trudniejsze słowa i zdania. Zamierzają również przeprowadzić te same testy na sygnałach mózgowych emitowanych, gdy osoba mówi lub wyobraża sobie mowę. Ostatecznie mają nadzieję, że ich system może być częścią implantu, podobnego do implantów noszonych przez niektórych pacjentów z padaczką, który przekłada myśli użytkownika bezpośrednio na słowa.

„W tym scenariuszu, jeśli właściciel chipa pomyśli: »Potrzebuję szklanki wody«, nasz system może odebrać sygnały mózgowe generowane przez tę myśl i przekształcić je w syntezowaną mowę werbalną” - mówi dr Mesgarani. „To zmienia zasady gry, a każdemu, kto utracił zdolność mówienia z powodu kontuzji lub choroby, technologia daje nową szansę na komunikację z otaczającym światem”.

Komentarz redakcyjny The Big The One:Ponieważ niektórzy z naszych pracowników mają pewien związek z neurofizjologią, możemy absolutnie jednoznacznie stwierdzić, że rozwiązanie problemu czytania myśli i przekładania tych myśli na słowa nie jest problemem, który jakiś doktor filozofii może rozwiązać wspólnie z inteligentnym neurochirurgiem. To zadanie dla instytutu badawczego, który rozwiąże go za sto, dwieście lub więcej lat. Co więcej, wcale nie jest faktem, że instytut badawczy rozwiąże ten problem – nawet jeśli sprowadzą tam wszystkie superkomputery NASA, na których tłum inżynierów zacznie symulować sieci neuronowe. Jednak artykuł w czasopiśmie naukowym nie będzie kłamał i na pewno istnieje fakt rozpoznawania myśli. Jak zatem pogodzić te dwa fakty?

Bardzo prosta. W ciągu ostatnich 20-30 lat na świecie pojawiła się ogromna liczba całkowicie niesamowitych i bardzo złożonych technologii, takich jak mikroprocesory i dyski twarde. I z każdym dniem pojawiają się coraz to nowe wynalazki, które są spisywane do niektórych „uzdolnionych studentów”, którzy siedząc w garażu zebrali kawałek ze złomu, o który instytuty badawcze walczą od 50 lat. I w tym przypadku mamy wynalazek o podobnej genezie. To znaczy rozwój, który przez wiele lat był dokonywany (lub przekazywany ludziom) przez jakąś nieznaną osobę, ale który został spisany na ciotkę i wujka z Kolumbii.

W rzeczywistości nie ma absolutnie żadnej różnicy, kogo Wikipedia napisze jako „wynalazców” technologii. Najważniejsze, że technologia została zaprezentowana światu za pomocą czasopisma naukowego. Co więcej, jakaś chińska firma zacznie produkować takie „gadżety”, które przyzwyczają ludzi do samej idei, że ich głowa stała się teraz całkowicie przezroczysta. Wreszcie trzeci etap będzie tym samym orwellowskim „1984”, kiedy nawet myśli dowolnej osoby będą mogły być swobodnie odczytywane z dystansu. Na przykład umieszczając specjalne czujniki w mieszkaniach lub integrując specjalny chip, który reaguje na impulsy mózgowe do ciała. Ponadto.

Z reguły każda technologia ma odwrotne zastosowanie. Na przykład, jeśli istnieje technologia przekształcania impulsów nerwowych w słowa, to korzystając z tej samej zasady, możesz zamienić dowolne słowa w czyjeś myśli. W tej sytuacji prezydenci różnych krajów mają imponującą perspektywę poparcia absolutnie całego elektoratu, skoro teraz jest techniczna szansa, by każdy wyborca nawet myślał tak jak on – wystarczy włożyć do gniazdka poprawnie zmodulowany sygnał.

W ogóle co tu dużo mówić - perspektywy świata otwierają się najwspanialsze iz zainteresowaniem śledzimy rozwój wydarzeń.

Zalecana: