Według ostatnich badań naukowcy stworzyli parser języka, który wykorzystuje narzędzie AI podobne do ChatGPT do konwersji mowy na tekst. Odkrycie jest godne uwagi, ponieważ po raz pierwszy ciągły język został nieinwazyjnie odzyskany z aktywności mózgu osoby za pomocą funkcjonalnego urządzenia do obrazowania rezonansu magnetycznego (fMRI). Korzystając z wzorców mózgowych fMRI, narzędzie było w stanie zinterpretować główne wątki historii, które ludzie czytali, oglądali lub słuchali – a nawet tylko wyobrażali sobie – w sposób, który pozwala bezpiecznie czytać w ludzkich myślach. Naukowcy spodziewają się, że ta technologia, która jest jeszcze w powijakach, pewnego dnia może ułatwić osobom z chorobami neurologicznymi upośledzającymi mowę swobodne rozmawianie z innymi.

Umysł – czytanie narzędzia mogą być użyte do czynienia zła

Zespół odpowiedzialny za dekoder ostrzega ten umysł – narzędzia do czytania mogą być potencjalnie wykorzystywane do złych czynów. Jednym z nich może być nielegalne monitorowanie przez rząd. Według raportu opublikowanego w poniedziałek w Nature Neuroscience, autorzy stwierdzili, że „interfejsy mózg-komputer powinny szanować prywatność psychiczną”, nawet jeśli zauważyli, że ich narzędzie wymaga zespołowego wysiłku ludzi, aby funkcjonować.

Jerry Tang, doktorant na kierunku informatyka na Uniw. z Teksasu w Austin, który kierował badaniem, podczas briefingu prasowego, który odbył się w ubiegły czwartek, powiedział

„Obecnie dekodowanie języka odbywa się za pomocą wszczepionych urządzeń wymagających neurochirurgii, a nasze badanie jest pierwszym, które dekoduje ciągły język, oznacza więcej niż pełne słowa lub zdania, z nieinwazyjnych zapisów mózgu, które zbieramy za pomocą funkcjonalnego MRI… Celem dekodowania języka jest rejestrowanie aktywności mózgu użytkownika i przewidywanie słów, które użytkownik słyszał, wypowiadał lub wyobrażał sobie ,”zauważył. „Mamy nadzieję, że ostatecznie ta technologia pomoże ludziom, którzy utracili zdolność mówienia z powodu urazów, takich jak udary lub choroby, takie jak ALS”.

Jak działa nowe narzędzie AI

Trzy osoby, z których każda spędziła 16 godzin na słuchaniu historii w narzędziu fMRI, pomogły Tangowi i innym w stworzeniu ich narzędzia. Aby połączyć semantyczne aspekty zarejestrowanych historii z aktywnością mózgu odnotowaną w danych fMRI, zespół przeszkolił model AI znany jako GPT-1. Może wtedy dowiedzieć się, które słowa i wyrażenia są powiązane z określonymi wzorcami mózgowymi.

Źródło zdjęcia: Niche Pursuits

Następnie uczestnicy słuchają zupełnie nowych historii, które nie były częścią zestawu danych szkoleniowych. Robiąc to, zobrazowano ich mózgi za pomocą fMRI. Chociaż te interpretacje często wykorzystywały inne struktury semantyczne niż oryginalne nagrania, narzędzie było w stanie przetłumaczyć historie dźwiękowe na tekst tak, jak ludzie je słyszeli. Na przykład, używając czytników fMRI, myśli słuchacza zostały przetłumaczone z taśmy mówiącej: „Nie mam jeszcze prawa jazdy” na „Ona nawet nie zaczęła jeszcze uczyć się prowadzić”.

Gizchina Wiadomości tygodnia

Te chwiejne odczyty wynikają z kluczowego rozróżnienia między nowe narzędzie i ustalone metody. Stare standardowe metody polegają na inwazyjnym wszczepianiu elektrod do mózgu. Podczas gdy zespół Tanga skupił się na przepływie krwi przez mózg, co jest rejestrowane w maszynach fMRI. Narzędzia oparte na elektrodach zwykle przewidują tekst na podstawie czynności ruchowych. Obejmuje to ruchy ust osoby, która próbuje mówić.

Narzędzie nie podaje dokładnych słów

Alexander Huth, asystent prof. neurobiologii i informatyki na UT Austin i główny autor nowego badania, mówi w briefingu prasowym

„Nasz system działa na zupełnie innym poziomie… Zamiast patrzeć na tę niskopoziomową motorykę, nasz System naprawdę działa na poziomie idei, semantyki i znaczenia. Do tego to zmierza… To jest powód, dla którego myślę, że to, co uzyskujemy, nie jest dokładnymi słowami, które ktoś usłyszał lub powiedział, ale sednem… To ta sama idea, ale wyrażona innymi słowami”.

Nowe narzędzie zespołu pozwala im przekraczać granice umysłu — technologię czytania. Dokonała tego, sprawdzając, czy narzędzie może tłumaczyć myśli badanych podczas oglądania niemych filmów. Powtórzył również ten proces, ponieważ badani właśnie tworzyli historie w swoich głowach. W obu przypadkach dekoder uzyskał całkiem dobre wyniki. Niezależnie od tego, czy tworzyli historie w swoich umysłach, czy oglądali film, dekoder działał dobrze.

Źródło zdjęcia: Wired

Jeśli chodzi o wyimaginowaną mowę, dekoder dał lepsze wyniki podczas wszystkich testów z nagraniami dźwiękowymi. Ale nadal był w stanie wywnioskować kilka podstawowych faktów na temat niewypowiedzianych myśli na podstawie aktywności mózgu. Jako studium przypadku, badany wyobraził sobie stwierdzenie … „poszedł drogą gruntową przez pole pszenicy i nad strumieniem i obok niektórych budynków z bali”. Dekoder wygenerował tekst, który brzmi… „musiał przejść przez most na drugą stronę i bardzo duży budynek w oddali”.

Na pewno pojawią się ogromne problemy z prywatnością

Wszystkie te zadania zostały powierzone uczestnikom badania, gdy znajdowali się wewnątrz maszyny fMRI. Jest to nieporęczny i stały element sprzętu laboratoryjnego. Z tego powodu Tang i jego zespół uważają, że dekoder nie jest jeszcze gotowy do użycia. Oznacza to, że dla osób mających problemy z mową to narzędzie jest obecnie niewykonalne. Uważają jednak, że przyszłe wersje urządzenia mogą zostać zmienione, aby działały z prostszymi narzędziami. Narzędzia, takie jak czujniki fNIRS, które można nosić na głowie pacjenta.

Zespół, który przeprowadził badanie, ostrzega, że ​​dekodery budzą moralne wątpliwości dotyczące prywatności psychicznej. Chociaż nawiązywali do potencjału tej technologii jako nowej formy dialogu

Zespół Tanga powiedział w badaniu

„Nasza analiza prywatności sugeruje, że obecnie wymagana jest współpraca podmiotu zarówno do szkolenia i zastosowanie dekodera… Jednak przyszłe zmiany mogą umożliwić dekoderom obejście tych wymagań. Co więcej, nawet jeśli prognozy dekodera są niedokładne bez współpracy podmiotu, mogą zostać celowo błędnie zinterpretowane w złośliwych celach… „Z tych i innych nieprzewidzianych powodów niezwykle ważne jest podniesienie świadomości na temat zagrożeń związanych z technologią dekodowania mózgu. Istnieje również potrzeba wprowadzenia zasad chroniących prywatność psychiczną każdej osoby”, 

Źródło/VIA:

Categories: IT Info