最近の研究によると、科学者は、ChatGPT に似た AI ツールを使用して音声をテキストに変換する言語パーサーを作成しました。この発見は、機能的磁気共鳴画像法 (fMRI) 装置を使用して人の脳活動から連続言語が非侵襲的に回復されたのは初めてであるため、注目に値します。このツールは、fMRI の脳パターンを使用して、被験者が読んだり、見たり、聞いたり、あるいは単に絵を描いたりした物語の要点を、人々の心を安全に読み取れるように解釈することができました。科学者たちは、この技術はまだ初期段階にあるため、いつの日か発話に障害のある神経疾患を持つ人々が他の人と簡単にチャットできるようになると期待しています。

心 – 読書ツールが悪用される可能性がある

デコーダーの背後にあるチームは、その心に警告します – 読み取りツールが悪意のある行為に使用される可能性があります.これらの 1 つは、政府による違法な監視である可能性があります。月曜日に Nature Neuroscience に掲載されたレポートによると、著者らは、ツールが機能するには人間の被験者のチームの努力が必要であると述べたとしても、「脳とコンピューターのインターフェースは精神的なプライバシーを尊重する必要がある」と述べています。

ジェリー・タン、大学院生大学でコンピューター サイエンスの博士号を取得しています。先週木曜日に行われた記者会見で、この研究を主導したテキサス州オースティンのテキサス州知事は、次のように述べています。機能的MRIを使用して収集した非侵襲的な脳の記録から、完全な単語や文以上のものを意味します… 言語のデコードの目標は、ユーザーの脳活動の記録を取り、ユーザーが聞いたり、言ったり、想像したりした単語を予測することです」と彼は指摘した。 「最終的には、この技術が、脳卒中などの怪我や ALS などの病気のために話す能力を失った人々を助けることができることを願っています。」

新しい AI ツールの仕組み

fMRI ツールでそれぞれ 16 時間話を聞いた 3 人が、Tang たちのツールの作成を支援しました。記録されたストーリーのセマンティックな側面を fMRI データに記録された脳活動と結び付けるために、チームは GPT-1 として知られる AI モデルをトレーニングしました。次に、どの単語やフレーズが特定の脳のパターンに関連しているかを学習する可能性があります。

画像クレジット: Niche Pursuits

次に、参加者は、トレーニング データセットには含まれていない新しいストーリーに耳を傾けます。これを行っている間、彼らは fMRI を使用して脳を画像化しました。これらの解釈では、元の録音とは異なる意味構造が使用されることがよくありますが、このツールは、人々が聞いた音声のストーリーラインをテキストに変換することができました。たとえば、fMRI リーダーを使用して、リスナーの考えは、「私はまだ運転免許証を持っていません」という話者のテープから「彼女はまだ運転を習い始めていない」に翻訳されました。

Gizchina News of the week

これらの不安定な読みは、新しいツールと確立された方法。従来の標準的な方法では、脳に電極を侵襲的に埋め込みます。 Tang のチームは、fMRI 装置でキャプチャされる脳を通る血流に注目しました。電極ベースのツールは通常、運動活動からテキストを予測します。これには、人が話そうとするときの口の動きが含まれます。

ツールは正確な言葉を提供しません

アレクサンダー・ヒュース助教。テキサス大学オースティン校の神経科学とコンピューター サイエンスの博士であり、新しい研究の上級著者は、プレス ブリーフィングで次のように述べています。システムは、アイデア、セマンティクス、意味のレベルで実際に機能します。それが目的です…これが、私たちが得たものが誰かが聞いたり話したりした正確な言葉ではなく、要点だと思う理由です…同じ考えですが、異なる言葉で表現されています。」

チームの新しいツールにより、彼らは心の限界、つまりテクノロジーを読むことができます。これは、無声映画を見た被験者の思考をツールが翻訳できるかどうかをテストすることによって行われました。また、被験者が頭の中でストーリーを作成しただけなので、このプロセスも繰り返しました。どちらの場合も、デコーダーはかなり良い結果を得ました。彼らが頭の中で物語を作っていようと、映画を見ていようと、デコーダーはうまく機能しました。

画像クレジット: 有線

想像上のスピーチに関しては、オーディオ録音によるテスト全体を通して、デコーダーはより良い結果をもたらしました。それでも、脳の活動から暗黙の思考に関するいくつかの基本的な事実を推測することはできました。ケーススタディとして、ある被験者が「小麦畑を通り、小川を越え、いくつかの丸太の建物のそばの未舗装の道路を進んだ」という言葉を想像しました。デコーダーは、次のようなテキストを生成しました…「彼は橋を渡って反対側に向かい、遠くに非常に大きな建物が見えました。」

巨大なプライバシーの問題が必ず発生します

これらのタスクはすべて、研究メンバーが fMRI マシン内にいる間に与えられました。これはかさばる固定された実験装置です。このため、Tang 氏と彼のチームは、デコーダがまだ使用できる状態にないと考えています。これは、言語に問題がある人にとって、このツールは現時点では実行できないことを意味します.ただし、デバイスの将来のバージョンは、より単純なツールで動作するように変更される可能性があると考えています。患者の頭に装着できる fNIRS センサーなどのツール。

この研究を行ったチームは、デコーダーがメンタル プライバシーに関する道徳的問題を提起していると警告しています。ただし、彼らはこの技術が対話の新しい形としての可能性をほのめかしていました

Tang のチームは研究で次のように述べています

「私たちのプライバシー分析は、被験者の協力が現在両方のトレーニングに必要であることを示唆しています。そしてデコーダーを適用する…しかし、将来の開発により、デコーダーがこれらの要件を回避できるようになる可能性があります。さらに、被験者の協力なしにデコーダーの予測が不正確であったとしても、悪意のある目的のために意図的に誤解される可能性があります。また、各人の精神的プライバシーを保護するポリシーを制定する必要があります」

出典/VIA:

Categories: IT Info