Theo một nghiên cứu gần đây, các nhà khoa học đã tạo ra một trình phân tích cú pháp ngôn ngữ sử dụng công cụ AI tương tự như ChatGPT để chuyển lời nói thành văn bản. Phát hiện này rất đáng chú ý vì đây là lần đầu tiên ngôn ngữ liên tục được phục hồi không xâm lấn từ hoạt động não bộ của một người bằng thiết bị chụp cộng hưởng từ chức năng (fMRI). Bằng cách sử dụng các mẫu não fMRI, công cụ có thể diễn giải các điểm chính của câu chuyện mà các đối tượng là con người đọc, xem hoặc nghe—hoặc thậm chí chỉ là hình dung—theo cách cho phép công cụ đọc được suy nghĩ của mọi người một cách an toàn. Các nhà khoa học kỳ vọng rằng công nghệ này, vẫn còn ở giai đoạn sơ khai, một ngày nào đó có thể giúp những người mắc bệnh thần kinh suy giảm khả năng nói dễ dàng trò chuyện với người khác.
Trí óc – đọc các công cụ có thể được sử dụng cho mục đích xấu
Nhóm nghiên cứu bộ giải mã cảnh báo rằng các công cụ đọc trí óc có thể bị sử dụng cho các mục đích xấu. Một trong số đó có thể là sự giám sát bất hợp pháp của chính phủ. Theo một báo cáo được công bố vào thứ Hai trên tạp chí Nature Neuroscience, các tác giả đã tuyên bố rằng “các giao diện máy tính-não nên tôn trọng quyền riêng tư về tinh thần”, ngay cả khi họ lưu ý rằng công cụ của họ cần một nhóm đối tượng là con người nỗ lực để hoạt động.
Jerry Tang, sinh viên mới tốt nghiệp trong khoa học máy tính tại Univ. của Texas tại Austin, người đứng đầu nghiên cứu, trong một cuộc họp báo được tổ chức vào thứ Năm tuần trước cho biết
“Hiện tại, việc giải mã ngôn ngữ được thực hiện bằng cách sử dụng các thiết bị cấy ghép cần phẫu thuật thần kinh và nghiên cứu của chúng tôi là nghiên cứu đầu tiên giải mã ngôn ngữ liên tục, có ý nghĩa nhiều hơn các từ hoặc câu đầy đủ, từ các bản ghi não không xâm lấn mà chúng tôi thu thập bằng cách sử dụng MRI chức năng… Mục tiêu của ngôn ngữ – giải mã là ghi lại hoạt động não của người dùng và dự đoán các từ mà người dùng đang nghe hoặc nói hoặc tưởng tượng ,”anh lưu ý. “Cuối cùng, chúng tôi hy vọng rằng công nghệ này có thể giúp những người mất khả năng nói do chấn thương như đột quỵ hoặc các bệnh như ALS.”
Cách thức hoạt động của công cụ AI mới
Ba người, mỗi người đã dành 16 giờ để lắng nghe những câu chuyện trong một công cụ fMRI đã giúp Tang và những người khác tạo ra công cụ của họ. Để kết nối các khía cạnh ngữ nghĩa của các câu chuyện được ghi lại với hoạt động của não được ghi nhận trong dữ liệu fMRI, nhóm đã đào tạo một mô hình AI có tên là GPT-1. Sau đó, nó có thể học những từ và cụm từ nào được liên kết với các mẫu não cụ thể.
Tín dụng hình ảnh: Niche Pursuits
Sau đó, những người tham gia lắng nghe những câu chuyện hoàn toàn mới không thuộc tập dữ liệu đào tạo. Trong khi làm điều này, họ đã chụp ảnh bộ não của mình bằng fMRI. Mặc dù những cách diễn giải này thường được sử dụng sử dụng các cấu trúc ngữ nghĩa khác với bản ghi gốc, nhưng công cụ này vẫn có thể dịch cốt truyện âm thanh thành văn bản khi mọi người nghe thấy chúng. Ví dụ: sử dụng trình đọc fMRI, suy nghĩ của người nghe được dịch từ đoạn băng của một diễn giả nói rằng… “Tôi chưa có bằng lái xe” thành “Cô ấy thậm chí còn chưa bắt đầu học lái xe”.
Tin tức trong tuần của Gizchina
Những kết quả đọc không ổn định này là do sự khác biệt quan trọng giữa công cụ mới và các phương pháp đã được thiết lập. Các phương pháp tiêu chuẩn cũ xâm lấn cấy điện cực vào não. Trong khi nhóm của Tang tập trung vào dòng máu chảy qua não, đó là thứ được ghi lại trong máy fMRI. Các công cụ dựa trên điện cực thường dự đoán văn bản từ các hoạt động vận động. Điều này bao gồm các chuyển động của miệng một người khi họ cố gắng nói.
Công cụ không đưa ra các từ chính xác
Alexander Huth, một trợ lý giáo sư. về khoa học thần kinh và khoa học máy tính tại UT Austin, đồng thời là tác giả chính của nghiên cứu mới, cho biết trong một cuộc họp báo
“Hệ thống của chúng tôi hoạt động ở một cấp độ rất khác… Thay vì xem xét thứ vận động cấp thấp này, chúng tôi hệ thống thực sự hoạt động ở cấp độ ý tưởng, ngữ nghĩa và ý nghĩa. Đó là những gì nó đang hướng tới… Đây là lý do tại sao tôi nghĩ những gì chúng tôi rút ra không phải là những từ chính xác mà ai đó đã nghe hoặc nói, mà là ý chính… Đó là cùng một ý tưởng nhưng được diễn đạt bằng những từ ngữ khác nhau.”
Công cụ mới của nhóm cho phép họ vượt qua giới hạn của trí óc – công nghệ đọc. Điều này được thực hiện bằng cách kiểm tra xem công cụ có thể dịch suy nghĩ của các đối tượng khi họ xem phim câm hay không. Nó cũng thực hiện lại quy trình khi các đối tượng chỉ tạo ra những câu chuyện trong đầu họ. Trong cả hai trường hợp, bộ giải mã đã thu được một số kết quả khá tốt. Cho dù họ đang tạo ra những câu chuyện trong đầu hay đang xem một bộ phim, bộ giải mã đều hoạt động tốt.
Tín dụng hình ảnh: Wired
Đối với giọng nói tưởng tượng, bộ giải mã cho kết quả tốt hơn trong tất cả các thử nghiệm với bản ghi âm. Nhưng nó vẫn có thể suy ra một vài sự thật cơ bản về những suy nghĩ không thành lời từ hoạt động của não bộ. Như một trường hợp nghiên cứu, một đối tượng đã tưởng tượng ra câu nói… “đi trên một con đường đất băng qua cánh đồng lúa mì, băng qua một con suối và cạnh một số tòa nhà bằng gỗ”. Bộ giải mã tạo ra một văn bản có nội dung… “anh ấy phải đi bộ qua một cây cầu để sang phía bên kia và một tòa nhà rất lớn ở phía xa.”
Các vấn đề lớn về quyền riêng tư chắc chắn sẽ phát sinh
Tất cả các nhiệm vụ này được giao cho các thành viên nghiên cứu khi họ ở trong máy fMRI. Đây là một thiết bị phòng thí nghiệm cồng kềnh và cố định. Do đó, Tang và nhóm của ông tin rằng bộ giải mã vẫn chưa sẵn sàng để sử dụng. Điều này có nghĩa là đối với những người có vấn đề về giọng nói, công cụ này không khả thi vào lúc này. Tuy nhiên, họ tin rằng các phiên bản tương lai của thiết bị có thể được thay đổi để hoạt động với các công cụ đơn giản hơn. Các công cụ như cảm biến fNIRS có thể đeo trên đầu bệnh nhân.
Nhóm thực hiện nghiên cứu cảnh báo rằng bộ giải mã đặt ra những câu hỏi đạo đức về quyền riêng tư tinh thần. Mặc dù vậy, họ đã ám chỉ đến tiềm năng của công nghệ này như một hình thức đối thoại mới
Nhóm của Tang cho biết trong nghiên cứu
“Phân tích quyền riêng tư của chúng tôi cho thấy rằng hiện tại cần có sự hợp tác của cả hai đối tượng để đào tạo và áp dụng bộ giải mã… Tuy nhiên, những phát triển trong tương lai có thể cho phép bộ giải mã bỏ qua những yêu cầu này. Hơn nữa, ngay cả khi các dự đoán của bộ giải mã là không chính xác nếu không có sự hợp tác của chủ thể, chúng có thể bị hiểu sai một cách có chủ ý vì mục đích xấu… “Vì những lý do này và những lý do không lường trước khác, điều quan trọng là phải nâng cao nhận thức về những rủi ro của công nghệ giải mã não bộ. Cũng cần phải ban hành các chính sách bảo vệ quyền riêng tư về tinh thần của mỗi người,”
Nguồn/VIA: