Theo trang IFL Science, một bệnh nhân mắc bệnh xơ cứng teo cơ một bên (ALS) đã được cấy các mảng vi điện cực vào não ở những khu vực liên quan đến việc tạo ra lời nói. Giao diện não - máy tính (BCI) này giúp họ nói lên suy nghĩ của mình với mọi người.
Tập dữ liệu trên hệ thống BCI được huấn luyện tổng cộng 10.850 câu.
Giọng nói của bệnh nhân trên máy tính được giải mã từ ý muốn trong não của họ với tốc độ 62 từ/phút - nhanh gấp 3,4 lần so với kỷ lục trước đó.
Các tác giả cho biết lời nói của bệnh nhân trên máy tính có tỉ lệ "lỗi từ" - diễn đạt từ trong não ra máy tính bị sai - là 9,1% đối với từ vựng 50 từ và tỉ lệ "lỗi từ" 23,8% đối với một nhóm từ vựng lớn hơn.
Tiến sĩ Frank Willett, tác giả của nghiên cứu này, nói với Đài BBC: “Hệ thống BCI này được đào tạo để biết những từ nào nên đứng trước những từ khác và âm vị nào tạo nên từ nào".
Bệnh nhân được thử nghiệm nói với Đài BBC cho biết: Những tiến bộ này có thể giúp họ “tiếp tục làm việc, duy trì mối quan hệ bạn bè và gia đình”.
Tuy nhiên, họ cũng lưu ý rằng tỉ lệ "lỗi từ" 24% có lẽ vẫn còn cao để sử dụng hằng ngày. Ví dụ: so với tỉ lệ "lỗi từ" 4 - 5% đối với các hệ thống chuyển giọng nói thành văn bản hiện đại.
Nghiên cứu thứ hai, liên quan đến một bệnh nhân bị đột quỵ não nhiều năm trước.
Các tác giả đã “đào tạo và đánh giá các mô hình học sâu bằng cách sử dụng dữ liệu thần kinh được thu thập khi người tham gia cố gắng nói thầm các câu”.
Các nhà nghiên cứu cho biết bộ giải mã “đạt được hiệu suất cao” sau chưa đầy 2 tuần đào tạo.
Theo các nhà nghiên cứu, họ chứng minh khả năng giải mã từ vựng lớn từ suy nghĩ trong não nhanh chóng và chính xác, với tốc độ trung bình là 78 từ/phút và tỉ lệ "lỗi từ" trung bình là 25%.
Các tác giả đã cá nhân hóa giọng nói tổng hợp của bệnh nhân để giống với giọng nói của máy. Họ dựa trên một đoạn clip ngắn về giọng nói của bệnh nhân được trích từ video trước khi bệnh nhân này bị bệnh.
Các nhà nghiên cứu cũng tạo ra một hình đại diện kỹ thuật số để tái tạo nét mặt, sử dụng “hệ thống hoạt hình cho hình đại diện. Họ thiết kế để chuyển đổi tín hiệu giọng nói thành hoạt hình chuyển động trên khuôn mặt đi kèm bằng việc sử dụng cho các ứng dụng trong trò chơi và phim (đồ họa lời nói)”.
Bệnh nhân cho biết: “Thực tế đơn giản là nghe thấy một giọng nói giống giọng của mình là điều xúc động. Khả năng có thể nói to là rất quan trọng. Bảy năm đầu tiên sau cơn đột quỵ, tất cả những gì tôi sử dụng là một tấm bảng viết chữ. Nay máy giúp tôi có thể diễn đạt bằng lời nói”.
Tối đa: 1500 ký tự
Hiện chưa có bình luận nào, hãy là người đầu tiên bình luận