2021脑机接口机遇与挑战,2021脑机接口技术大会

  

     

  

  从2021年初至今短短8个月,脑机接口(BCI)领域的融资就创下了历史纪录,总金额是2019年9700万美元的3倍。   

  

  就在过去几周,Neuralink,(elon musk)旗下的一家BCI公司宣布获得2.05亿美元的C轮融资,而另一家BCI公司Paradromics,也在几天前宣布获得2000万美元的种子轮融资。   

  

  几乎在同一时间,Neuralink的竞争对手Synchron,宣布,它已经获得了美国美国食品药品监督管理局(FDA)的历史性批准,可以用其旗舰产品Stentrode在人类患者身上进行临床试验。甚至在获得批准之前,Synchron公司的Stentrode已经在澳大利亚对四名患者进行了临床试验。   

  

  总的来说,BCI可以把人的脑电波转换成机器可以理解的指令,让人用自己的思想去操作电脑等。该技术的核心是扩展我们的人类能力或补偿失去的能力,可以说是瘫痪病人的福音。   

  

  目前,该领域的公司通过两种形式的BCI来实现这一目标:——侵入式和非侵入式。在这两种情况下,大脑活动都将被记录下来,以将神经信号转化为指令,例如用机械臂移动物体,通过思考打字或通过思考说话。   

  

  虽然很多人对Neuralink的进步和BCI指日可待的说法持怀疑态度,但机器学习技术的进步表明BCI已经非常接近现实。   

  

  模式识别和迁移学习   

  

  作为BCI将神经信号转化为指令的“主引擎”,机器学习可以识别大脑数据中的模式,并能够将这些模式泛化到许多人的大脑中。   

  

  与几十年前将大脑活动转化为行动的挑战不同,今天BCI的主要目标是为公众开发商业产品。这些产品应该能够找到不同大脑中的共同信号,并将其转化为类似的动作,例如表示“移动右臂”的脑电波模式。   

  

  但这意味着模型需要一系列的微调。以Neuralink在MindPong的演示为例。恒河猴在模型被微调到他大脑的神经活动模式之前经历了几分钟的校准。   

  

     

  

  幸运的是,人工智能在模式检测方面的研究已经取得了很大的进展,特别是在视觉、音频和文本领域,产生了更强大的技术和架构,使得人工智能的应用得以推广。   

  

  2017年底, 《Attention is all you need》 ,发表了一篇开创性的论文,他提出的“变压器”架构启发了许多其他论文,在许多领域和模式上带来了突破。   

  

  最典型的有谷歌的ViT、DeepMind的多模式感知者和脸书的wav2vec 2.0,它们都在各自的基准测试中取得了最先进的成果。   

  

  值得注意的是,Transformer架构的一个关键特性是其“无样本”和“少样本”的学习能力,这使得人工智能模型的泛化成为可能。   

  

  日渐丰富的数据   

  

  传统上,最先进的深度学习模型(如上面提到的谷歌、DeepMind和脸书的模型)往往需要大量数据。作为参考,OpenAI著名的GPT-3模型(一种能够生成人类语言的转换器)是用45GB的文本进行训练的,包括Common Crawl、WebText2和维基百科数据集。   

  

     

  

  不难发现,在线数据是推动计算机生成自然语言应用爆发式增长的主要催化剂之一。当然,EEG(脑电图)数据不像维基百科页面那样容易获得,但这种情况也正在发生变化。   

  

  世界各地的研究机构正在发布越来越多与BCI相关的数据集,以便研究人员可以相互学习。例如,多伦多大学的研究人员使用了天普大学医院脑电图图书馆(TUEG)的数据集   

数据集由超过10,000人的临床记录组成。

  


  

在他们的研究中,他们使用了一种受谷歌BERT自然语言Transformer启发的训练方法,开发了一个预训练的模型,可以对用各种硬件记录的原始EEG序列进行建模,并跨越各种科目和下游任务。

  


  

然后,他们展示了这种方法如何能够产生适合大量未标记EEF数据和下游BCI应用的表示。

  


  

但在研究实验室中收集的数据对于现实世界的应用来说可能还不够。如果BCI要加速发展,我们需要开发出人们可以在日常生活中使用的商业产品。

  


  

随着OpenBCI等项目提供可负担得起的硬件,以及其他商业公司现在向公众推出其非侵入式产品,数据可能很快就会变得更容易获得。

  


  

两个例子是NextMind和Kernel,前者去年推出了一个开发者工具包,供那些想在NextMind的硬件和API上编写代码的开发者使用,后者则计划很快发布其非侵入式大脑记录头盔Flow。

  


  

  


  


  

▍硬件和边缘计算

  


  

可以肯定的是,BCI应用有实时操作的限制,如打字或玩游戏。如果从思想到行动的延迟超过一秒钟,就会产生一种不可接受的用户体验,因为交互会出现滞后和不一致(想想玩第一人称射击游戏时有一秒钟的延迟)。

  


  

但原始EEG数据需要发送到远程推理服务器,然后将其解码为具体行动,并将响应返回给BCI设备,这一过程就会产生延迟。此外,发送敏感数据(如您的大脑活动)会引入隐私问题。

  


  

怎样解决这些问题呢?AI芯片或许是一个思路。像英伟达和谷歌等巨头都在建造更小、更强大的芯片,这些芯片将为边缘推理而优化。这反过来又可以使 BCI 设备离线运行,避免了发送数据的需要,消除了与之相关的延迟问题。

  


  

  


  


  

▍结语

  


  

几千年来,人类的大脑没有进化多少,而我们周围的世界在过去十年里发生了巨大的变化。人类已经达到了一个拐点,我们必须增强我们的大脑能力,以跟上我们周围的技术创新。

  


  

目前将大脑活动还原为电信号的方法有可能是错误的,如果Kernel和NextMind等公司没有产生有前途的商业应用,我们可能会经历BCI的冬天。但潜在的好处是不容忽视的,从帮助无法正常生活的瘫痪者到增强我们的日常体验,每一项都功德无量。

  


  

BCI仍处于早期阶段,有许多挑战需要解决,有许多障碍需要克服。然而,对于一些人来说,这应该已经足够令人兴奋了。

  



相关文章