2020 年9 月,美国国家工程院院士李飞飞与博士生 Albert Haque 、斯坦福医学院教授 Arnold Milstein 共同署名的一篇关于环境智能与医疗的跨界文章,在Nature 上刊登。在近日举办的“2021红杉全球医疗健康产业峰会,”她就此文与人工智能、医疗健康的发展等,谈及了自己的看法。
AI在医疗场景的重要性
医疗场景其实包含了很多human behavior (人类行为)。人的行为、人的动作,在健康医疗场景中是极其重要。因此在这个前提下,我和合作者们大约在十年前就意识到,这是一个没有被关注到的重要信息源。
在医疗场景里,如果真正要让病人恢复健康的生活,还是要关注人的行为。我们当时就发现, 人工智能带来一个新的机会,它不光能通过感知器采集到环境信息与人的行为信息,还能做出智慧的分析,了解病人的情况有没有改变,医生或护士的行为有没有对病人的康复或者治疗、检测产生影响,这些信息都是非常重要的。
十年前,给我带来最大启发的其实是硅谷的无人车。作为当时斯坦福人工智能实验室的主任, 我发现无人车技术就是通过感知器、AI 算法和整个system integration 而产生的,这个想法就被我们放进了医疗的场景,进而产生了做环境智能(ambient intelligence)的想法。
在Nature 上发表的文章中,我们用了好几个医院场景和住家场景。比如每年重症监护室的经费约占美国GDP 的1%,这是一个非常重要的医疗环境。这里的病人都在和生死搏斗,医护人员的压力也非常重。在这样的场景下,一个不能动的病人如何才能不生褥疮?这个问题要怎么解决?
我们发现最重要的是病人的移动能力(mobility),移动能力对褥疮的预防和病人自身的康复非常关键。可是,怎样才能测移动能力?如果使用AI 智能感知器,就可以实时监测病人翻身的情况和移动能力。这个信息对护理和对医疗都非常重要,从这个小例子就可以看出AI 在医疗场景中能起到很大的作用。
我本人最关注的其实是住家的医疗场景,因为全球老龄化会导致一个人晚年要花很长时间待在家里,而且老年也是慢性病较多的年龄阶段。我们在全球老龄化的情况下,如何更好地让老人实现健康自理的生活呢?
我希望环境智能能起到很大的作用,比如老人的一些慢性病如果及时处理,就不需要去医院的急诊室。但是怎么才能及时发现老人身体状况的变化?比如他开始出现一些感染的现象,或者心率、呼吸发生了变化,又或者这一天都没有怎么动,他的饮食、睡眠的状况都发生了变化,甚至他不再从事平时的社交活动——这些信息现在的两个主要来源,一是护理人员,一是家人,但信息其实很不准确,而且不可能是连续的。
另外一个可能的信息来源就是穿戴式设备, 这也是我觉得很有发展前途的技术。但穿戴式设备也存问题,尤其对老人而言,穿戴式并不是一个很受欢迎的装置,而且不可能像眼睛一样看到老人多种行为的问题。
通过ambient 的装置与传感器,我们可以连续观测到老人行为的变化,并获得与医疗有关的一些重要信息,可以及时地传递给家人、医护人员。比如一位得慢性病的老人,可能只需要早点得到抗生素的干预,而不需要拖到两个星期后才去急诊室就诊或者住院,这就是一个住家的场景。此外,还有手术室的场景等,都是ambient intelligence 可以使用的。
ImageNet挑战赛
我为什么会做ImageNet 挑战赛呢?这要回到2006 年左右,那时候AI 还只是一个很好玩的计算机科学中的小领域。但是我当时一直在思考,AI 领域的“北极星”是什么?“北极星”就是我们领域最终极、最大的问题在哪里、我们要解决什么样的问题。
对我而言,视觉智能中最重要的“北极星” 就是丰富的物体识别。观察人的视觉系统就会发现,在这个眼花缭乱的世界,对成千上万物体的识别能力是我们最根本的视觉集成能力。如果没有这个能力,人类就做不了其他任何事情,我们不可能去逛街、不可能去商店买东西,也不可能做手工。
因此找到物体识别的奥秘,是我当时坚定认定的一颗“北极星”。可是找到这颗“北极星”也没用,因为我当时发现这个问题虽然被关注到, 但不知道何从下手。我那时候就意识到,可能我们以前走的路都走错了,以前拼命地去调模型的参数,只看一两类的物体。可能我们应该换一种想法,去用大数据推动视觉集成能力的学习。
最大视觉物体的类别是从字典里来的,这个字典很特别叫world net,里面有八万条名词幅。其中大概有两三万条名词幅是物体,而有些名词就不是物体,比如“生气”这个词,它就不代表物体。所以我将这两三万个物体的名词幅提取出来,而且很幸运地是,2007 年互联网成长得特别快,有了互联网数据源,我们的实验室就做了一项很巨大的工作。做了三年, 把十几亿幅图下载了下来,最后汇聚成了1500 万幅图的数据集。
我们当时的初心就是通过这一数据集去摘取这颗“北极星”,去解决这个重要的问题,这就是ImageNet 最初的故事。
ImageNet 正式开始于 2009 年。2017 年 7 月 18 日是ImageNet 最后一届挑战赛。当时获得冠军的AlexNet 团队用一百万张照片做了一千类物体的分类,这个第一名可以说是一个历史性事件,它带来了神经网络算法的第二春,启动了深度学习整个革命性的发展。从2012 年开始,我们的世界在过去十年里发生了很大的变化。
AI不单只是技术领域的问题
新冠疫情不管对个人的生活,还是对我们关注的技术、事业,都有很重要的影响。不管人类技术在21 世纪发展得多好,其实我们还有很多面对自然、面对身体健康等无法抗拒的挑战。新冠给我们带来了一次很大的冲击,推动了一些技术点的发展。例如远程医疗,新冠疫情急速地推动了远程医疗的应用,现在一些小事我都可以与医生远程视频会话,促进了与远程医疗相关的整个生态的发展。
同时,我非常明显地感觉到,医学院、医疗系统等合作伙伴通过ambient intelligence 可以连续获取病人的情况,甚至对病人的疾病做出技术性的判断。在疫情出现后,大家态度已经发生了转变,变得非常欢迎这样的技术。
很多人说新冠是全球是第一场infodemic—— infodemic 的意思就是,各种真假信息在急速地传播,对技术、对社会的影响都非常深刻。
我作为一名科学工作者和技术人,20 年前走进科学的领域,到今天我也改变和成长了很多。我没有想到,自己那么热爱的科学最后变成了改变社会的驱动力。我们大概在两三年前成立HAI (Human-Centered AI Initiative)时,意识到一个非常深刻的问题:AI 不单是技术领域的问题,它涉及的社会学、伦理学尤其深刻。
我们在HAI 有几个非常重要的研究领域, 第一个就是经济学。经济学是一门社会科学,但它也是一个非常重要的、和人息息相关的领域。现在有好几位世界顶级的经济学家在HAI 推动经济学方面的研究。
另一个重要的方向就是法律。法律涉及伦理, 现在AI 的参与其实是在挑战过去法律的一些基本假设。斯坦福法学院的教授参与了很多HAI 的工作,一方面是观察政府可以怎么应用AI, 来让政府的工作更有效;另一方面,也在思考怎么制定良好的政策和法律继续推动创新。
此外还有一个研究领域与社会伦理学有关, 就是艺术(arts)。我们很关注艺术,艺术是人类文明的重要部分,也是人类文明最特别的一部分。与其他的物种相比,艺术代表了人类的经验、人性的状态,也代表了社会发展的方向。艺术涉及政治与社会学,目前HAI 与艺术系、艺术家们在音乐、视觉艺术、文字艺术等方面都有深切协作。
AI发展需要与伦理指导
2018 年10 月,一幅由人工智能创作的肖像画在纽约佳士得拍卖会上拍出43.2 万美元( 约合人民币300 万元) 的高价。这是全球第一次用纯粹的算法生成的一幅艺术作品,被一位匿名买家用高价买走。
我们发现AI 算法可以产生出一些非常有意思的作品,而这对人类艺术家提出了挑战——人类艺术家的作用究竟在哪儿?如果AI 可以不断地产生出梵高的《星空》,而人们也热爱AI 艺术家创作的作品,那么人类的艺术家到底还能代表什么?他们究竟是代表人类的心声,还是代表一种特别的表达方式?现在该领域出现了很多相关探索。我们应当怎么开拓艺术创作的空间,有了AI 算法,同时也能让人类的表达和情感继续生存、发展下去。
我和Arnold Milstein 教授共同合作十年的研究室,在关注技术做研究的同时,几年前还成立了伦理委员会。因为我们发现,在医疗方面做AI 的研究会涉及很多新的伦理问题,如隐私、数据、公平等。而这些问题无法单纯由技术或者医学出身的人自己就可以全部解答。
因此,我们邀请了法律系的一位教授、伦理哲学领域的一位教授和两位伦理生物学的教授, 四个人共同成立了伦理委员会。他们和我有着高频的实时互动,帮助我们思考研究方向,一方面推动技术,另一方面也尊重人性,而且让科学创造利益,而不是去伤害或者预计之外伤害到病人或医护人员。
2017 年,斯坦福人工智能实验室一位资深教授推出了人工智能指数。HAI 在2019 年时将几项AI 指数项目合并后,继续推出这一指数报告。今年是我们推出人工智能指数报告的第四年, 宗旨就是致力于公平、公正、全面地报告全球的AI 研发进程。研究教育、工业界、产业界与商业, 从各方面报告一些影响或者变化。
2020 年因为新冠疫情的关系而出现了一些新的趋势。报告里指出,AI 领域出现了全球性的巨大投资,工业化也继续强劲地发展,并面临着多元化的挑战,AI 的使用人群仍以男性为主。
来源:高科技与产业化
文 / 李飞飞(美国国家工程院院士、斯坦福大学教授)