让人工智能算一算你能活多久?

人工智能不仅在围棋领域以AlphaGo战胜人类第一高手的方式怒刷了一遍存在感,在医疗领域,越来越多人工智能的应用也引起了强烈关注。近日,一则“人工智能将能预测人类寿命”的新闻冲上微博热搜,在网上引起热议。人工智能如何预测人的寿命?人工智能在医疗领域有哪些发展?AI能取代医生看病吗?

你能活多久?让人工智能算一算

基于大数据的“能活多久”

我们经常在影视剧或一些报道中看到类似场景:某重病病人问医生“我还能活多久”,医生给出“不超过半年”的答案。结果病人存活了好几年,由此得出结论:这名医生判断错了。

现在这种判断正由人工智能在尝试。据国外媒体报道,澳大利亚阿德莱德大学的研究人员利用“深度学习”技术,通过分析病人的胸腔影像,对预期寿命不超过五年的病人进行了预测,最终精确率约为69%,和医生的预测结果差不多。研究认为,计算机可以从图片识别中各种疾病的复杂症状,当病人患有肺气肿和充血性心力衰竭等严重慢性疾病时,系统对自己的预测结果最为自信。研究者认为,该研究对严重疾病的早期诊断或具有重要意义,让医生可及时介入为病人提供量身定制的治疗方案。不过,这项研究选取的样本只有48名病人,该团队计划下一个研究阶段分析数万张病人医学图像,并计划用同样技术对其他病症进行预测,如早期心脏病等。

这条新闻迅速以“人工智能将能预测人类寿命”为题引起强烈关注,有网友开玩笑说,“纠结要不要让AI给自己算一命”。人工智能预测人类寿命靠谱吗?

“其实人工智能的逻辑和医生是一样的。”广州医科大学附属肿瘤医院肿瘤内科主任邹青峰教授告诉记者,医生判断病人的生存期限,是一个很复杂的过程。以肿瘤病人为例,要看疾病的分期、肿瘤的大小,有无转移,有无并发症,最关键的是,还要看治疗效果。治疗效果好的病人,生存时间自然会更长。以晚期肺癌为例,没有基因突变的病人,中位生存期约一年多,治疗后最好效果约两年;有基因突变,用靶向药物,中位生存时间可以达到3年。如果耐药后有条件继续用上新药,中位生存时间可能不止5年,个体差异特别大。

“其实,医生并不愿意对个体病人做出这种 还能活多久 的预测,因为个体的差异太大,很难去预测。”邹青峰教授介绍,医生的判断也是基于大数据的分析,根据已有文献研究,给出“中位生存时间”。“这就和平均寿命一样。有的人少于这个数字,也有人长于这个时间。但对于个体来说,医生是没法给出明确判断的。”

邹青峰教授认为,人工智能预测病人寿命,同样也是根据大数据的学习来预测。比如疾病的诊断分期、治疗的结果、疾病进展生物信息、中位生存时间、已有文献研究等等。“只要设计的参数、权重比例合理,人工智能能做出这样的预测一点不奇怪。”而且,人工智能有强大的数据处理能力和学习能力,结果也会越来越精准。

邹青峰教授认为,未来人工智能会成为医生很好的辅助诊断和治疗的工具。比如在病理诊断、影像比对等方面,可能只有一些顶尖医生可以跟人工智能媲美,而大部分医生达不到这个结果。医生还需要通过查资料、会诊、找印证等一系列繁琐的工作,人工智能系统通过大数据存储和分析,可以轻松完成这个过程。

人工智能能否取代医生?

人工智能在阿尔法狗的新闻效应下备受关注。事实上,在医疗领域,尤其是病理诊断、影像、肿瘤治疗等领域,人工智能早已大热多时。

例如最有名的是IBM开发的人工智能系统“沃森”,这一系统宣称已经吸纳美国大量肿瘤病例、超过300种医学专业期刊、超过250本肿瘤专著、超过1500万份论文研究数据等,制定的治疗方案与知名医院医学专家的治疗方案“有90%的符合度”。今年6月初时广州已有两家基层医院引进这一系统,用于辅助医生诊断和选择治疗方案。

人工智能正逐渐成为提高医生效率的有力助手。以糖尿病患者的视网膜病变为例,这种最常见的糖尿病并发症,是四大致盲眼病之一。数据显示,美国成人失明的第一大原因是糖尿病导致的视网膜病变,目前中国有1.4亿糖尿病人,其中20%会出现视网膜病变。但内分泌医生如何提前发现糖尿病患者的视网膜病变是一大问题,这势必需要借助眼科医生的会诊。而中国眼科医生仅有3.6万名,目前中国还有20%的县级医院没有眼科,这也造成一些糖尿病病人不能及时进行眼底筛查。创立于2015年的Airdoc公司,花费大量时间从多家国内外顶级医院收集了数十万张眼底照片,构建卷积神经网络,在糖尿病性视网膜病变辅助诊断上,获得与三甲医院医生相当的水平。这一系统目前已经进入临床应用。

人工智能如何学习来当医生?Airdoc公司算法工程师陈飞告诉记者,人工智能的发展,以2012年作为一个分水岭。在此之前,人工智能的算法还属于浅层学习,计算机根据人类设计的特征去进行学习。“例如让计算机识别摩托车,人类工程师会告诉它摩托车的特征,例如有两个轮子、有车把、有个发动机,这种学习受人的预设和先验经验限制。对于复杂的医学领域来说,影像之间相似、病灶也相似,浅层学习在这一领域的应用准确度就比较差。”
 

2012年是人工智能里程碑的节点,这一年深度学习技术爆发。和浅层学习的区别是,深度学习的算法模拟人脑的神经元结构,构建一个神经网络,不预设条件,输入大量的数据让计算机自己去学习特征,随着数据量样本的增大,计算精度会越来越高。
 

人工智能的核心是算法和数据。尤其是需要海量的数据。就好比一个每天都在不断学习吸收新信息的医生,和一个经常睡大觉不用功的医生相比,数据量的大小,直接决定了“医生”水平的高低。而算法工程师好比去西天取经的唐僧,需要在医生帮助下把梵文的经书(医学知识和医生的经验)转化成常人的语言(处理后的数据和算法规则),让计算机去学习。

不过,陈飞认为,目前只是初级的人工智能阶段,电影上经常出现的强人工智能离现实还很远。即便是世界上最好的人工智能深度学习网络,拥有10亿级别的神经元,但相对人类大脑神经元的数量来说仍远远不及。而且这种模拟神经元,还无法模拟人脑神经元之间复杂的化学反应。此外,医学是复杂的学科,对病人来说,面对面接触、语言安慰等人文关怀都是有助治疗的因素,“机器是冰冷的,人是活的。”因此,人工智能取代医生不太现实。辅助医生提高效率,减轻医生负担,让医生空出手来做更好的治疗,是人工智能目前努力的方向。

“数据污染”阻碍人工智能发展

人工智能的学习需要好的教材。优质的数据成为关键。在这一点上,丁香园创始人、董事长李天天认为,中国过去30年实行的“以药养医”政策,带来一个非常严重的问题,就是“数据污染”。“任何人工智能技术,都是要靠一批高质量的数据来训练的。但 以药养医 的政策,导致过度治疗、过度检查。这种情况,造成临床数据尤其是治疗数据的污染。”

李天天举例说,比如一个4岁的小朋友,得了单纯的感冒,但他的用药处方中出现了最新一代的头孢,甚至出现一些营养品。“这个数据污染,给我们做人工智能训练,带来一个几乎不可完成的任务。技术人员无法从中看出这些 猫腻 来。”

基于“数据污染”的现状,李天天认为,人工智能在医疗方面的进展,一是诊断比治疗会走得好。诊断数据受到污染的情况少得多;第二,图片比文字好诊断。文本识别是人工智能非常大的挑战,因为很多自然语言不是计算机能够区别1和0那么容易;第三是垂直比综合好做。“现在世界上有两种阵营,像我们熟悉的阿尔法狗,它就是窄的垂直的,它只会下围棋,不会开车。但Deepmind用一个大数据去训练一个人,像训练孩子一样,它什么都知道,但做大是很难。”

也正是基于这样的判断,丁香园选择了在皮肤科领域发展人工智能。今年5月19日,丁香园、中南大学湘雅二医院和大拿科技共同宣布,就皮肤病人工智能辅助诊断达成独家战略合作,并发布由三方联合开发的“皮肤病人工智能辅助诊断系统”。这一套系统通过医院方提供的3万多张皮肤病图片和病例图片学习,第一期主要实现以红斑狼疮为代表的皮肤病人工智能辅助诊断,识别准确率超过85%。未来还会在皮肤科其他领域开展研究,比如像黑色素瘤等高发的皮肤肿瘤。

人工智能辅助诊断系统,会否有一天可以去掉“辅助”二字,取代医生?医生出身的李天天认为,即便是未来十年二十年,也很难。医学永远充满不确定性。患者不能依靠概率来判断,这种不确定性必须要结合医生的经验来做。所以“辅助”这两字必须要保留。

加州大学伯克利分校教授、人工智能专家Michael Jordan前不久在腾讯“云+未来”峰会上公开表示让人工智能做医学诊断的担忧:“我们所谓的人工智能看上去很智能,但并非如此。比如说在医疗行业中,我们让机器做很多的医学诊断,这是不太可能的,有很多人会因为这种不畅的诊断,出现剂量问题,而在一些环境中,AI的诊断也会受到影响,这种影响的结果可能造成病人的死亡。”

邹青峰教授也指出,人工智能也有自己的短板。例如,在疾病的治疗上,“沃森”系统会基于充分的大数据证据给出诊断和治疗方案建议,但一旦遇到很个例的病案,缺少相关循证医学证据,“沃森”就只能交出“没有意见”的白卷。而医生作为人类,可能会设计出更有创新和突破性的治疗方案。