AI+PICOS在医学信息分析中的应用探索

自20世纪迈入信息大爆炸时代以来, 各行各业都在主动或被动地改变其产业模式, 伴随而来的问题也越来越多,我们需要这么多信息吗? 准确性如何? 我们不再担心信息匮乏, 却需要更多地培养自身理解信息和分析问题的能力。

一、医学信息学概要

医学信息学包括医学与计算机科学、临床信息学, 图形信息学和生物药物信息学等学科,是通过研究医疗资源、实验设计和方法, 高效获取医学信息, 并进行管理和合理利用信息的。

1965年由美国国家医学图书馆开发使用的Medline是世界上第一个面向公众,信息全面的线上医学数据检索平台,且被一直沿用至今。90年代国际上大量先进地区医疗机构都已经开始应用电子病历系统(ePR), 包括北美、香港等。 21世纪以来, 随着电子信息技术的高速发展, 医学信息学已不再仅仅用于信息管理层面, 更多的是辅助医生进行日常诊疗工作, 比如远程医疗技术, 手术机器人等。

二、循证医学研究方法

循证医学理论 (Evidence-Based Medicine,EBM)是以现实医学证据为基础的, 促进推动医疗行为决策的研究理论。在该理论模型下, 传统医学知识的循规蹈矩已不如真实医学证据所提供的价值高。该理论对各种真实医学证据做出了证据质量分级,其中Meta 分析、系统综述和随机临床研究(RCT)属于较高质量类型。

图1 证据等级金字塔

EBM研究共包括5个步骤:(1)将不确定性转化为可以回答的问题,其中要包含批判性,实验设计和证据等级;(2)系统化地检索可找到的最好证据;(3)批判性地评估证据的有效性和正确性;(4)将发现的结果应用到实践中;(5)应用中效果的分析评价。

简言之,EBM 研究是 “定义问题—搜寻证据—价值评估—实践应用—效果分析”的流程闭环,其中最主要的环节是定义问题和搜寻证据。在准备阶段,研究者必须对问题的理解和思路保证绝对的清晰,才可以正确且高效地完成后续步骤。在素材搜集阶段,只有保证了高质量的证据,才可能获得有价值的结论,否再如何优化实验过程和结果分析,也是徒劳。

三、PICOS是什么?

为了将问题分解得更加清晰明确, 也为了更精准地找到合适可用的证据,研究者们总结出了很多种的思维模型, 而其中最具代表性和实用性的就是 PICO(s),其中 P指Participants (研究对象),I 指 Intervention (干预手段),C 指 Comparator/Control (对比对照), O 指 Outcome (研究结果,终点),S 指 Study design (研究设计)。通过 PICO(s)的问题刻画和要素分解, 往往复杂且晦涩的临床研究问题都可以迎刃而解。

例如, 作为肿瘤二线疗法的单抗类药物是比较热门的研究领域, 如果我们想知道德瓦鲁单抗(Durvalumab, 阿斯利康)在接受过放化疗的非小细胞肺癌患者(NSCLC)中的疗效, 如何分解问题呢?

首先对于研究对象(P) 需要梳理出两个特征, 其一是NSCLC, 其二是已经接收过放化疗且需要后续治疗的患者;对于干预手段(I)I, 我们可以明确这个问题中的主要研究药物为Durvalumab; 对于 对照对比(C), 我们可以定义其为其他二线治疗手段, 或没有接受二线治疗的患者; 对于研究终点(O), 一般会用生存率指标和疾病缓解指标来定义肿瘤领域的药物疗效。

通过问题的结构化梳理后, 我们提炼出了精准的问题框架, 后面的文献检索过程就会变得清晰简单。在操作层面, 我们需要做的就是结合特定文献检索工具的逻辑连接词(例如MeSH), 将 PICO(s) 转化成检索策略, 完成证据收集。

四、大数据和人工智能技术助力创新科研

对于现今的医疗从业者来说,除了临床实践以外,不断学习和创新科研也是必需的工作内容,否则很容易被新知识新技术所淘汰,而且这方面能力也是医生职称评级的重要标准。

据Medscape公布,2015年美国专科医生平均收入为 28.4 万美元,据统计,中国医生2015年均收入为 7.7 万元。中国医生工资待遇比较低,但工作压力较大,在美国医生眼里,中国医生一天看100多个病人的方式是不可思议的,2 min内看一个人是非常不负责任的,不过这种情况是由国情所决定,且压缩了中国医生可用于学习与科研的时间精力。在这样的背景下,如何帮助医生更快地、有效地去学习和科研也是人工智能技术在医学领域的一个探索方向。

1.科学文献存在多语言性、内容专业、有效阅读存在难度等技术壁垒。