首个基于全国健康记录的AI问世
患者的医疗记录是AI模型的重要数据来源。
本报讯 全球首个基于全国健康记录的生成式人工智能(AI)模型正式亮相。这款名为“前瞻”(Foresight)的模型能够预测住院风险、心脏病发作及数百种其他疾病。研究人员利用英国国家医疗服务体系(NHS)5700万名患者的匿名数据对其进行了训练。
目前,“前瞻”仅可用于与新冠相关的研究,且必须在NHS运营的安全“数据环境”中运行。在5月6日的**发布会上,英国剑桥大学健康数据科学家Angela Wood表示,这是首次在5700万人的健康研究中使用AI模型,是真正的突破性进展。
“如果AI的预测在不同人群中被证明是有价值的,那么它最终有望指导个体患者诊疗,并帮助分配NHS的资源。”Wood补充道。
随着AI通过疾病诊断和其他医疗任务逐渐融入医学研究,并且在某些情况下超越人类,相关技术在医疗领域的发展已成为趋势。
“前瞻”的早期版本用英国伦敦约150万人的健康记录进行了训练,并测试了其根据患者病史预测未来诊断的能力。在一项研究中,该模型在大多数情况下作出了正确判断。
“前瞻”整合了多个数据源,包括医院记录、疫苗接种记录、全科医生就诊记录以及英国国家死亡登记系统数据。最新版本覆盖了2018年至2023年的数据,总计约100亿条医疗事件数据。
这些数据删除了患者姓名、地址和出生日期等身份信息。作为额外的保护措施,“NHS英格兰”数据访问主管Michael Chapman在发布会上表示,该模型只能在NHS的计算机系统上运行,且生成的任何研究预测都将在发布前接受筛查。
然而,英国牛津大学数据隐私研究员Luc Rocher指出,完全杜绝从模型中提取患者隐私数据可能很难。他表示:“数据的丰富性使其对AI具有价值,但也让匿名化难上加难。这些模型应该始终处于NHS的严格控制下,确保安全使用。”
“前瞻”仅用于约100个与新冠相关的现有项目。这些项目由英国心脏基金会和“NHS英格兰”**开展,旨在利用患者数据研究疫情的影响。Chapman表示,任何超出这一范围的研究用途均需额外审批。
研究人员还将测试在给定2018—2022年病史的情况下,“前瞻”能否准确预测患者在2023年将发展出约1000种疾病中的哪一种。英国伦敦大学学院健康数据科学家Chris Tomlinson在发布会上表示:“这使我们能够尽可能接近‘真实情况’。”
“NHS数据在训练此类生成式健康模型方面具备的潜力令人兴奋。”德国癌症研究中心的健康数据科学家Moritz Gerstung认为,NHS数据的庞大规模将提升医疗AI的准确性,使其能更好地预测罕见疾病或解读非典型病史。
(蒲雅杰)