业界公认的人工智能是医疗行业革新的核心动力儿科。然而尽管机器学习在影像诊断方面表现强势但在数量巨大多样的电子病历数据分析方面仍面临巨大挑战研究。病历的数据信息之广数据类型之多以及某些方面的数据贫乏及可能出现的特殊情况等都导致机器学习难以进行精确的数据分析并形成预测临床检测的数据模型医疗。
“此次成果的核心技术部分实际上是通过深度学习技术与医学 知识图谱对EHR数据进行解构从而整合到预期的智能病种库中依图。随后可以更容易地利用智能病种库建立各种诊断模型医学。而诊断模型证明基于AI的系统可以帮助医生处理 大型数据和辅助诊断同时在诊断的不确定性和复杂性上给予临床支持”依图医疗总裁倪浩表示“儿科疾病症状多种多样临床医生本身难以区分诊断流程费时费力但 明确诊断非常重要期刊。拥有可与经验丰富的儿科医生相区分美的助手进行辅助诊断能够让医生有效地降低诊断时间显着优化诊断流程Nature。
依图与广州市妇女儿童医疗中心进行合作 收集了该中心在2016年1月至2017年7月间的567498个门诊病人的1362559次问诊电子病历取出到覆盖初始诊断包括儿科55种病例学中常见疾病的1.016亿个数据点并 将这些信息用作训练和验证系统框架以前的模型进行的研究使用了超过140万的庞大数据以完善的诊断系统由此发生的研究中使用数据在表达和描述上的一致性
不仅如此这项研究还基于NLP实现了病历的重新格式化国际。首先有超过25年临床实践经验的高级主治医师手动注释了6183个图表然后用3564 张人工标注的图表对NLP信息提取模型进行训练并用剩下的2619张图表对模 该NLP模型总结了代表临床数据的关键概念类别利用深度学习技术自动将EHR注解变成标准化词汇和临床特征中从而允许对诊断分类进行进一步处理。夏慧敏教授表示“这篇文章的启示意义在于通过系统学习文本病历人工智能或将可以诊断更多疾病。但必须要清醒认识到我们还要很多基础性工作要做扎实少量数据 的集成便便是一个长期的过程因为大数据的收集和分析需要算法工程师临床医生流行病学专家等内部的多专家的通力合作。