Page 27 - 嘉和资讯129期
P. 27
嘉和专栏
专题策划——数据资源的管理与利用 专题策划——数据资源的管理与利用
Special Planning Special Planning
基于人工智能技术的临床数据资源中心建设实践 【Keywords】Clinical data resource center; Multi-source heterogeneous data; Artificial intelligence technology;
Clinical data model
陈联忠 计虹 胡可云 张晨 王飞 席韩旭 赵士洁 近年来,随着我国医疗信息化 1 数据需求分析 束后,数据收集治理即停止;另一
建设的不断完善和深化,产生的医 1.1 数据新需求 在国家电子病历评 些课题在当前研究结束后,仍有持
【摘要】目的:在医院数据中心基础上,进一步融合院外及公开多源异构数据,并通过标准化数据建模和数据 疗数据量也愈发庞大,而人工智能 级与医院互联互通评级等政策推动 续收集高质量数据的需求,但由于
治理,构建高质量临床数据资源中心,以支持医院开展高质量临床研究,并将研究成果反哺临床,提升研究成
技术对于海量数据的治理、优化则 下,经过近些年建设,很多医院已 没有专人管理,导致数据逐渐变成
果转化能力,实现从数据到科研到临床的一体化发展闭环。方法:利用大数据及人工智能技术,设计多层次、
起到不可或缺的作用,包括数据的 基本完成数据中心的初步建设以及 死数据,甚至被废弃。上述现象都
多维度的数据模型,将原始数据转化为标准化的,可满足科研、临床等不同场景需求的多模态数据集合。结
模型管理、质量管理、安全隐私保 在这之上的相关应用建设,较好地 造成研究数据资源的极度浪费,因
果:临床数据资源中心已入库治理5 000余万诊次临床诊疗数据、1 000多万条随访数据,整合45个既往与在研
护、共享开放等,都越来越受到各 支撑了业务系统及上报统计等需 此,也需要有统一规范的临床数据
课题研究数据,18个气象、文献及基因等公开数据;形成614个数据模型和10 479个研究可用字段;支持CDSS
方面的关注。因此,如何利用人工 求,因此,服务于业务的数据中心 资源中心来进行管理。
等数据服务调用频率高达162万次/天;支撑521位科研人员和团队建立了1 532个研究人群和专病库,已有62个
智能技术,实现对各类临床数据的 已相对成熟。但对于临床研究者以 1.4 临床科研一体化新需求 公立医
研究模型成果转化反哺临床。结论:通过建设高质量临床数据资源中心,可高效满足临床研究团队对相关数据
高质量整合及二次利用,也成为当 及数据研发人员而言,在利用数据 院高质量发展,不但要求有高水平
的使用需求,且随用、随查、随取、随分析,降低了数据使用门槛,提升了研究效率。
【关键词】临床数据资源中心;多源异构数据;人工智能技术;临床数据模型 下研究的热点方向。与此同时,国 中心进行临床大数据相关深度应用 的临床研究能力,同时也要有高效
Doi:10.3969/j.issn.1673-7571.2023.01.006 家政策也从行业发展及创新应用等 分析时,仍需完成原始数据导出、 的成果转化能力。也就是说,一方
【中图分类号】 R319 层面,给予了大力支持。 数据摘取、清洗、数据填充、多模 面,来源于临床的诊疗业务数据要
从行业发展角度,国家卫生健 态数据集成、院外数据合并等大量 通过临床数据资源中心,不断转变
Construction of a clinical data resource center based on AI technology 康委发布的关于《国家医疗健康信 处理工作,给相关人员带来很大负 为高质量的研究数据;另一方面,
CHEN Lianzhong, JI Hong, HU Keyun, ZHANG Chen, WANG Fei, XI Hanxu, ZHAO Shijie. Goodwill Hessian Health 息医院互联互通标准化成熟度测 担。由此看出,当前服务于数据深 研究产生的成果也要能反哺临床真
Technology Co., Ltd., Beijing 100085, China (CHEN Lianzhong, HU Keyun, WANG Fei, ZHAO Shijie); Information 评》评级标准提出“具备基于医院 度利用挖掘的高质量临床数据资源 实世界应用,并对诊疗水平进行优
Management and Big Data Center, Peking University Third Hospital (JI Hong, ZHANG Chen, XI Hanxu) 信息平台独立的临床数据库”要求, 中心建设仍有待完善。 化改进。然而,目前还缺乏完善的
Corresponding author: JI Hong, Email: ji_hong@126.com 对数据传输时效性提出明确标准; 1.2 应用新需求 在临床创新研究过 临床科研一体化转化应用平台 。
[3]
【Abstract】Objective To further integrate out-of-hospital and open multi-source heterogeneous data on the basis of 《电子病历系统应用水平分级评价 程中,通常会由临床专家、算法专
the hospital data center, and to build a high-quality clinical data resource center through standardized data modeling and 标准(试行)》要求“形成临床数 家、计算机专家等多角色组成复合 2 临床数据资源中心设计框架
data governance, so as to support the hospital to carry out high-quality clinical research, feed the research results back 据仓库,有统一索引与规范数据格 研究团队,用新理论、新算法和新 基于以上背景和需求,本研究
to the clinic, improve the ability to apply the research results, and achieve an integrated development closed-loop from
式,形成结构化数据内容”,规范 模型进行反复测试、调优和验证。 提出了临床数据资源中心的总体建
data to scientific research to clinical. Methods A multi-level and multi-dimensional data model was designed using big 由于研究人员多来自不同机构,如
data and AI technology, and the original data was converted into a standardized multi-modal data set that could meet 了临床数据资源中心建设的基本 设方案,具体如下。
内容。 高校、科研院所、合作医院、公 2.1 系统架构 系统设计为分布式
the requirements of different scenarios such as scientific research and clinical. Results The clinical data resource center
has stored more than 50 million clinical treatment data and more than 10 million follow-up data; integrated 45 previous 从创新应用角度,《关于推动 司、本医院等,为合作方便,目前 可扩展架构,具备多模态数据汇
[4]
and ongoing research data, and 18 public meteorological, literature, and genetic data, etc.; formed 614 data models and 公立医院高质量发展的意见》,“中 常见模式是根据研究需要申请导出 聚 、可视化的术语管理、数据处
10,479 research fields available; supported CDSS and other data services with a call frequency of 1.62 million times/ 央高水平医院临床科研专项”以及 相关数据,极易造成数据的流失和 理、数据质控、数据治理等通用化
day. The center also supported 521 researchers and teams to establish 1,532 research populations and special disease 国家 11 部门《提升高水平医院临 不可控管理。因此,亟需建设便利 平台工具;同时构建多层次、多维
banks, and 62 research models have been translated into clinical results. Conclusion The construction of the high- 床研究和成果转化能力试点方案》 安全的临床数据获取和分析环境。 度的临床数据模型;建立数据脱敏
quality clinical data resource center can effectively meet the needs of the clinical research team for the use of relevant 等发布,为医院创新驱动发展注入 1.3 数据管理新需求 以往临床研究 和账号安全体系;最后提供数据与
data, and it can be used, checked, retrieved, and analyzed at any time, lowering the threshold of data use and improving 新的动能。安全可控的高质量临床 数据都是课题组自己保管,存储分 模型API服务,见图1。
research efficiency. 数据资源中心,是医院信息化创新 散,数据形式各异,如小型系统、 2.2 资源中心数据范围 临床数据资
作者单位:100085 北京,北京嘉和海森健康科技有限公司(陈联忠、胡可云、王飞、赵士洁);北京大学第三医院信息管理与大数据中 发展、数字化转型的重要基础,不 数据库、Excel等,对于数据后续 源中心数据主要有四部分来源:主
心(计虹、张晨、席韩旭) 断满足医院高质量发展需要 [1-2] 。 的重复利用非常不利。一些课题结 体为本院门急诊与住院诊疗数据、
通信作者:计虹,Email:ji_hong@126.com
《中国数字医学》2023 第 18 卷 第 1 期 29
28 China Digital Medicine. 2023,Vol.18,No. 1