重症大数据平台及专病数据库的建设与实践

2026年01月20日/ 浏览 11

安徽医科大学第一附属医院(以下简称我院)重症大数据平台(以下简称平台)是院内首批通过立项建设的专科大数据平台,规划建设重症临床数据资源中心、专病数据库、科研检索分析三大模块,帮助重症医学科开展重症数据的有效利用。通过对临床数据的深度治理,多种重症监护设备的数据接入、诊疗数据整合等,开展平台建设,规范重症专科标准数据元的定义,提高危险因素识别能力。构建脓毒症(Sepsis)专病库,建立重症脓毒症标准数据集,辅助重症科医生提前做出基于数据的临床决策,有效监控病情进展。同时为重症医生提供基于数据的科研方向探索,推动科研进展。

Part.1

平台数据来源与数据治理

平台覆盖了我院多个业务系统,包括HIS、EMR系统、LIS、PACS、NIS、重症监护系统、重症医生工作站等,同时对接全部的监测数据并实时采集,包括心电监护、呼吸机、床旁血滤机、血气分析仪等。

平台建设过程中,通过数据治理将各种历史原因或不明原因导致的不规范字段、错误字段进行清洗,避免因部分明显错误导致上层应用服务结论错误。基于国内外医疗行业、疾病诊疗指南等标准,对采集数据进行标准化、归一化处理。通过自然语言处理等技术,结合医疗专业术语的语义结构,将医疗语义信息从原始资料中进行提取,为后续的应用、挖掘、机器学习提供数据基础。对数据处理过程中的多层数据,采用定量、定性综合校验方案,开展多维质量监控、问题预警,发现数据完整性、一致性、准确性、唯一性等数据质量问题。

Part.2

平台与专病数据库建设

2.1 平台架构(见图1)

图 1 重症大数据平台架构

2.2 建设过程

2.2.1 第一阶段

系统环境部署、接口调试。围绕此阶段展开数据库部署、采集程序安装、接口部署调试和验证数据、临床校对。服务器资源包括存储服务器、采集服务器、科研数据中心服务器、应用服务器。

2.2.2 第二阶段

开展重症数据资源管理中心、专病数据库建设。主要包括设备数据和诊疗数据汇聚、质量治理、单病种数据定义、专病数据应用校正、科研队列管理、多中心科研电子数据收集(Electronic Data Capture,EDC)等。

2.2.3 第三阶段

重症专科数据利用。围绕重症数据资源管理中心和单病种数据库开展科研数据分析,包括多场景下的患者/病历智能检索、科研灵感发现、科研数据探索、科研数据洞察、科研随访管理。

2.3 重症数据资源管理中心

重症数据资源管理中心全面整合临床诊疗数据和监护设备数据,智能采集终端连接医疗设备,通过无线网络接入医院内网,超融合中央站内置大量医疗设备通讯规则,并结合动态解析呈现可解析设备的原始数据,完成解析后的海量数据可有序存储。管理中心对数据存储、分发、展示、配置、监控进行管理,通过多模态数据采集、数据清洗与预处理、数据解析、数据质控、结构化处理等流程汇聚重症大数据平台的数据资源。

2.4 重症脓毒症专病数据库

目前用于评估脓毒症死亡风险的评分系统包括急性生理学和慢性健康状况评分(Acute Physiology and Chronic Health Evaluation, APACHE)、简明急性生理学评分(Simplified Acute Physiology Score, SAPS)、序贯器官衰竭评估评分(Sequential Organ Failure Assessment,SOFA)和死亡概率模型(Mortality Probability Models, MPM)等。重症脓毒症专病数据库(以下简称专病库)的数据纳入标准包括:①入住ICU时年龄≥18岁 ;②符合脓毒症3.0诊断标准。患者SOFA评分≥2且疑似感染,则诊断为患有脓毒症。专病库的建立为脓毒症早期识别与预警提供了数据基础。

重症医学科安排专业医生带领研究生团队,成立人工核对组,明确核对工作步骤,第一步确诊是否为脓毒症患者,第二步确定发病时间,第三步补充部分缺失数据,如感染部位、某类评分等。经过历时3个多月的专病数据治理,极大地提升了专病库的数据质量。

Part.3

平台功能

平台上可开展病历签核、诊断校验、专病管理(见图2)和研究项目管理(见图3)。病历签核为后续数据处理做筛选和功能搭建,通过自动提取患者基本信息(既往史、诊断、药嘱、非药嘱、评分、检验、检查、护理等)进行签核,为诊断和研究项目提供数据支持,确保上下游数据准确且有迹可循。

图 2 重症大数据平台中的专病数据可视化展示

图 3 重症大数据平台中的研究项目合集

Part.4

总结与展望

重症大数据平台与专病科研数据库的建设全方位辅助重症医学科科研水平提升,目前已完成1.39万份重症患者病程数据的格式化清洗与治理。其中经过人工签核校验的数据4800多份,支持多篇高水平论文发表和3个省级科研课题申报。开展的安徽省区域多中心脓毒症研究,立足国际视野,基于数据分析的信息共享协作机制,进一步提高了安徽省脓毒症的诊疗救治水平。通过精细化数据治理,形成了可识别利用的信息,针对临床科研课题组关注的数据项进行CRF自动填充。通过工程化检索工具,支持按科研需求灵活选择统计方式,有效解决了研究过程中阶段性数据统计分析费时、繁琐问题,优化了实验方案。

未来将进一步聚合专科多模态数据,围绕应用场景构建数据管理流程,针对大数据资源平台的关键数据项,实现实时多级的质量监控,并对不规范的关键数据进行溯源分析,追溯到原始病历文书,发现书写误差。持续开展基于重症资源管理中心的动态数据智能化自动采集,将更多的设备数据纳入重症大数据平台,减少人工数据填报工作量。对于病程记录、护理记录、检查报告等非结构化文本,通过将人工智能技术深度融入重症大数据平台中,提高数据结构化程度,使数据可以得到高效利用,支撑精准医疗开展。同时,结合深度学习技术持续优化脓毒症专病预警模型,提升预警系统泛化能力,推动将预警模型与现有医疗系统相结合,在临床中评估其效果。设计病种质控数据自动提取、一键上报,使重症大数据平台更好地服务于临床诊疗和科研,实现数据“源于临床,反哺临床”的主旨,助推重症医学学科建设与发展。

内容来源:张洁,王翠,张树梅,等.重症大数据平台及专病数据库的建设与实践[J].中国数字医学,2025,20(11):33-39.

picture loss