临床科研数据库系统的现状与未来(下)(临床研究数据库)
导读
本文介绍临床科研数据库系统的主要的技术问题,提出与随访系统以及医疗业务信息系统的整合、围绕研究问题从原始数据直接提取科研数据的能力是未来临床科研数据库系统发展的重点。
《临床科研数据库系统的现状与未来(上)》已介绍临床科研数据库的三种常见类型、特点,以及系统的发展演变。本文将阐述其主要技术问题以及未来发展重点。
三、临床科研数据库系统的主要技术问题
根据临床科研数据库的发展需求,构建一个完整、高效、灵活的临床科研数据库半台需要解决以下关键技术问题。
3.1 病例数据模型的表达
临床科研数据是围绕科研问题从原始的医疗(电子病历)数据或其他来源数据中采集加工的病例特征数据。针对原始观察性医疗数据,可采用类似于电子病历的数据模型表示,这方面有标准化的数据模型可供借鉴,如观测性医疗结果合作组织(OMOP)的通用数据模型(CDM)。而对于特征化的数据,则每个研究都有所不同,需要结合病例表单进行定义。
作为平台化的临床科研数据库系统,要能够根据临床科研的数据需求和科研设计者的需要,动态建立和表达每一研究项目对应的数据模型。解决数据模型动态定义的问题,当前有三种技术路线:
1、基于传统的关系数据库表达和动态建立所定义的模型;
2、基于XML或对象数据库表达和建立所定义的模型;
3、基于底层的Key-Value通用模型,在其上进一步建模构建所定义的模型。
三种方式各有特点,但后两种方式更便于数据平台的统一管理和处理实现。RedCap系统采用了关系数据库MySQL基础上的Key-Value表示方法。临床数据交换标准协会(CDISC)制定的临床研究数据交换标准,采用了基于XML文档和类似于“Key-Value"的数据元素,有很好的适应性。
3.2 病例表单的灵活定义
病例采集表单由临床科研数据库平台所提供的界面元素类型、属性、组合、布局等进行定义,其灵活性决定了数据录入采集界面的美观和易用性。对数据校验的定义能力很大程度上影响到数据的录入质量,除了常规的类型一致性、非空值、值域校验外,数据项之间的校验可采用表达式、函数以提高校验表达能力。
3.3 医疗数据的自动关联与提取
根据临床科研数据库所定义的数据项,最大程度地从原始医疗数据中自动关联和提取病例数据,是减轻临床科研人员数据整理工作量的关键,也是当前临床科研数据库系统的关键技术。要较好地实现这一目的,除了提供数据项映射外,要实现对时间点、医疗事件的自动识别,以及数据项的计算处理和自动判断。更进一步,针对原始医疗记录中大量的自由文本,需要采用规则定义、机器学习等方法,实现从自由文本中自动提取结构化数据项。由于自然语言处理技术的进展和局限性,把这一技术集成到临床科研数据库平台还处于发展之中。
四、未来发展
随着需求、技术和应用的发展,未来的临床科研数据库系统还将进一步发展。其中,有以下几点值得关注。
4.1 与院后随访系统的整合
院后随访数据作为患者临床结局的反映,是多数临床研究中必须收集的数据。传统的院后随访除了患者到门诊随访外,主要依靠临床研究人员电话随访,存在工作量大、失访率高、数据质量受限等普遍性问题。随着互联网、移动通信技术的发展,通过网页、微信、App等多种形式的患者院后随访服务以及患者自报告结局(PRO)成为可能,随访问卷、原始报告等都可以由患者直接录入或上传。未来的临床科研数据库应能与新型的院后随访系统相集成,实现临床数据与随访数据的一体化整合,从而有效提升科研数据完整度。
4.2 与医疗业务信息系统的协同
从医疗记录中回顾性提取科研数据是科研数据采集的难点,实践中始终存在着原始记录不全、结构化技术要求高的困扰。建立“临床科研一体化”的电子病历系统,由医护人员在诊疗现场电子病历系统中直接以结构化方式录入各类医疗记录(即“前结构化”)也有诸多探索,但实现全结构化的电子病历无论是从技术上还是应用上目前都不理想。然而,结合临床研究需要,把结构化的科研数据表单以“插件”形式集成到临床电子病历系统中,兼顾临床记录的描述性和科研数据的结构化,却是可行的。另外,近几年,在临床专业学会的推动下,一些专科化的检查开始推行结构化报告,也为科研数据采集提供了便利。未来,临床科研数据采集需求会更多地体现在医疗业务信息系统中,两类系统之间的协同互补将是发展的趋势。
4.3 回顾性研究数据收集利用模式的改变
在目前的科室专科专病数据库中,有相当一部分是为未来的回顾性研究建设。一方面,在研究问题不确定的情况下,建设和维持科研数据库需要投入专门力量,长期持续难度大;另一方面,随着电子病历数据的完善和数据处理分析技术能力的提升,当提出研究问题时,能够针对研究问题直接从原始数据中提取所需特征变量开展研究。
结语:
专业化数据服务能力的支持,能最大程度地减轻临床科室工作量,这一趋势在医院的大数据中心工作实践中已经开始显现。在这种模式下,临床研究所需要的数据特征更为精准、数目缩小,对病例录入表单的定义需求降低,对从原始数据到科研特征数据的加工能力要求提高。
未来,临床科研数据库系统的数据加工功能会进一步加强,预先建库的模式将更多地转为有研究问题时的即时建厍和数据加工,整个过程将进一步简化。
文章来源:[1]薛万国,乔屾,车贺宾,孙晓春.临床科研数据库系统的现状与未来[J].中国数字医学,2021,16(01):2-6.
文章内容有删减