临床科研场景下医疗数据安全开放共享平台设计

张开发
2026/4/3 21:54:50 15 分钟阅读
临床科研场景下医疗数据安全开放共享平台设计
前言临床研究作为探索疾病机制、扩展医学认知、促进医学创新的重要途径已经成为现代医学发展的核心驱动力。临床研究是以疾病的诊断、治疗、预后和病因为主要研究内容以患者为主要研究对象以医疗服务机构为主要研究基地由多学科人员共同参与组织实施的科学研究活动。近年来随着医疗信息化和电子病历应用的发展完善临床研究进入了大数据、真实世界研究Real World Study,RWS的新阶段。临床数据的采集和管理是开展临床研究的核心基础无论是流行病学调查、疾病机制研究、新药物的研发还是临床实效性研究都贯穿着对临床数据的获取、共享和分析以及有效利用。以电子病历数据为核心的真实世界数据Real World Data,RWD开展临床研究已经成为现代医学研究的热点。临床真实世界数据来源于患者个人诊疗、健康管理等多种途径种类多、规模大、结构多样但由于存在缺乏数据互操作性、非结构化的电子病历记录以及对数据安全性的担忧等问题真实世界数据直接应用于临床研究仍存在“鸿沟”。尤其在临床科研场景下真实世界数据处理和应用过程中涉及大量个人隐私信息和特殊类型的健康数据患者数据安全和权益亟需保护。本研究将重点探讨基于医院真实世界数据在临床科研场景下的医疗数据开放共享安全性问题探索从制度流程、人员管理、技术管控等多个维度研究临床科研场景下医疗数据安全共享和开发利用模式规范临床科研场景下临床数据安全管理提高临床科研数据开放共享水平。国内外临床数据开放共享的现状真实世界研究因其基于产生于临床实践当中的真实诊疗数据所以得出的结果具有很高的外部有效性受到国内外广泛推崇。临床科研数据库是真实世界研究开展的重要基础对数据收集、整理和分析起到支撑作用。但这同时也对临床科研数据的治理、存储、利用和安全共享提出了新的要求。国外临床数据库的建立已有很长历史20世纪80年代初美国国立卫生研究院就已建立了国家脑卒中数据库欧洲卒中联盟European Stroke OrganizationESO也建立了Angels Award数据库集成并共享欧洲地区卒中患者的诊疗病例日本也建立了国家临床数据库。我国的临床数据库建设近年来逐步开展如高宇等设计并研发了基于单病种数据库的临床科研系统支持创建课题、自定义CRF(Case Report Form表单、筛选符合条件的病例、半自动化录入科研数据项、数据导出和数据分析等功能北京积水潭医院建立了可供多中心使用的临床数据库并且面向公众公开部分数据。但因起步晚我国临床数据库建设存在一些问题其中比较突出的是目前临床数据库建设通常以单体机构的单病种、单中心为主局限了数据应用的范围降低了结果的有效性。数据安全有效共享的提出可以满足真实世界研究对临床数据的需求扩大样本量提升单中心研究结果的可靠性和数据资源的利用效率。虽然近年来国内对临床研究数据规范化、标准化处理的经验在不断地积累开展了临床科研数据库建设、临床数据标准化、模式治理等方面的应用和研究但目前仍缺乏一定对临床科研场景下的数据安全共享方面的实证研究。临床科研数据安全开放平台的建设思路在临床科研应用场景中需在充分保护临床数据和隐私安全的前提下实现临床大数据价值的转化和提炼。本研究探索将管理流程与技术手段有效结合基于“数据可用不可见”的数据安全理念遵循国家《个人信息保护法草案》《信息安全技术个人信息安全规范GB/T35273-2020》《信息安全技术健康医疗数据安全指南GBT39725-2020》等数据安全保护相关法律法规要求连接数据控制方医院与数据使用方临床研究人员两个主体探索建立可信、安全的临床科研数据开放应用环境形成一套临床科研数据安全开放共享应用模式保障临床数据安全和患者隐私促进临床研究健康发展。1. 平台整体架构设计从制度规范和技术管控两个维度进一步梳理临床科研场景下数据安全共享管理流程并综合利用数据脱敏、数据分级、权限控制、数据沙箱等技术手段在临床数据开放性和可用性需求与数据隐私和安全性需求之间取得平衡设计一套临床科研数据安全开放应用平台架构如图1所示。平台实现与多源临床科研数据资源对接整合并按照医疗数据分级和隐私规则定义实现临床敏感和隐私数据自动识别处理构建数据安全沙箱计算分析环境实现了临床科研数据所有权和使用权分离确保临床数据分析安全可控。临床科研数据安全开放共享平台设计为基础设施层、临床科研数据资源池、数据安全管控、数据开放应用管理和流程配置管理5个部分为临床科研提供了依赖数据授信的存储、计算、应用的安全开放环境。其中临床科研数据资源层通过数据接口、ESB(Enterprise Service Bus集成总线、API(Application Programming Interface接口等方式实现与院内业务系统或者临床数据中心CDR(Clinical Data Resposiry对接构建了数据授信的临床科研数据存储环境形成临床科研数据资源池数据安全管控层通过敏感数据自动发现、数据分级分类、数据脱敏处理、数据安全沙箱管理、数据安全审计等功能构建了临床数据安全沙箱运行平台为临床科研人员提供了一个授信、开放、可追溯、可审计的计算环境数据开放共享应用层在可信存储和计算环境基础上为临床科研人员数据检索、数据申请、隐私计算分析、输出结果申请和认证管理等服务建立开放、安全的数据应用环境支撑临床科研数据分析建模。图1 临床科研数据安全开放应用平台架构2. 数据安全开放共享关键技术1. 数据脱敏技术数据脱敏技术是指在不影响数据统一特性和数据分析准确性的前提下通过数据变形方式对原始数据中的敏感信息进行处理进而降低数据敏感程度和减少个人隐私风险的一种数据处理技术处理过程主要包括敏感数据识别、制定脱敏策略、敏感数据处理、审计评估等阶段。根据不同的数据脱敏算法和规则对临床数据中的患者隐私、特殊字段等敏感数据进行“数据变形”处理可有效降低临床科研场景中敏感数据泄露的风险。临床科研数据安全开放共享平台根据《信息安全技术个人信息去标识化指南GB/T37964-2019》和《信息安全技术健康医疗数据安全指南GBT39725-2020》结合临床科研应用场景平台设计了关键字段删除、泛化、截断、遮蔽、置换、偏移6种数据脱敏方式如表1所示。表1 常用数据脱敏方式2. 数据安全沙箱安全沙箱(Security Sandbox是通过构建一个安全虚拟的环境将数据应用、存储和个人分开来通过对双方的通信进行限制来保证应用的数据安全性。数据安全沙箱则以虚拟机资源为基础综合利用安全沙箱、虚拟化、数据加密、安全审计等技术从网络、数据、业务等多层次建立数据安全保障机制形成“隐私保护、逻辑封闭、进出审计、内部自由”的数据安全计算环境。在该虚拟环境中用户可进行数据探索、模型训练得出结果。参与临床研究的用户只能带走不含敏感数据的训练结果文件和数据模型原始训练数据不离开训练环境实现原始数据的“可用不可取”。同时沙箱内的数据计算任务和操作都会详细审计和记录从而保障数据安全计算的可靠、可控和可溯。3.数据隐私计算隐私计算Privacy Computing是一种由两个或多个参与方联合计算的技术和系统参与方在不泄露各自数据的前提下通过协作对他们的数据进行联合建模和分析研究方向主要包括基于密码学的多方安全计算、基于人工智能的联邦学习技术和基于可信执行环境的计算3个方面。在隐私计算框架下参与方的数据明文不出本地在保护数据安全的同时实现多源数据跨域融合促进跨区域、跨机构、跨部门的多主体间数据安全交换共享实现了数据所有权和使用权分离确保数据安全可控。临床科研数据安全开放共享平台综合利用可信执行环境隐私计算和安全沙箱技术建立了硬件级强安全隔离和通用隐私数据计算环境为每个临床研究团队创建独立的安全容器环境实现多团队、多主体之间进行安全数据共享、联合查询、联合分析和建模。应用实践临床真实世界数据是助力临床研究的重大要素和信息载体从数据采集整合、质控治理、数据检索、队列建立、数据申请、数据分析到数据结果导出贯穿于临床研究的全过程但同时也带来了数据安全风险与挑战。为促进基于真实世界数据的临床研究健康可持续发展上海市儿童医院从制度规范、人员管理、技术管控等多个维度制定了临床科研场景下数据安全开放共享流程并建立了一套临床科研数据开放共享应用平台以下简称“数据开放平台”。1.数据开放共享流程临床科研数据安全共享涉及临床管理、科研管理、信息技术等多管理部门团队需要相互协同、配合各司其职。通过梳理流程、设计节点构建了临床科研数据资源归集、开放、共享、利用的制度流程如图2所示。图2 临床科研数据开放共享平台管理流程1认证培训管理临床科研人员在访问“数据开放平台”前需参加由临床研究管理机构临床研究中心组织的线上线下培训与考核培训考核内容主要包括科研数据管理、个人隐私保护、数据安全法规、科研伦理等培训考核合格获取相应的平台权限。2数据申请审批获得权限的临床科研人员准予进入“数据开放平台”进行数据检索选取数据指标建立研究队列创建研究数据集脱敏。本阶段临床科研人员仅可查看研究数据集样例数据如进行下一阶段的数据分析需发起数据集分析申请填写数据申请表单。“数据开放平台”与OA办公平台对接自动创建临床科研数据申请表单见图3进入OA审批流程。图3 临床科研数据申请表单3分析结果审批数据申请流程审批完成后“数据开放平台”将自动创建“数据安全沙箱”并导入研究数据集。临床研究人员在“数据安全沙箱”中进行数据分析和建模。分析完成后研究人员可申请结果导出经临床研究中心审批开放至“数据开放平台”供临床科研人员下载。2. 数据开放平台建设项目研究单位秉承数据安全和促进数据开发利用并重的原则探索综合利用数据脱敏、数据分级、隐私计算、数据沙箱等技术手段建设了临床科研数据安全开放共享平台见图4图6为医院临床医生、科研人员构建了可信、安全的临床研究数据开放环境。截至2021年5月医院临床科研数据安全开放共享平台汇集了患者信息、就诊信息、诊断信息、手术信息、检验报告、检查报告、费用结构7大类数据采用删除、泛化、截断、遮蔽、置换、偏移等脱敏规则进行数据脱敏处理共开放718万份患者临床诊疗数据。图4 临床科研数据脱敏检索图5 科研数据集分析申请图6 数据安全沙箱运行环境结论临床科研数据的安全开放共享是保障临床数据安全、保护患者隐私促进临床研究健康发展的重要内容。本研究聚焦于医疗机构临床科研场景以保障数据安全和促进数据开发利用并重为设计原则从制度流程、人员管理、技术管控等多个维度制定临床科研数据安全共享规范化流程设计应用了一套临床科研数据安全开放共享平台实现了临床科研场景下多主体、多环节数据安全交换共享和计算为医院临床日益增长的临床科研需求的落地和进一步的发展做了有益的探索和尝试同时为后续建立跨区域、跨机构、多中心的临床科研数据安全开放共享模式奠定基础促进了基于真实世界的临床医学研究高质健康发展。选自《中国数字医学》杂志 2021年第16卷第7期作者魏明月 陈敏 胥婷 何慧敏 王彬 王淑编辑生物样本库

更多文章