临床实践指南实施性促进研究之六:临床实践指南知识图谱构建中关于基本信息、背景和方法的建模表征研究

时间:2023-10-21 13:00:17 来源:网友投稿

王永博,刘郝弦,高 旷,陈沐坤,任相颖,饶映月,王诗淳,李绪辉,黄 桥,阎思宇,朱 彦,靳英辉

1.武汉大学中南医院循证与转化医学中心(武汉 430071)

2.武汉大学计算机学院(武汉 430071)

3.湖北中医药大学针灸骨伤学院 (武汉 430061)

4.中国中医科学院中医药信息研究所(北京 100700)

临床实践指南是针对患者的特定临床问题,基于系统评价的证据,在比较不同干预措施利弊的基础上,形成的旨在为患者提供最佳医疗服务的推荐意见[1],一般由医学组织或是政府机关发布。目前国内外针对指南数字智能化有两个关键问题:一是如何将基于自然语言的非结构化文本指南转换成基于计算机语言的结构化电子指南;
二是如何进行知识抽取、表示、融合、推理和问答,使得计算机能有效理解并高效执行结构化的指南[2-4]。知识图谱是采用语义技术形式表达的系统化、结构化、集成化的特定领域知识[5]。因此,基于知识图谱技术,将指南的非结构化数据转化成图数据库以进行存储及搜索是值得研究的[6]。当前指南知识图谱的研究主要关注从临床问题到推荐意见的内容,鲜有涉及指南基本信息及方法学内容,如指南的目标人群、指南使用者、证据收集过程、推荐意见形成过程、证据质量等级与推荐意见分级标准、利益冲突等。呈现指南的基本信息及方法学内容对促进指南的客观、公正、透明具有重要作用。此外,通过知识图谱将指南的基本信息及方法学内容与指南的临床问题和推荐意见进行整合,更有利于增强知识图谱的完整性。通过对指南的结构、知识及知识间的关系进行规范化的表示,发掘指南通用性的结构框架,并通过建模表征,将纯文本的指南转换为机器可理解的结构化指南,可极大提高指南相关术语的规范性和一致性,避免不同信息源指南的语义异构,为进一步指南数据挖掘和知识服务奠定基础。前期作者团队以《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》[7]为例,通过系列文章介绍了基于该指南临床问题到推荐意见的知识图谱构建过程[8-10]。本文则基于该指南提出了指南基本信息、背景和方法在知识图谱中的建模表征方法,旨在丰富完善指南知识图谱构建,为指南数字智能化奠定基础,为进一步促进指南的实施与推广提供参考。

1.1 对指南基本信息、背景和方法内容进行结构化组织

《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》(以下简称为“非肌层浸润性膀胱癌指南”)包含发表文献所有要素,分别是中英文标题、摘要、关键词、背景、方法、结果、讨论、参考文献、利益冲突说明等,详情请见原文[7]。

本研究对解析出的指南基本信息、背景和方法相关内容的知识结构进行梳理、归纳,结合专家意见设置各概念间的层级关系,据此对指南基本信息、背景和方法内容进行结构化组织。

1.2 模式层(本体层)设计

1.2.1 概念结构表设计

本研究采用综合法的构建方式。模式层的设计思路及方法已在系列文章的第二篇[8]进行描述,此处不做赘述。本研究整理出非肌层浸润性膀胱癌指南中关于指南的基本信息、背景和方法相关内容对应本体的多级概念层次结构,如表1所示。其中概念的定义参考临床研究与指南相关书籍[11-13],以及医学相关本体,如生物医学研究本体(ontology for biomedical investigations,OBI)、信息工具本体(information artifact ontology,IAO)与通用医学科学本体(ontology for general medical science, OGMS),并通过多次专家咨询修订而来。

表1 指南本体概念结构表(指南基本信息、背景和方法内容)Table 1.Conceptual structure for guideline ontology (Basic information, background and method content of the guideline)

续表1

续表1

续表1

续表1

1.2.2 语义关系设计

实现指南结构的概念整合需使以上不同层级的概念在语义上产生关联。本研究设计了核心概念之间的主要语义关系(见表2),主要包含临床实践指南中的指南基本信息、背景、方法部分。

表2 指南本体设计中语义关系表(指南基本信息、背景和方法内容部分)Table 2.Semantic relationships in guideline ontology(Basic information, background and method content of the guideline)

续表2

续表2

1.3 数据层(实体和关系)构建

本研究基于三元组数据模型构建数据层,揭示指南中各类医学实体间的关联,通过链接实体,形成临床实践指南知识图谱。

例如,对于指南基本信息,实体1为“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)基本信息”,实体1所属概念为“临床实践指南基本信息”,而实体1指向实体2的关系为“出版日期” “出版社”“出版地”“状态”“指南类型”“学科分类”“中文标题”等,实体2则对应为“2019年7月”“现代泌尿外科杂志”“中国”“已出版”“疾病治疗指南”“泌尿外科学”“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)”等,实体2所属概念对应为“日期”“组织机构”“地点”“指南状态”“指南类型”“医学学科”“文本”等。指南基本信息、背景和方法内容的数据层(实体和关系)设计如表3所示。

表3 三元组关系示例(指南基本信息、背景和方法内容部分)Table 3.Example of a triplet relationship (Basic information, background and method content of the guideline)

续表3

续表3

续表3

1.4 知识存储和查询

基于抽取的三元组数据模型,设计导入的医学节点和关系节点,使用Python将CSV文件导入Neo4j,对数据进行存储。

若想获取所有和《中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)》直接相连接的实体及相应的关系,则输入cypher语句:

match p=(:临床实践指南{name:"中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)"})--( ) return p

随着图数据规模的日益增大,大图上的子图搜索问题变得更为重要[14]。以问题为例,后台代码演示数据库检索:

问题1:对于指南:“非肌层浸润性膀胱癌指南的发布日期?”,查询元路径是:(a:临床实践指南)-[:发布日期]->(b)。

输入cypher语句:

Match (a:`临床实践指南` {name:"中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)"}) -[ ]-> ( )-[:发布日期]-> (b) return b

则可得到图1-A的结果,即非肌层浸润性膀胱癌指南的发布日期为“2019年7月”。

图1 临床实例验证Figure 1.Validation of clinical examples

问题2:对于指南:“中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)的证据质量与推荐意见分级标准来源是?”,查询元路径是:(a:临床实践指南)-[b:证据质量与推荐意见分级标准]->(c)。

输入cypher语句:

Match (a:`临床实践指南`) -[*]-> (b:`证据质量与推荐意见分级标准`) -[*]-> (c:URL) return c.name

则可得到图1-B的结果,即非肌层浸润性膀胱癌指南的证据质量与推荐意见分级标准是按照EAU-非肌层浸润性膀胱癌指南使用的标准进行评估的。

本研究以非肌层浸润性膀胱癌临床实践指南为例,提出并构建了指南知识图谱中指南的基本信息、背景和方法呈现方法,其多级概念架构及数据层(实体和关系部分)设计方法也可为其他疾病指南的知识图谱构建提供参考。本课题组在实际操作中应用多级概念层初步构建了该知识图谱,发现其可合理表达指南中的概念与语义关系。但该方法仍存在诸多不足。

首先,较少的层级结构虽然可确保输入知识图谱的数据质量,但仍需临床工作者和工程师对临床实践指南进行整理和总结。本研究主要针对指南的基本信息、背景和方法进行建模表征,在概念层设计中,考虑到与其他本体的映射,使用了统一规范的医学术语指标体系增强指南计算机化中知识表达的规范性和互操作性。对于部分语义关系设计的指向概念,综合参考和借用现有的医学本体,权衡信息涵盖粒度和实用性,某些指向概念无需进一步区分,直接使用“文本”“数字”等数值类型的属性来表示。后续需从多部不同类型的指南、临床路径和书籍中尽可能系统检索出与指南相关的不同的实例,并尽可能罗列出每个概念层下所包含的术语,讨论每个实例应该归类到哪些概念层中。若某些实例无法归类到当前的概念层中,则需考虑增加层级结构或归类到新的概念层中,且后续工作中还需参考一体化医学语言系统(Unified Medical Language System,UMLS)、医学主题词表(Medical Subject Headings,MeSH)、医学系统命名法——临床术语(Systematized Nomenclature of Medicine—Clinical Terms,SNOMED CT)等术语集补充类和类的层级体系及添加新的概念层。

其次,语义间关系的建立也需反复推敲,后续可借鉴UMLS等语义关系网,并结合专家论证,补充或修正语义关系,包括逆向关系、继承关系和反向继承关系等。此外,概念及语义之间关系的编码组织方式也需进一步研究。

最后,在指南中方法学部分最为重要的内容之一——证据质量与推荐意见分级标准的建模表征中,对于证据质量与推荐意见分级标准类型,本研究参考GRADE及中医药相关证据质量与推荐意见分级体系,考虑不同的证据质量与推荐意见分级体系共有的特征和区别进行建模表征,两级概念层设计为依据研究设计的分级标准、依据研究设计及质量的分级标准和依据证据体的分级标准。对于相同的临床问题,在不同指南中采用不同的分级体系并同时给出了相应的证据质量等级与推荐意见,此时需通过专家论证,讨论不同体系的证据质量对应关系,如GRADE证据质量等级对应美国卫生保健和质量机构(Agency for Healthcare Research and Quality,AHRQ)中的证据质量等级,赋予相应的权重,则在多个指南的知识图谱融合中,检索相同的临床问题时,可将推荐意见按照证据质量等级高低的顺序进行排序呈现,从而体现图数据库的优势。

综上所述,本文以非肌层浸润性膀胱癌临床实践指南为例,提出的指南基本信息、背景和方法知识图谱框架设计,可以为指南数字智能化奠定基础,有利于推动指南的实施、推广与传播。

猜你喜欢续表浸润性膀胱癌Analysis of hub genes in small-cell lung carcinoma by weighted gene co-expression network※中国高原医学与生物学杂志(2022年3期)2022-06-22VI-RADS评分对膀胱癌精准治疗的价值昆明医科大学学报(2022年3期)2022-04-19外泌体长链非编码RNA在膀胱癌中的研究进展昆明医科大学学报(2022年1期)2022-02-28浸润性乳腺癌的超声诊断与临床病理学对照分析医学理论与实践(2021年20期)2021-10-28Landslide displacement prediction based on the Genetic Simulated Annealing algorithm土木与环境工程学报(2021年1期)2021-03-06同期经尿道手术治疗非肌层浸润性膀胱癌(NMIBC)合并良性前列腺增生(BPH)患者的效果观察中华养生保健(2021年18期)2021-02-13非编码RNA在膀胱癌中的研究进展实用肿瘤学杂志(2020年6期)2020-12-09浸润性胰腺导管内乳头状黏液性肿瘤的临床特征中华胰腺病杂志(2020年2期)2020-04-29Analysis of compatibility rules and mechanisms of traditional Chinese medicine for preventing and treating postoperative recurrence of bladder cancerDrug Combination Therapy(2020年1期)2020-02-14Novel analgesic targets and corresponding analgesic leading compounds中国药理学与毒理学杂志(2019年12期)2019-06-18

推荐访问:临床 实践 指南