Pinnacle 21:天生Define.xml与验证数据

计算机软件开发 2024-9-16 12:44:22 23 0 来自 中国
欢迎关注,SAS茶谈!
之前文章Pinnacle 21简介简朴捋了下Pinnacle 21公司的的发展,该公司有两款产物,Pinnalce 21 Community 和Pinnalce 21 Enterprise,前者是免费开源版,后者是付费商用版。不管是哪个版本,我们工作中使用的功能紧张有2个:


  • 天生Define.xml文件
  • 验证数据(Validation)
Enterprise版本还会提供Issue Management、天生REVIEWER'S GUIDE的功能,从我个人看,这两功能的作用大概效益并不是很大(人工手动操纵也能实现)。
不外,现在FDA和PMDA都是接纳Pinnalce 21 Enterprise来验证提交的数据,使用跟审批机构相同的验证工具,某种水平上会简化审批流程、提供审批服从。
1.png 1. Define.xml文件

1.1 Define.xml简介

Define.xml 文件用于纪录形貌数据集布局的元数据(Metadata), 使得审阅者知晓数据布局及其泉源。 元数据是一种形貌数据的数据,即用于形貌数据属性的信息
美国食品药品监视管理局 (FDA) 和日本药品和医疗东西管理局 (PMDA) 要求每项研究的递交内容必要包罗Define.xml文件,以告知羁系机构使用了哪些数据集、变量、受控术语和其他指定的元数据。
XML是一种数据标准格式,具体格式语法、优缺点这里就不先容。
临床试验项目中,递交给药物审批机构的数据集有SDTM和ADaM 2类,必要天生对应的Define.xml文件。
Define.xml的存在,将项目数据集的元数据信息以一种特定的数据标准格式举行展示
项目数据集的元数据信息一样平常生存在各个SPEC文件中,Define.xml文件的天生,是一个将各SPEC中元数据信息提取到.xml文件中的过程
1.2 Deine.xml的创建

创建Deine.xml的方式,大要分为2类:

  • 使用编程语言,提取元数据信息,根据XML语法格式,整合处理惩罚后,直接输出文本到.xml文件中。
  • 使用编程语言,提取元数据信息,输出到固定格式的Excel Spec中,使用Pinnacle 21读入Excel Spec,输出.xml文件。
两种方法相比力,前者复杂一些,必要思量XML语法格式等干系题目;后者借助P21提供的现成转化模板,不必要思量XML语法题目,流程简化许多
思量到实现过程的浅易性,第2类方法会越来越遍及。
1.3 Deine.xml创建过程

本公司之前的处理惩罚流程是,使用特定的宏步调读入Spec中的Metadata信息,在宏步调中整合处理惩罚,直接输出define.xml、define.pdf文件。不外,具体的Validation借助Pinnalce 21 Community。
自从公司接纳Pinnacle 21 Enterprise后,就不再使用第1类方法创建Define.xml文件了。
这里紧张先容第2类方法。不管是Pinnalce 21 Community照旧Enterprise, 天生Define.xml的过程大要相同,只是操纵界面有所区别,大要有两步:

  • 整理元数据信息到Excel Spec
  • 导入Excel Spec到Pinnacle 21中,天生Define.xml
从某种水平上说,Excel Spec等价于Define.xml文件。两者所生存的内容是相同的,只是出现情势差别。Pinnacle 21提供了两种情势的相互转化。
1.3.1 天生Excel Spec

现在,我们公司是本身开辟了一个SAS宏,将公司的Spec中的各类元数据集信息整合处理惩罚,直接输出成Excel Spec文件。由于各家公司Spec的布局都差别,因此转化为Excel Spec的宏步调肯定也都差别,也可以通过其他编程语言举行实现,这里就不具体先容。
下面的图片,展示了Excel Spec的团体内容。我们必要将项目SPEC中的元数据整理到P21 EXCEL SPEC对应部门,整理过程天然是八仙过海各显神通。不外,不发起手动复制全部内容,手动操纵服从太低。
Pinnacle 21也提供了几种天生Excel Spec方式,在Community版本中,提供了两种方式天生Excel Spec:

  • 从数据集xpt文件中抓取元数据信息举行天生;
  • 从已有的Define.xml抓取信息举行天生。
第1种方式,可以从xpt文件中获取Datasets和Variables这两个sheet的信息,这一步也会提供一个完备的Excel Spec模板。不外,ExcelSpec中的其他Sheet信息还必要举行额外编程,从项目Spec中获取。
对于第2种方式,前面提到过Define文件与Excel Spec其实是等价的,可以通过P21相互转化,不外这一种方法很少使用。
在Enterprise版本中,除了以上2种方式,还可以通过直接输入Metadata信息,来天生Excel Spec。不外,这种方法也很少使用。
1.3.2 创建Define.xml文件

Excel Spec天生好之后,可以直接导入Pinnacle 21天生Define.xml文件。
4.png Enterprise为网页版,导入Excel Spec后,可以直接导出Define文件。
对于SDTM,在导入Excel Spec文件之后,可以继续导入aCRF文件,这样P21E可以主动抓取Origin为CRF的变量的Page信息。
这里必要留意,对于Value Level的变量,一部门泉源于CRF,另一部门泉源其他,Pinnacle大概会将全部的泉源都附上抓取的页码,必要手动查抄,将其他泉源的页码信息置空。同时,对于Value Level中抓取Page信息的变量,其Variable Level中的Page信息也必要置空。(这些题目,P21E后续应该都会更新)
Community为桌面版,导入Excel Spec后,直接创建Define.xml文件。
关于SDTM中泉源为CRF页码填写的题目,一样平常在Excel Spec天生过程中,举行编程处理惩罚,从PDF文档中抓取,直接做到Spec中。具体过程以后再做具体先容。
2. 验证数据(Validation)

Pinnacle 21可以提供验证,用于查抄递交内容是否符合审批机构标准。验证紧张为3类:

  • Define Validation
  • Data Validation
  • Define + Data Validation
2.1 Define Validation

Define文件一样平常展示项目操持网络的信息,以是在SDTM、ADaM编程开始之前就可以天生Define文件,并举行验证,以及整理Metadata Issue。
不外,有的公司天生的Define内容是基于实际网络的数据,这时间只能等数据集天生完毕之后再举行Define的创建与验证。
对Enterprise版原来说,Import 整理好Excel Spec文件后,Pinnacle 21就会直接在Issue列表现当前Metadata的题目。根据题目提示必要对Metadata举行相应的更新。
导入Excel Spec之后,就可以导出Define文件和Issue Report。
8.png 对Community来说,必要把天生好的Define.xml文件再次导入Pinnacle 21中,举行验证。验证效果会以EXCEL文件的情势显现。验证之前必要确认Engine 和 Data Standard。
2.2 Data Validation

数据集的验证必要将xpt格式的数据集导入Pinnacle 21中,xpt格式的版本必须为v5版本,否则Pinnacle 21将不会辨认。同时,FDA也要求所递交的xpt格式为v5版本。
数据集的Validation可以在SDTM或ADaM编程结束后举行,方便查抄Data Issue以及Mapping不公道之处。
Enterprise为网页版,全部的xpt文件必须在电脑当地以zip格式举行打包再上传。SDTM与ADaM的验证,操纵雷同。
10.png 对于Community来说,在Validator页面确认好各项标准后,导入xpt格式的Source Data,点击Validate。SDTM与ADaM的验证,操纵雷同。
2.3 Define + Data Validation

这一步会对Define与数据集信息举行交织验证,比方,同一个变量在Define与数据会合的Label是差别的,就会表现为Issue。
对于Enterprise版本,zip打包数据集时,必要添加Define.xml;对于Community版本,在2.2步调中,导入Source Data的同时,也要导入Define.xml文件。
具体步调,与2.2雷同,不再举例。
总结

文章大抵先容了使用P21 Enterprise、Community天生Define.xml文件以及举行Validation的过程,渴望可以或许资助读者掌握Pinnacle 21的使用。整个过程并不复杂,可以在本身项目中,找时机做一遍。
在实践中学习,服从要高许多。
感谢阅读, 欢迎关注!
如有疑问,欢迎评论互换!
您需要登录后才可以回帖 登录 | 立即注册

Powered by CangBaoKu v1.0 小黑屋藏宝库It社区( 冀ICP备14008649号 )

GMT+8, 2024-11-22 17:07, Processed in 0.183898 second(s), 35 queries.© 2003-2025 cbk Team.

快速回复 返回顶部 返回列表