今天感觉很孤独,想找个人聊天,尤其是播放器播放着刀郎的“西海情歌”。
今天介绍一个概念,什么是cut off,以及常用的cut off做法。
Data Cut Off最常见于肿瘤试验,我们知道肿瘤试验耗时耗钱耗力,一项肿瘤试验可能要花费好几年的时间才能完成,这时候如果我想知道我的这个药安全性和有效性怎么样呢?那么就得利用已经录入的数据进行分析。
cut off 一般是达到一定数量的事件发生或者某个提前定义的里程碑达到了(比如某个组别入组人数达到要求),cut off常用于期中分析(interim analysis),对于最终的审判结果有着举足轻重的影响。
期中分析的结果一般不交给监管机构,交给一个叫做SMC的机构。
SMC:Safey Monitoring Committee 安全监测委员会。我在网上也没搜到相关的具体的解释,我的感觉是专门评判药物安全性的机构,之后来决定是否继续进行临床试验。
一般data cut off,申办方那边会给个cut off date,这个大多数情况下可能是医学提出的。当申办方提出data cut off需求的时候,临床试验还在继续啊,数据也依然在录入,所以我们需要对超过cut off date之后的数据进行处理。
对于交付给SMC的结果,第一我们可以直接从RAW data--TFL,这样简洁明了,省了不少事;第二就是按照我们平时的标准流程,从aCRF-SDTM-ADaM-TFL,这个要看当时项目进行的具体进度吧,可能编程部门还没开始SDTM的编程,这时候只能从raw数据集开始处理分析了,如果整个SDTM到TFL的程序都写好了,直接通过SDTM到TFL输出需要交付给SMC的结果就好了。
至于cut off,也有两种方式,第一是直接对RAW数据集按照cut off date进行处理,第二是在写SDTM的时候对SDTM数据集进行cut off。至于采取哪种方式,听LSP的或者具体情况具体分析。
这边顺便讲一个对SDTM进行cut off的不便之处,就是比如收集死亡信息,我们一般会记录到DM domain和DD domain,如果要对SDTM进行cut off,那么你就要同时改这两个domain,但是你如果对RAW数据集进行了处理,直接跑程序就可以了。而且在SDTM处理的时候,因为可能包括cut off date之后的数据,所以你得先都读进SAS在进行处理,无形中增加了工作量。
至于有了cut off date之后怎么cut off?这时候你就需要跟申办方邮件沟通好cut off rules,这个一般是统计师和医学共同商量决定的。(在刚入行的时候,我一直以为数据只要我们SAS程序员和统计师处理好,写好报告就可以交给监管机构了,但是不知道还有一个“医学部”这么重要的部门)。
所以cut off rules是根据具体项目进行cut 的,不要按照我这篇文章的rules进行cut,我的文章只是一个参考(以对RAW数据集进行处理为例)
对于受试者水平的数据,如果在cut off date之后的,直接删除就好了,所以DM一般也不会有这个人的记录。
对于AE数据,如果是AESTDTC>=cut off date,一般也是删除这条记录;如果是在之前,但是AEENDTC结束日期在之后的,一般是把AEONGO改成“是”;
然后还有一些缺失日期或者部分日期的AE数据,对于缺失日期的数据一般都保留(去向统计师确认),毕竟不能丢失一些关键数据(有点宁可错杀一千,不放过一个的感觉);然后部分日期的,如果可以明确判断在之后的,直接删除就好了,比如cut off date是2022-10-31,然后一条AE记录开始日期是2022-11,那么删除;如果是2022-10,这个一般也是保留(去向统计师确认)
还有一个需要确认的东西是:一般AE会记录一个初始CTCAE等级,然后开始日期在cut off date之前,然后还会有一个最高CTCAE等级,但是在cut off date之后,怎么处理?这个去问统计师,可能不同的公司处理方法不一样,有的可能是直接将日期和最高CTCAE等级置空,有的可能是保留下来,即使达到最高CTCAE等级的日期在cut off date之后。
除了看安全性,还有一个就是疗效性,所以医学可能会建议只纳入给药的受试者,然后肿瘤评估数据,可能来自好多个数据集,尤其是对总体疗效是PD的和非PD的,PD可能取当前访视对应的最早的影像学扫描日期,非PD就取当前访视对应的最晚的影像学扫描日期,如果提前处理了,可能会影响日期判断,所以建议是先不处理,等输出结果后,再对照RAW数据集和rules进行综合判断,所以LSP需要费心一点。 |