Circulation：高影响因子期刊上发表的那些非劣效性测试

2021-11-22 04:30:53 来源:

近年来刊发的非劣效性试验车越来越多，然而，这些学术研究的体系结构质量如何，我们还知之甚少。昨日，《Circulation》时尚杂志刊发了一项学术研究，以高血压应用为例，对高制约因子出版物上刊发的非劣效性试验车的特点、体系结构质量等进行了探讨。学术研究确认了1990-2016年刊发在JAMA、Lancet和NEJM上的非劣效性试验车。两位独立自主评审员提取了数据。关注的数据要素有数非劣效性界值，哪些学术研究的结果降到了非劣效性，哪些试验车共存不会制约非劣效性相符合标准结果的主要或次要心理因素。主要的体系结构在实践中都心理因素有数：没同时展示ITT归纳（意向性归纳）和PP归纳（符合标准学术研究建议归纳）的结果，α＞0.05，上新疗法目的未与最佳疗法建议进行比较，没证明了非劣效性界值的合理性，队列排除人数或失访率≥10%。次要心理因素有数次优盲法，究竟第一组隐匿等。学术研究结果学术研究执法人员在PubMed上进行查询，共查询到2,544篇发所列文章，其中都110篇（有数111项试验车）符合标准入围准则（所列1）。所列1 入围的非劣效试验车的基本学术研究特点学术研究刊发的小时跨度从1992年到2016年。这些试验车中都，样本量中都位数为3,006（IQR：1,021-6,068）。可核查到非劣效性的效率（power）中都位数为86％（IQR：80％-90％）。可进入主要往南归纳的患者中都位数为2,707（IQR：1,021-5,966）。9项学术研究（8.1％）如期终止（4项学术研究由于安全性问题，3项由于入组速度慢，1项学术研究挖掘出不作处，1项学术研究由于完整性受损）。非劣效性界值60项（54.0％）试验车的非劣效性界值是基于ARD（绝对不确认性不同，absolute risk difference）决定的，50项（45.0％）试验车基于一般来说不同（29项基于HR，14项基于RR，7项试验车基于OR）。1项试验车的界值基于一般来说不同但没作促使细分，1项试验车没报告非劣效性界值。各项试验车的非劣效性界值不同很大（ARD在0.4％~25％，HR在1.05~2.85，RR在1.1~1.8，OR在1.1~2.0）。在刊发过学术研究上新设计/学术研究建议系统性体系结构发所列文章的试验车中都，学术研究执法人员挖掘出有7篇试验车的学术研究上新设计/建议与终究刊发的论文密切关系共存不同或有文档缺失。有的在终究刊发的发所列文章中都更改了非劣效性界值，有的则缺少如何选择非劣效性界值系统性的部分或全部细节。主要往南的结果111项试验车中都，有2项试验车，没有审计置信区间。在109项符合标准准则的试验车中都，86项（78.9％）的试验车标示出具备非劣效性（其中都20项试验车的结果也标示出出优效性）；23项（21.1％）试验车未降到非劣效性（16项学术研究的结果不确认，7项学术研究标示出施压措施的一集更差）（示意图1）。示意图1 纳入学术研究的主要往南的结果在95项（85.6％）试验车中都，主要往南归纳是基于ITT归纳或校正ITT归纳，11项（9.9％）试验车使用PP归纳，5项（4.5％）使用其他或默认的归纳类型。绝大多数（90％）试验车在概述中都适当地报告了学术研究结果，即是非劣效，优效或劣效性，学术研究如果没降到，则指出未降到非劣效性。但是，还有一些试验车，要么是概述给出的文档和学术研究结果密切关系共存不同，要么是概述备有的文档不足。体系结构和报告的在实践中都所列2和示意图2标示出了共存主要和次要在实践中都心理因素的试验车的百分比。70项试验车（63.1％）通过对另一个队列人群的二次归纳（例如，如果首次归纳是ITT归纳，则再做一次PP归纳）来展示主要学术研究往南，其中都66项试验车的结果相反，而4项试验车的两次归纳结果不相反。所列2. 纳入的学术研究中都究竟共存有可能加剧偏倚的心理因素示意图2 共存主要和次要在实践中都心理因素的试验车分布情况68项试验车（61.3％）备有了如何确认非劣效性界值，而43项试验车（38.7％）没。110项（99.0％）试验车的输卵管α≤0.05，其中都44项试验车的输卵管α≤0.025。事前归纳（post-hoc ysis）挖掘出，与外科手术试验车相对，药物试验车的α高水平更很低（Wilcoxon秩和核查P = 0.02）。在27项学术研究中都（24.3％），有> 10％的参与者如期退出，有数随访失访，如期暂停施压或其他原因（所列2）。总体而言，基于所有主要的偏倚心理因素，27项试验车（24.3％）被看来具备很低偏倚不确认性。97项（87.3％）试验车的副标题或概述中都报告了非劣效性上新设计。67项（60.4％）试验车，除了终究的学术研究论文，还同步刊发了学术研究上新设计或学术研究建议的体系结构发所列文章。在这67项试验车中都，8项（11.9％）试验车的非劣效性界值在终究编辑部论文与建议密切关系共存不同或在其中都一篇发所列文章中都未披露。大多数试验车（n = 60,54％）是开放所列单试验车，12项试验车（10.8％）为单盲，39项（35.1％）为CPA。100项试验车进行了第一组隐匿（90％）。91项试验车（82％）对主要往南进行了盲法判定。总之，基于所有的次要偏倚心理因素，25项试验车（22.5％）具备很低偏倚不确认性（示意图2）。根据所有主要和次要心理因素，有7项试验车（6.3％）具备很低偏倚不确认性。事前归纳未标示出出三种出版物的发所列文章在主要心理因素（Kruskal-Wallis核查P = 0.28）或次要心理因素（Kruskal-Wallis核查P = 0.11）上的不同。然而，对非劣效性试验车的学术研究上新设计或学术研究建议的可能避免进行审计，在三种出版物中都，NEJM刊发的试验车中都，有74.2％刊发过系统性的体系结构发所列文章或有在线的学术研究建议，JAMA为53.3％，Lancet为33.3%（Fisher简单核查P = 0.001）。小时近来近年来，这些出版物上刊发的高血压非劣效性试验车大幅提高（P人口为120人0.001 for trend，示意图3）。一项事前归纳标示出，在111项纳入的试验车中都，刊发小时在2010年后的有52项（46.8%）。2010年之后刊发的试验车，共存体系结构或学术分析报告在实践中都的不确认性有所降很低（2010年之前 vs 2010年之后，主要偏倚心理因素和次要心理因素的P = 0.03和0.002）。辩论高血压应用中都的非劣效性试验车越来越多地刊发在高制约力的出版物上，这些试验车中都非劣效性试验车主要用作对上新施压措施的核查。并且大多数是大型多中都心学术研究。鉴于许多非劣效性试验车已成为批准上新疗法的基础，很有必要对他们进行学术研究。尽管大多数试验车声称上新疗法目的相对对照组的非劣效性，但很多学术研究共存具备偏倚不确认性的体系结构或学术分析报告在实践中都，不会遏制其结论的可信性。有必要提高对这些在实践中都心理因素的交往，更好遵从FDA和CONSORTGuide关于非劣效性试验车上新设计、实施和报告的建议。更早典故：Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.