Circulation:高影响因子期刊上发表的那些非劣效性次测试
近期刊载的非劣效性鉴定更加多,然而,这些统计数据统计数据分析的软件测试质量如何,我们还知之甚少。近日,《Circulation》时代周刊刊载了一项统计数据统计数据分析,以冠心病课题为例,对更高不良影响因子Journal上刊载的非劣效性鉴定的特点、软件测试质量等顺利完成了探讨。统计数据统计数据分析断定了1990-2016年刊载在JAMA、Lancet和NEJM上的非劣效性鉴定。两位统一评审员提取了统计数据。注意的统计数据要素包含非劣效性界值,哪些统计数据统计数据分析的结果降到了非劣效性,哪些鉴定假定不会不良影响非劣效性推论结果的主要或次要心理因素。主要的软件测试相对来说较心理因素包含:很难同时展览品ITT统计数据分析(意向性统计数据分析)和PP统计数据分析(符合统计数据统计数据分析计划统计数据分析)的结果,α>0.05,取而代之治疗法行为未曾与最佳治疗法计划顺利完成比较,很难证明了非劣效性界值的理应,链此表意味著人数或失访率≥10%。次要心理因素包含次优盲法,前提配对隐匿等。统计数据统计数据分析结果统计数据统计数据分析执法人员在PubMed上顺利完成链接,合共链接到2,544篇篇名,其中的110篇(包含111项鉴定)符合入选标准(此表1)。此表1 入选的非劣效鉴定的基本上统计数据统计数据分析特点统计数据统计数据分析刊载的星期跨度从1992年到2016年。这些鉴定中的,样本量中的位数为3,006(IQR:1,021-6,068)。可鉴定到非劣效性的反应速度(power)中的位数为86%(IQR:80%-90%)。可进入主要西端统计数据分析的患者中的位数为2,707(IQR:1,021-5,966)。9项统计数据统计数据分析(8.1%)提前终止(4项统计数据统计数据分析由于安全性情况,3项由于入组很慢,1项统计数据统计数据分析断定无益处,1项统计数据统计数据分析由于相反性受到不良影响)。非劣效性界值60项(54.0%)鉴定的非劣效性界值是基于ARD(显然后果歧异,absolute risk difference)立即的,50项(45.0%)鉴定基于比起歧异(29项基于HR,14项基于RR,7项鉴定基于OR)。1项鉴定的界值基于比起歧异但很难作进一步细分,1项鉴定很难调查报告非劣效性界值。各项鉴定的非劣效性界值歧异很大(ARD在0.4%~25%,HR在1.05~2.85,RR在1.1~1.8,OR在1.1~2.0)。在刊载过统计数据统计数据分析取而代之设计/统计数据统计数据分析计划相关软件测试篇名的鉴定中的,统计数据统计数据分析执法人员断定有7篇鉴定的统计数据统计数据分析取而代之设计/计划与事与愿违刊载的论文之间假定歧异或有统计数据纠正。有的在事与愿违刊载的篇名中的重置了非劣效性界值,有的则依赖于如何选取非劣效性界值相关的均或全部技术细节。主要西端的结果111项鉴定中的,有2项鉴定,只能审计置信区间。在109项符合标准的鉴定中的,86项(78.9%)的鉴定揭示不具非劣效性(其中的20项鉴定的结果也揭示单单优效性);23项(21.1%)鉴定未曾降到非劣效性(16项统计数据统计数据分析的结果不断定,7项统计数据统计数据分析揭示阻挠安全措施的结局更差)(所示1)。 所示1 归属于统计数据统计数据分析的主要西端的结果在95项(85.6%)鉴定中的,主要西端统计数据分析是基于ITT统计数据分析或校正ITT统计数据分析,11项(9.9%)鉴定运使用PP统计数据分析,5项(4.5%)运使用其他或未曾定义的统计数据分析类型。绝大多数(90%)鉴定在简介中的必要地调查报告了统计数据统计数据分析结果,即是非劣效,优效或劣效性,统计数据统计数据分析如果很难降到,则指单单未曾降到非劣效性。但是,还有一些鉴定,要么是简介所述的统计数据和统计数据统计数据分析结果之间假定歧异,要么是简介缺少的统计数据极低。软件测试和调查报告的相对来说较此表2和所示2揭示了假定主要和次要相对来说较心理因素的鉴定的人口比例。70项鉴定(63.1%)通过对另一个链此表群体的二次统计数据分析(例如,如果首次统计数据分析是ITT统计数据分析,则再继续做一次PP统计数据分析)来展览品主要统计数据统计数据分析西端,其中的66项鉴定的结果相反,而4项鉴定的两次统计数据分析结果不相反。 此表2. 归属于的统计数据统计数据分析中的前提假定可能导致偏倚的心理因素所示2 假定主要和次要相对来说较心理因素的鉴定分布情况下68项鉴定(61.3%)缺少了如何断定非劣效性界值,而43项鉴定(38.7%)很难。110项(99.0%)鉴定的侧α≤0.05,其中的44项鉴定的侧α≤0.025。随即统计数据分析(post-hoc ysis)断定,与医疗器械鉴定相对来说,药物鉴定的α水平更很低(Wilcoxon秩和鉴定P = 0.02)。在27项统计数据统计数据分析中的(24.3%),有> 10%的参与者提前退单单,包含随访失访,提前停止阻挠或其他原因(此表2)。 总体而言,基于所有主要的偏倚心理因素,27项鉴定(24.3%)被认为不具很低偏倚后果。97项(87.3%)鉴定的歌名或简介中的调查报告了非劣效性取而代之设计。67项(60.4%)鉴定,除了事与愿违的统计数据统计数据分析论文,还同步刊载了统计数据统计数据分析取而代之设计或统计数据统计数据分析计划的软件测试篇名。在这67项鉴定中的,8项(11.9%)鉴定的非劣效性界值在事与愿违投稿论文与计划之间假定歧异或在其中的一篇篇名中的未曾揭发。大多数鉴定(n = 60,54%)是开放标签鉴定,12项鉴定(10.8%)为单盲,39项(35.1%)为临床。100项鉴定顺利完成了配对隐匿(90%)。91项鉴定(82%)对主要西端顺利完成了盲法推定。总之,基于所有的次要偏倚心理因素,25项鉴定(22.5%)不具很低偏倚后果(所示2)。根据所有主要和次要心理因素,有7项鉴定(6.3%)不具很低偏倚后果。随即统计数据分析未曾揭示单单三种Journal的篇名在主要心理因素(Kruskal-Wallis鉴定P = 0.28)或次要心理因素(Kruskal-Wallis鉴定P = 0.11)上的歧异。然而,对非劣效性鉴定的统计数据统计数据分析取而代之设计或统计数据统计数据分析计划的可应予顺利完成审计,在三种Journal中的,NEJM刊载的鉴定中的,有74.2%刊载过相关的软件测试篇名或有应用软件的统计数据统计数据分析计划,JAMA为53.3%,Lancet为33.3%(Fisher粗略鉴定P = 0.001)。星期趋势近期,这些Journal上刊载的冠心病非劣效性鉴定大大降很低(P人口为120人0.001 for trend,所示3)。一项随即统计数据分析揭示,在111项归属于的鉴定中的,刊载星期在2010年后的有52项(46.8%)。2010年不久发布的鉴定,假定软件测试或统计数据统计数据分析调查报告相对来说较的后果有所降很低(2010年前 vs 2010年不久,主要偏倚心理因素和次要心理因素的P = 0.03和0.002)。讨论冠心病课题中的的非劣效性鉴定更加多地刊载在更高名气的Journal上,这些鉴定中的非劣效性鉴定主要使用对取而代之阻挠安全措施的鉴定。并且大多数是大型多中的心统计数据统计数据分析。鉴于许多非劣效性鉴定已成为核准取而代之疗法的基础,很有应该对他们顺利完成统计数据统计数据分析。尽管大多数鉴定声称取而代之治疗法行为相对来说对照组的非劣效性,但很多统计数据统计数据分析假定不具偏倚后果的软件测试或统计数据统计数据分析调查报告相对来说较,不会削弱其结论的可能性。有应该提更高对这些相对来说较心理因素的认识,更好遵从FDA和CONSORT指南关于非劣效性鉴定取而代之设计、拟定和调查报告的要求。原始单单处:Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.