非劣效、等效和优效性检验及其适用范围

审评四部审评八室  黄钦

摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验 等效性试验 优效性试验

一、 传统检验和区间检验

  药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:

无效假设  h0:  a药的疗效-B药的疗效=0

备择假设  h1: a药的疗效≠B药的疗效

结论:如P>0.05,按α=0.05的检验水准不能拒绝h0假设,如P≤0.05,则接受h1假设。

  目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

  传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为h0:μ1-μ2=0,h1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝h0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受h0假设,并非认为h0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

  因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。

非劣效性试验指主要研究目的是显示对试验药的反应在临床意义上不差于(非劣于)对照药的试验 (iCh-E9的定义)  。

如果治疗差异(a药的疗效-B药的疗效)>0,则试验药的疗效较好;治疗差异<0,则对照药疗效较好;如果我们允许a药疗效比B药疗效低一定范围,仍然认为两药疗效相当,即确定Δ表示临床意义上判断疗效不差所允许的最大差异值,则如果治疗差异>-Δ,便是试验药非劣效于对照药,此处的Δ称为非劣效试验的判断界值(margin)。  非劣效试验的假设检验是

无效假设  h0:  a药的疗效-B药的疗效≤-Δ

备择假设  h1: a药的疗效-B药的疗效>-Δ

结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝h0假设,即无法判断a药不差于B药;如P≤0.025,则接受h1假设,可以认为a药不差于B药。

  等效性试验指主要研究目的是要显示两种或多种处理的反应间差异的大小在临床上并无重要性的试验,通常通过显示真正的差异在临床上可以接受的等效的上下界值之间来证实 (iCh-E9的定义) 。等效性试验的假设检验是

无效假设  h0:  a药的疗效-B药的疗效≤-Δ,或 a药的疗效-B药的疗效≥Δ

备择假设  h1:-Δ< a药的疗效-B药的疗效 <Δ

结论:如P1>0.025 或 P2>0.025,按2α=0.05的检验水准不能拒绝h0假设,即无法判断a药等效于B药;如P1≤0.025 且 P2≤0.025,则接受h1假设,可以认为a药等效于B药。

  优效性试验指主要研究目的是显示所研究的药物的反应优于对比制剂(阳性或安慰剂对照)的试验(iCh-E9的定义)。优效性试验的假设检验是

无效假设  h0:  a药的疗效-B药的疗效≤Δ

备择假设  h1: a药的疗效-B药的疗效>Δ

结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝h0假设,即无法判断a药优于B药;如P≤0.025,则接受h1假设,可以认为a药优于B药。

  实际应用中,更多采用的是可信区间法检验,它是分析时最直接的方法,而且比假设检验提供更多的信息。非劣效性试验中我们仅关注一个方向的可能差异,因此试验药与对照药的疗效差异的单侧97.5%(或双侧95%)可信区间应当完全在-Δ值的右侧,即其单侧97.5%(或双侧95%)可信区间的下限应该大于设定的判断界值-Δ,即[单侧97.5%Ci (a-B)的下限 ] >-Δ(或[双侧95% Ci (a-B)下限] >-Δ),类似道理,等效性试验中等效的结果应该是其95%可信区间范围包括在-Δ与Δ之间,即-Δ< [95% Ci (a-B)] < Δ,而优效性试验的结果则应该是其单侧97.5%(或双侧95%)可信区间的下限大于Δ值,即 [单侧97.5% Ci (a-B)下限] >Δ(或[双侧95% Ci (a-B)下限] >Δ)。

二、 非劣效、等效和优效检验的适用范围

  对于一个新研发的试验药,通常具有某方面的优势,如给药方便、耐受性较好,毒性较低或价格便宜等等,一般需要与安慰剂进行优效性试验以比较其真正的疗效和安全性,来判断其上市的利益风险。如果当前已有曾经优效性试验证实的有效药物的话,还常常与其进行比较,并判定待验证药物的疗效至少不差于(非劣于)已有有效药物作为其上市的最低标准。而等效性试验的应用多见于对同一活性成分的生物等效性以及血浆无法测定时的临床等效验证。

  非劣效性试验通常用于与已上市的有效药物或标准治疗方案进行比较以求能提供一个新的治疗选择,少数情况下当安慰剂对照不被允许或违反伦理时,用以间接证明试验药优于安慰剂。

  我国的研发情况是自主创新药品较少,而仿制国外已上市药品占多数,对于国内尚未上市的药品,无论是创新药还是仿制药,如选安慰剂为对照则应证实其优效性,如选国内已上市的同一治疗领域的药物作为阳性对照药,则应至少验证其具有非劣效性。与已上市药物相同活性成分的药品应进行生物等效性或临床等效性验证。

Tags: 非劣效、等效和优效性检验及其适用范围