農林漁牧網

您現在的位置是:首頁 > 農業

兩階段生物等效性研究的試驗設計及關注要點

2021-09-02由 餐飲探討 發表于 農業

幾何平均數的計算公式

兩階段生物等效性研究的試驗設計及關注要點

摘要

兩階段生物等效性研究目前已得到多個國家生物等效性指南的認可,但在實施兩階段生物等效性研究時如何在控制I類錯誤的基礎上保證目標把握度是很大的挑戰。

對目前國內外文獻發表的兩階段設計生物等效性研究方法加以綜述,詳細介紹了文獻方法的研究策略、檢驗水準的校正方法、樣本量再估算等,為國內藥品申辦者在開展兩階段生物等效性研究提供參考。

關鍵詞

]生物等效性;兩階段設計;適應性設計;樣本含量再評估;把握度;檢驗水準

在生物等效性研究中,樣本量是非常關鍵的因素,

生物等效性試驗樣本量估算取決於檢驗水準(α)、檢驗效能(1−β)、關鍵藥動學引數(AUC、Cmax)的個體內變異係數(within-subject coeIIicient oI vaULation,CV)、

試驗製劑和參比製劑待評價藥動學引數指標的實際差異(T/R)和設定的等效界值。但由於個體內變異及參比製劑與受試製劑間差異的真值往往在試驗前不可知,在實施中,有可能由於對其錯誤的估計,造成納入的樣本例數過少或過多。樣本例數過少,檢驗效能不足,犯II類錯誤的可能性加大,可能將等效的製劑誤判為不等效,增加申辦者的風險;而樣本例數過多,會使研究成本增加,納入過多的受試者暴露於試驗藥物也不符合倫理原則。如何兼顧統計效率與經濟效益的矛盾雙方,無論在理論上還是實踐中都有重要的意義。

兩階段設計(twl-stage design,TSD)生物等效性研究由於其在樣本量估算方面的適應性、靈活性,

近年來已被各國指南所認可

(IDA、EMA、加拿大、澳大利亞、日本、紐西蘭、WHO等)。雖然在

2015年版《中國藥典》9011藥物製劑人體生物利用度和生物等效性試驗指導原則中明確指出:“在證明生物等效性時,可以接受兩階段試驗方法,最初一組受試者給藥並分析資料,如果不能證明生物等效,則可以增加招募一組受試者,在最終分析中合併兩組的結果”,但具體如何實施在指南中沒有明確規定。

本文將綜述國內外相關文獻,對兩階段設計生物等效性研究的設計特點、決策樹、中期分析、樣本量再估算、檢驗水準的校正方法、結果判定等做詳細介紹,為兩階段生物等效性研究提供可採納的方法,以促進國內新藥臨床試驗的發展。

1兩階段生物等效性方法的提出

在以藥動學引數為終點評價指標的生物等效性試驗中,一般採用雙週期、雙交叉的設計方法,根據選定的藥動學引數和預設的接受限,對兩者的平均生物等效性做出判定。

血藥濃度-時間曲線下面積(AUC)反映暴露的程度,峰濃度(Cmax)和達峰時間(Tmax)是受到吸收速度影響的引數。當關鍵藥動學引數(AUC、Cmax)的幾何均數比(geometULc mean ratio,GMR)的90%可信區間(CI)落在預設的接受範圍內時(通常要求為80。00%~125。00%),則被認為生物等效。在進行兩週期雙交叉平均生物等效性評價時,推薦的統計方法為:對關鍵藥動學引數(AUC、Cmax)進行對數轉換後,採用多因素方差分析,考慮可以合理假定對相應變數有影響的方差來源,如序列、序列內受試者、週期和製劑,得到誤差的均方(MS),帶入以下公式,來計算關鍵藥動學引數(AUC、Cmax)的幾何均數比的CI值。

兩階段生物等效性研究的試驗設計及關注要點

其中μT、μR分別代表受試製劑與參比製劑關鍵藥動學引數的均數(經對數轉換後),Se為標準誤,s為MS的平方根,來自方差分析。從公式中可以發現,當s較大,說明研究藥物個體內變異較大,CV與s滿足以下關係式:CV=ZxexpEsOI−Nz1/2,即使GMR接近於1(μT−μR接近於零),當樣本例數(n)不夠時,其GMR的90%CI亦有可能超出預設的等效範圍,特別對於高變異藥物(CV>30%)的生物等效性判定時,失敗的案例有可能是由於樣本例數不夠,把握度過低,而將本為等效的兩製劑誤判為不等效。採用經典的單階段固定樣本量的生物等效性設計往往會出現上述問題,一旦失敗,過去只能重新組織更大規模的生物等效性研究,造成人力物力資源的浪費。因此早在上世紀90年代,即有國內外學者提出可以在生物等效性研究中沿用隨機對照臨床研究(random control tULal,RCT)中的適應性設計的思路,在生物等效性研究中提出成組序貫設計(group sequential design)、追加樣本設計(add-on design)等,其中兩階段研究是成組序貫研究的特例,與以療效指標為主要評價指標的RCT研究相比,由於以藥動學引數為終點評價指標的生物等效性研究的規模較小,兩階段研究比較適用。

兩階段設計是將生物等效性研究分成兩個階段,當第一階段實驗完成後進行期中分析(inteULm analysis),如拒絕零假設則可提前得出有效結論結束試驗,否則進入下一階段試驗,重新評估樣本量,招募第二階段的受試者進行研究。一般來說,由實際試驗資料估算的樣本含量往往要比不確切資訊下估算的更加準確,因此,根據期中分析的結果對樣本含量進行調整,可以保證試驗達到預定的把握度。另外對於不能拒絕無效假設的,也可提前結束以避免不必要的浪費,提高試驗效率,更加符合倫理學的要求。但由於研究分為兩個階段,有可能使得檢驗水準增加(α inIlation),增加發生I類錯誤的機率(type I error,TIE),因此,有學者針對在兩階段設計中如何控制TIE進行了專門的研究。

目前兩階段生物等效性研究已在很多國家與地區生物等效性指南中得到認可。2015版《中國藥典》的9011指南也明確指出兩階段設計可以被接受。各國指南均要求調整後的顯著性水平應在方案中預先規定,指南還對實施過程提出了一些建議,

如日本指南中就提出第二階段招募的受試者例數(n₂)應不少於第一階段受試者例數的1/2(n₂≥=n₁/2)。歐盟、WHO、中國指南中要求在分析兩階段合併的資料時,在方差分析模型中應包括階段項。加拿大指南中對兩階段設計中顯著性水平調整方法給出建議,推薦採用Pocock α消耗函式方法,兩階段調整後的名義檢驗水準α’(nominalalpha)均採用0。0294。

2兩階段生物等效性研究設計方案

根據假設檢驗資料統計的原理,重複檢驗若不對檢驗水準進行調整,會造成TIE的增大。重複實施k次假設檢驗,每次的檢驗水準α均為0。05,最終TIE可用下述公式估計:1-(——α)k。在實施兩階段生物等效性研究時,若不對兩階段α進行調整,TIE可能上升為9。75%,如果不對累積TIE進行控制,可能會使不等效的藥物獲得上市許可,增加患者風險。因此,必須在設計兩階段生物等效性時,對累積TIE進行控制。在生物等效性研究中控制累積TIE有以下6種方法。

2。1 BonIerroni校正法

BonIerroni校正法其每階段的名義檢驗水準調整為:α/k,k為階段數,當採用兩階段設計時,第一階段與第二階段的α調整為0。025,則總的TIE基本可被控制在5%以下。BonIerroni校正法在控制TIE方面相對保守,每階段的置信區間調整為95%(CI=1-2α’),納入的總的樣本量一般比固定樣本設計的樣本量要大。目前認為本法應用於生物等效性研究時由於樣本例數要求較大,不符合倫理原則,一般不被推薦。

2。2 Pocock校正法

Pocock消耗函式的公式為:α(t)=αln[1+(e-1)t],t為試驗時間,採用Pocock校正法,各階段名義檢驗水準基本相等,當採用兩階段設計時,每階段的名義檢驗水準(α’)調整為0。0294,在加拿大的生物等效性指南中推薦採用本校正方法,在歐盟的指南中亦參考本方法,認為在第一階段與第二階段均採用94。12%(CI=1-2α’)的置信區間可被接受。

但Pocock校正法是基於平行組優效性假設檢驗的序貫設計的,資料一般要求已知變異度並符合正態分佈,中期分析的時間點要求是在N/2(N為總的樣本量)處。生物等效性一般為交叉設計,其藥動學引數需進行對數轉換後才符合正態分佈,在試驗前個體內的變異度為未知,進行中期分析的時間點並不一定在N/2時,因此,生物等效性研究不符合上述Pocock校正法應用的前提條件,在兩階段樣本量不同的情況下,仍採用相同的名義檢驗水準理論依據不充分,可能會造成TIE的增加,需要採用蒙特卡羅擬合的方法對試驗結果的TIE進行驗證,模擬過程可由統計軟體(如C、R、SAS等)實現。

2。3 Potvin適應性兩階段設計(方法B、C、D)

Potvin曾提出了4種(方法A、B、C、D)雙交叉生物等效性研究的兩階段適應性設計方案,針對不同T/R的估計值與個體內變異的案例進行了模擬。方法A由於未對α進行調整,會造成TIE增大,不被推薦。而方法B、C、D的研究路徑見圖1和2,Potvin團隊認為在受試製劑與參比製劑T/R=0。90時應用方法B、C,在T/R=0。90時應用方法D,均可以在控制TIE的前提下保證把握度。

根據對第一階段資料分析時α是否固定,可將適應性兩階段設計主要分成兩種型別,型別I為無論中期分析時的結論是中止研究(不拒絕無效假設),還是繼續進入至第二階段,在兩階段均採用同一調整後的名義檢驗水準;型別II為根據中期分析的把握度,對第一階段資料進行統計分析時,先採用α=0。05,根據計算得到的置信區間與把握度判斷是否等效後再決定是否需要對α進行調整。這兩種型別的設計方法的決策樹示意圖見圖1、2。

兩階段生物等效性研究的試驗設計及關注要點

兩階段生物等效性研究的試驗設計及關注要點

型別I的設計方案主要是以Pocock校正法為基礎,Potvin提出的方法B即屬於此類,兩階段的名義檢驗水準均調整為0。0294;而型別II的設計方案是基於傳統的生物等效性理論,在未進入第二階段前(此時α並未被消耗,仍可採用α=0。05)來進行生物等效性的判定。若決定繼續第二階段的研究,再對兩階段的α進行調整,Potvin設計的方法C與方法D均屬此類,方法C與方法D研究路徑一致,只是名義檢驗水準不同,在方法C中αadj調整為0。0294,而方法D中αadj調整為0。0280,適用於不同的T/R估計值。

Potvin提出的兩階段適應性設計是目前兩階段生物等效性研究的基礎,後來的學者基本是在他的方法基礎上加以改良。

2。4 Fuglsang提出的適應性兩階段設計(方法E)

對於試驗前對個體內變異度估計不足,而根據第一階段資料得出的實際CV較大時,往往在第一階段納入的樣本量n₁<

兩階段生物等效性研究的試驗設計及關注要點

Fuglsang認為與Potvin提出方法C相比較,對於高變異低初始樣本量的研究來說,方法E所納入的總受試者例數較少,更加符合倫理學的要求。此後,Fuglsang還把兩階段設計推廣至平行設計生物等效性研究。

2。5 Karalis等提出的總體樣本量控制的適應性兩階段設計

Potvin提出的兩階段設計,在期中分析進行把握度計算,所應用的T/R採用的是假設值(一般假設為0。90或0。95),Fuglsang提出的方法E,在期中分析時也是以T/R為0。95的假設進行運算。Potvin未設計無效規則,而Fuglsang提出的方法E中的無效規則中針對樣本總量,未對第一階段GMR的點估計值(point estimate)提出要求。對此,Karalis設定了下列無效規則:若第一階段的GMR超出接受範圍(0。80~1。25),則終止研究;設定樣本量上限(upper sample size limit,UL),若經中期分析,n₁+n₂>UL,試驗終止,不再往下進行。Karalis等在Potvin方法的基礎上提出兩種總樣本量控制的適應性兩週期設計STD-1與STD-2,與之前不同的是,Karalis的方法在中期分析做樣本量再估計採用的是第一階段的GMR(而不是T/R的估計值)。Karalis認為有樣本總量的限制,可以控制TIE的上升,UL設定得越低,結果越保守,Karalis在STD-1中名義檢驗水準設定為0。028 0,STD-2中名義檢驗水準設定為0。029 4,在其論文中模擬了UL=62與UL=150兩種情況,沒有發現TIE的明顯上升。STD-1與STD-2兩種方法的決策樹示意圖見圖4、5。

兩階段生物等效性研究的試驗設計及關注要點

兩階段生物等效性研究的試驗設計及關注要點

2。6 Fuglsang提出在更高把握度要求下的TIE制方法

大多文獻在資料模擬時,把80%作為目標把握度,在Fuglsang2013年的論文中,針對有申辦者出於商業的考慮,希望將把握度增大至90%時,提出了名義檢驗水準的調整方案,以90%為目標把握度,採用Potvin方法B(假設T/R=0。95),αadj調整至0。028 4,採用Potvin方法C(假設T/R=0。95),αadj調整至0。027 4,用Potvin方法D(假設T/R=0。90),αadj調整至0。026 9,可將總的TIE控制在5%以下。

3實施兩階段生物等效性的關注要點

3。1 兩階段生物等效性研究與預試驗的差別

在傳統的固定樣本生物等效性研究正式開展前,往往會先進行預試驗,預試驗的主要目的是考查採血時間點是否合理、瞭解體內濃度分佈範圍、評估兩週期給藥間的清洗時長及分析生物樣本分析方法的可行性,也有申辦者透過組織預試驗來估計T/R差異以及藥動學引數個體內變異情況。預試驗一般不作假設檢驗,其結果不進行等效性的判定,且預試驗的資料不可與正式研究資料合併。預試驗與正式研究的臨床研究中心、監護專案、入試者入排標準、採血點、清洗期、生物樣本分析方法等允許不相同。

而兩階段生物等效性中的第一階段與第二階段都屬於正式研究,兩階段的試驗應按同一方案執行,在同一臨床研究中心實施,兩階段的藥物批號、臨床研究條件和生物樣本分析方法均應保持完全一致。

3。2 兩階段生物等效性研究的方案設計要點

要求在開展前對兩階段生物等效性研究前做出詳細的研究方案,明確兩階段生物等效性研究的方法型別、名義檢驗水準的調整方法、第一階段的樣本例數和中期分析樣本再評估的策略。推薦根據試驗藥物的變異度、預估的T/R以及可能的脫落率來設計第一階段樣本量,雙交叉生物等效性研究的樣本量可用下面的公式來估計:

兩階段生物等效性研究的試驗設計及關注要點

公式中,ne代表估計的樣本量;v代表生物等效限(以對數值表示),δ代表試驗製劑與參比製劑的差異(對數轉換後),只有CV值在被低估把握度不足才進入到第二階段。那種認為既然準備進行兩階段生物等效性研究,而將第一階段樣本例數設定得較低的做法不被鼓勵。第一階段的例數過少,有可能會造成總的樣本量增加。

在實施兩階段生物等效性研究時,對第一階段資料的中期分析非常關鍵,需要統計第一階段結果的GMR,並根據第一階段方差分析的誤差均方(s²)來計算出CV(CV=[exp(s²)-1]1/2),按方案規定的決策樹方法對總樣本例數進行再評估。根據申辦者對把握度的期望值、研究的成本預算、研究藥物的CV估計等來綜合考慮是否設定UL及其數值。

3。3 資料合併時應關注的內容

採用單階段固定樣本量兩週期雙交叉生物等效性設計時,在對關鍵藥動學引數(AUC、Cmax對數轉換後)進行多因素方差分析(ANOVA)的因素項一般包括:序列、巢狀在序列間的個體、週期、製劑,而在進行兩階段生物等效性研究中由於增加了階段項這一誤差來源,在歐盟指南、中國藥典9011指南中要求在進行多因素方差分析時加入階段項,在歐盟PKWP問答中推薦在ANOVA模型中將階段、序列、序列×階段、個體(序列×階段)、週期(階段)、製劑作為因素來源進行分析,而製劑×階段的互動作用沒有實際意義,不適用於兩階段生物等效性研究。另外也有文獻認為雖然歐盟藥典專門提出了序列×階段的因素項,但在實際應用中大都無意義。應注意採取措施保證兩階段研究的受試者人群、入排標準、研究實施方案、生物樣本分析方法一致,以減小階段間差異對結果的影響。由於序列與階段均屬於個體間效應,無論是否納入方差分析因素,方差分析的殘差(residual error)結果不受影響,不會影響最終等效性判定時CI的計算。

鼓勵申辦者在試驗完成後對研究的TIE及把握度進行驗算,前文中介紹的Potvin、Karalis、Fuglsang等作者發表的論文方法已採用蒙特卡羅擬合法對試驗結果進行了驗證,能在控制TIE的基礎上保證目標把握度,申辦者在實施時可直接引用,但需注意引用的前提是變異度和T/R估計值不能超過文獻驗證時預設的範圍。

3。4 倫理學的考慮

一個良好設計的生物等效性研究應符合倫理與科學兩大原則,儘量減少納入的受試者例數。紐西蘭的指南中指出:在生物等效性研究中納入不超過40名受試者是比較合適的。對於高變異的藥物來說,申辦者應綜合倫理與科學的原則採用合適的研究方法:如選擇參比製劑校正的平均生物等效性(reference-scaled average bioequivalence,RSABE),或是同位素標記製劑的方法,這兩種方法所介紹需樣本量相對較少,更符合倫理的原則。對於高變異的藥物來說,若選擇採用兩階段生物等效性,設計中建議儘量引入總量控制。

4結論

本文從統計分析角度綜述了國外關於兩階段生物等效性研究的相關指南和文獻,並闡述了實施兩階段生物等效性的注意事項。生物等效性試驗是新藥研發過程中評價藥品質量和橋接安全性、有效性資料的重要手段。

生物等效性試驗評價中樣本量的估計是一個比較複雜的問題,特別對於高變異的藥物。兩階段生物等效性研究由於其在樣本量估算方面的適應性、靈活性,近年來已被各國指南所認可,但關於具體的兩階段生物等效性方法藥監部門沒有相應的評價細則,如何在進行兩階段生物等效性研究中在控制TIE的基礎上保證目標把握度,需大量試驗基礎與理論的結合。

本文詳細介紹了Potvin、Karalis、Fuglsang等作者發表的兩階段生物等效性論文的研究策略、檢驗水準的調整方案、樣本量的再估算方法,希望能給國內藥品申辦者和臨床研究單位在實施兩階段生物等效性研究時提供參考。