III期临床失败-原因和对策
2018/11/8 17:44:16长春桥吴彦祖 中睿医药评论

     10月26日,丹麦灵北制药(Lundbeck)公告称其一项关于难治性精神分裂症(treatment-resistantschizophrenia, TRS)的创新药III期临床试验(NCT02717195)失败,当日股价应声下跌超25%。该药是一款名为Lu AF35700的每日一次口服新药,遗憾的是在III期(P3)临床未达到首要终点,即与传统药物(利培酮或奥氮平)相比没有统计学意义上的优势。灵北股价一日之内从$60.85跌到$46.16,蒸发40亿美元市值,这是该公司史上最严重的股价跌幅。这只是全球每年众多失败的新药P3临床试验之一,而P3研究的失败对药企来说不啻于一场灾难。全球医药研发公司都在努力开发新疗法以满足未被满足的医疗需求,然而经常遭遇失败,正如赫胥黎(Thomas H. Huxley)所说:“用丑恶的事实屠杀美丽的假说,是科学最大的悲剧”。

     1962年美国制定科夫沃-哈里斯修正案(Kefauver-Harris Amendment)规定新药上市前必须通过漫长的三期临床试验证来明安全性和有效性。此后超半个世纪的时间里,许多在研发领域的科学、技术、操作上的进步被期待能够增加药物研发的效率和成功率,然而每年仍然有众多临床试验失败。据统计约70%的P2试验失败,虽然这个比例看起来高,但早期试验的失败在某种程度上较易接受,因为它们是在患者中的“探索性”、“机理确认”、“概念验证(proof of concept)”试验。然而令人始料不及的是,“验证性”P3试验的失败率高达50%。理论上,如果早期试验提供了开展P3测试的必要证据,那么P3试验失败应该相对较少,然而事实并非如此。那么,P3试验为什么失败?P3试验又应该如何改进?我们将在文中探讨。

     抽丝剥茧:P3实验失败的背后驱动因素

     一些机构试图从分析失败临床试验的数据来揭示P3失败的深层的趋势和潜在的驱动因素。

     1. 塔夫斯药物开发研究中心(TuftsCenter for the Study of Drug Development, Tufts CSDD)评估了2000-2009的临床试验,发现了P3研发失败的最常见原因有3种

     有效性 – 例如达不到首要有效性终点

     安全性 – 例如未预料的不良或严重不良事件

     商业/财务 – 例如不能证明较现有疗法更有价值

     2. 新分子实体(NME)和其他药物比较

     BMT(BioMedTracker,Informa旗下数据库)和BIO(Biology Innovation Organization)的一项研究评估了2004-2014的9500多种不同药物和生物制品(Figure 1) 。在每个临床阶段,NME(new molecular entity)的失败率都比总体高。只有61%的NME从P3试验进入注册申请阶段,而总体则为67%。

    

     Figure1.NME和总体的各阶段成功率

     3. 失败率随治疗领域而不同

     BMT和BIO的另一项研究发现临床试验失败率随适应症而不同(Figure 2),其中肿瘤和心血管试验失败率最高。比较肿瘤和非肿瘤失败试验,可见在研发的较晚阶段失败率差异更加显著,特别是P3到注册申请,肿瘤48%失败对比非肿瘤29%失败。肿瘤试验较高的失败率可能是因为包含了生存终点,且需要表现出改善总体生存(overall survival)的有效性。

    

     Figure2.2013年肿瘤和非肿瘤的各研发阶段成功率

     4. 失败率随分子类型而不同

     塔夫斯药物开发研究中心(Tufts CSDD)的一项研究发现小分子临床试验的成功概率比大分子的低(Figure3)。在分析的P3试验中,小分子临床仅有61%从P3进入注册申请,但是大分子临床则有74%成功过渡。此研究还发现在大分子子类中,重组蛋白和单克隆抗体的失败率总体相似,但从P3到注册审批,前者比后者失败更多(34% vs 13%)。

    

     Figure3.小分子和大分子各研发阶段成功率对比

     总结以上的研究,再结合其他文献,P3试验失败背后的驱动因素可分为6类:基础科学,临床试验设计、剂量选择、数据收集和分析、操作执行及其他。Table 1提供了在每种分类中会导致P3失败的具体事例。

    

     Table1.临床试验执行的主要领域中可致P3失败的特殊事件

     P3失败的影响:患者和财务

     P3失败的影响较广泛,但是最突出的是对患者生活和对药企财务成本的影响。首要的是对参与临床试验的数以千计期望找到可行治疗选择的患者的负面影响。在2012-2015年有近15000名患者参与了最终失败的P3试验(Table 2),多数病人患有心肺疾病、糖尿病或癌症。参与临床的患者通常患有只有极少标准治疗方案的难治或晚期疾病。对许多患者而言已时日无多,而临床试验是潜在治愈或延长生命的最后可能。因此,失败临床试验的影响深远,且可能会恶化患者预后、生活质量和情绪健康。

    

     Table2.2012-2015未达到首要或次要有效性终点的P3试验

     大型P3试验的失败也会给药物研发公司带来重大财务负担,并且会导致资本生产率(capitalproductivity)低下。一项研究发现在考虑通胀因素后,研发每花费10亿美元,获批新药的数量自1950年起每9年减少50%。并且药物开发失败的财务后果经常超出研发范畴。对于2014年影响最大的P3失败的检查发现这些失败导致药物项目终止、雇员离职、及对投资者的财务损失(Table 3)。随研发投入增长变慢,药物研发企业有效率地使用有限的资金和资源、将药物有效地推向市场、以满足未被满足的医疗需求将变得更加重要。

    

     Table3.2014年一些P3试验失败导致的财务和公司其他相关损失

     选择策略以降低晚期失败的风险

     虽然现在尚无阻止P3失败的简单办法,但一些方法已经和正在被开发以减少失败的风险。这些策略可在整个开发过程、特定开发阶段、和/或临床试验设计期间实施。

     对整个开发过程更加严格

     在过去几年,多数药物研发公司已经建立并采用更多纪律方案、进展和项目组合审查框架。2011年,阿斯利康(AstraZeneca)计划彻底翻修它的研发过程以改善组织的健康和提高P3试验的成功率。经过对其小分子项目的5年(2005-2010)评估,阿斯利康识别出与项目成功相关的因素并开发现在仍在驱动其研发进程的框架。5R框架引导研发团队识别正确的靶点、正确的组织、正确的安全性、正确的患者和正确的商业潜力(Table4)。拥有正确的文化,例如坦然诚实地面对事实和数据及敢于摒弃早期决定,是这个框架一个重要的额外维度。对开发过程应用更多标准和纪律有潜力在过程早期即剪除可能的失败,从而减少P3失败几率。

    

     Table4 .阿斯利康指导研发的5R框架

     充分的P2测试

     许多P3试验失败是由于对于新分子实体(NMEs)的作用机制(MoA)缺乏根本性的理解。为解决此问题并改善NMEs在P2测试中的成功率,辉瑞(Pfizer)在4年间(2005-2009)分析了44个P2项目来识别与成功相关的因素。分析的结果产生了“三大生存支柱”(ThreePillars of Survival)框架(Figure 4),可帮助研发团队判断增加NME在P2测试中的成功可能性的三要素并前进到P3测试。支柱1涉及将药物暴露到作用的目标位置;支柱2涉及药物和靶点的结合;支柱3涉及药理学的表达。如未充分理解这三个关键组成便匆忙开展P3是有风险的,并经常导致P3令人不快的突发情况。这个对于P2的建议方法不但直观上有道理,而且我们相信它有减少晚期阶段失败的潜力。

    

     Figure4.辉瑞的3大支柱框架提升P2到P3的成功率

     优化P3临床试验设计

     临床试验设计的缺陷是P3失败的一个主要驱动因素。一些策略已经被开发来优化试验设计:

     1 更严格的方案审查和优化是许多公司不同程度使用的方法,从不同的内部委员会的阶段检查,到由实时、实践模拟的方案来主动识别和解决潜在的缺陷。通常,在汇集多数P3方案的时候,需要作出一些折中决定,如方案是否将会包含一个有商业价值但可能会延长研究持续时间的特定次要目标。识别并量化这些交换因素(trade-off)的影响有助于设计更好的协议。公共资源的大量数据(如clinicaltrials.gov)经常可被用来决定利弊。

     2 近年来建模和模拟对注册审批和决定标签有所贡献,并且正在被用作潜在方案来缓和晚期失败的风险。在一项对在2000-2008提交给FDA的198个申请的审查中,建模和模拟被发现对提供了对有效性和安全性的关键性或支持性的洞察,对126个申请的批准有所贡献。此外,还提供了支持133个标签决定的剂量、给药和安全性信息。FDA鼓励主办者在药物开发计划中整合入定性模型和试验模拟,并在P2a试验期末会议(end-of-phase 2A, EOP2A)寻求对于这些策略的监管指导。EOP2A会议给主办者提供了一个机会来讨论建模和模拟计划,并接受FDA对如何优化实施这些策略,来定量暴露-反馈关系并为P3试验选择合适剂量的反馈。建模和模拟现在被更广泛的使用,而不仅是为了选择最优剂量。正在被用于努力设计优化P3试验的建模和模拟是各种临床试验设计的建模和模拟的一个实例。

     自适应设计(adaptive design)做为一种减少失败风险的方式正在加快发展势头。这很大程度上是由于这些适应性设计提供了一个机会来评估中期数据,及知觉检查一些初始不确定性或在试验开始时做出的假设。更重要的是,这提供了一个机会来在试验中转向,及用一种不危害统计有效性和试验操作的完整性的预期计划的方式来纠正这些不正确的假设

     生物标记物正在被更多地用于以一种迅速且更客观的方式来评估有效性。一个与在临床试验中使用生物标记物关联的特殊挑战是要求验证这些生物标记物作为疾病缓解终点,并且将这些终点的变化与疾病进程中的临床显著变化关联起来。同样地,通常涉及基因分型的富集策略(enrichment strategy)正在被更多地用于将建议的研究人群优化为最可能对正在调查的治疗有应答的个体。

     去风险化研究执行

     如下一些方法正在被用于减弱研究执行风险,包括以下:

     利用多种来源的数据(如电子健康档案,临床基地先前表现,中心化实验室等)来保证患者、临床基地和国家的选择是最优的。电子健康档案(ElectronicHealth Records, EHR)对于临床试验的影响被无数利益相关方仔细追踪,对临床试验具有潜在的变革性的影响。同时,许多行业内部人士持有某种程度的怀疑视角,尤其是关于这些系统中数据的准确性。

     对P3试验中收集的数据质量的持续监督,并基于一个适当计划的风险监控协议,允许企业在必要的时机和阶段,设定能导致增强监控的特定质量触发。这有助于减少执行风险,因为临床基地层级的错误经常发现地太迟,如临床研究完成且数据库被锁定。通常在这个时刻,对于挽救这种局面,改善质量和试验成功概率,基本已无计可施。

     其他可能减少P3失败的策略

     其他正在被探索并且有降低P3失败风险潜力的方面包括以下:

     以真实世界证据取代现在的金标准随机对照试验

     穿戴可收集实时数据的装置

     自适应许可(adaptivelicensing)

     基于预期规划过程的渐进或交错批准,即许可药品先在限定的患者人群中使用,随后待收集到额外临床证据后或可扩展到更广泛的患者群体

     下一代测序和对于疾病基因基础增进理解

     篮子/母方案

     篮子试验,即不论肿瘤的发生部位和病理类型,只要携带某个标志性的基因突变,即可参与测试某种针对性的靶向药,比如所有ALK重排突变的患者都可以测试克唑替尼。母方案是联合多家制药公司,按照一个简单的治疗母方案,共同在后期临床试验中检测多个药物的疗效,从而简化药物的审批流程。

     申报的完整性和清晰度并与监管机构交流

     许多药物的注册申请(上市申请)未能获批是因为提交给监管机构的信息(含P3临床研究)不足以做出对安全性和有效性的判断,而不是因为药物本身不安全或无效。一项对于2000至2012年间提交给FDA的NME上市申请的审查揭示约50%的申请在第一轮审查未能获批。然而,近50%的失败申请在申请者解决了FDA关于安全性、生产和标签的疑虑后(包含对临床试验的调整),最终在重新申请后获批。延迟的批准和不批准或可通过在药物开发过程中寻求监管方的建议来减少或防止。FDA向主办者和申请者提供机会在开发和监管过程的关键点预约正式会议来讨论计划并识别也许需要调整的考虑方面。

     结语

     目前P3研究的失败率高到无法接受,并且医药行业都在渴望减少失败风险,虽然某些业界人士认为失败是创新需承担的代价。首先,理解驱动这些失败的根本原因是重要的。通过对现有数据的分析,本文列举了P3失败的主要原因,还介绍了药物研发公司正在实施的方法,以努力减少这些昂贵的晚期失败。对于这些方法改善P3成功率的潜力,我们要持有乐观的态度。

     参考文献:

     [1] Lundbeck Schizophrenia Drug Fails toDifferentiate Itself from Conventional Therapies, Stocks Plunge

     https://www.biospace.com/article/lundbeck-schizophrenia-drug-fails-to-differentiate-itself-from-conventional-therapies-stocks-plunge/

     [2] New drug and biologic R&D successrates, 2004-2014. PAREXEL's Bio/Pharmaceutical R&D Statistical Sourcebook2015/2016

     [3] Causes of clinical failures varywidely by theapeutic class, phase of study. Tufts CSDD assessed compoundsentering clinical testing in 2000-09. Tufts CSDD Impact Report. 2013;15(5)

     [4] Scannell JW, Blanckley A, Boldon H,Warrington B. Diagnosing the decline in pharmaceutical R&D efficiency. Nat Rev Drug Discov. 2012;11(3):191-200.

     [5] Cook D, Brown D, Alexander R, et al.Lessons learned from the fate of AstraZeneca's drug pipeline: afive-dimensional framework. Nat Rev DrugDiscov. 2014;13(6):419-31

     [6] Dragalin, V. Adaptive designs:terminology and classification. DrugInformation Journal. 2016;40:425-435.

     [7] FDA. Formal Meetings Between the FDAand Sponsors or Applicants of PDUFA Products Guidance for Industry. 2017.

     https://www.fda.gov/downloads/Drugs/GuidanceComplianceRegulatoryInformation/Guidances/UCM590547.pdf

     北京中睿信康管理咨询有限公司

     关注行业动态 分享专家观点

     研判行业走向 整合行业资源

    

    

    http://weixin.100md.com
返回 中睿医药评论 返回首页 返回百拇医药