
临床前研究(Preclinical studies)是旨在改善人类健康的研究的基础。这些研究也被称为基础研究,是在实验室环境中使用各种非人类模型(如细胞培养物、无脊椎动物和/或脊椎动物)进行的。
临床前研究展示了生物系统和疾病过程是如何运作的,并为了解干预措施是否安全提供了见解,以便开展涉及与人类受试者直接互动的临床研究。
转化型研究(Translational research)是临床前研究与临床试验之间的衔接,它将临床前试验的结果应用于人体研究。
遗憾的是,尽管开展临床前转化研究是惯例,也有其必要性,但许多临床前研究未能证明临床试验的安全性和有效性。更糟糕的是,当干预措施被认为适合进行临床试验时,超过 80% 的人体试验结果却因相互矛盾或低估/高估效果而无法证实临床前研究结果。例如
- 在临床前模型测试的 101 项技术(药物、设备和基因疗法)中,只有 27 项被认为适合进行人体试验,其中只有一项技术带来了临床益处。
- 在临床前小鼠模型中研究了数十种用于治疗肌萎缩性脊髓侧索硬化症(ALS)的药物,所有药物都显示出疗效。然而,在人体试验中,除一项试验外,其他试验均未能使患者获益。此外,还在小鼠中研究了 100 种治疗 ALS 的药物。其中只有八项试验转化为临床研究。所有八项临床试验,包括数千名入组患者,均未能证明疗效。
- 一篇系统综述比较了动物试验和人体试验对相同干预措施和疾病的治疗效果。结果发现,动物模型和人体模型的疗效并不一致,动物模型的疗效优于人体模型,反之亦然。
虽然动物的生理机能与人类类似,但它们是不同的物种。生物学是复杂的,干预措施在动物身上的作用机制可能对人类有效,也可能无效,反之亦然。因此,物种之间的生物学差异可能导致模型之间的不一致。此外,不同研究类型之间的差异也可能是由于在临床前研究的设计、实施和报告方面人为造成的系统性错误所致。这些错误可能会使临床前研究结果不适当地偏向有益或有害的方向。因此,在进行人体试验时,偏差结果无法再现。
不一致的临床前试验造成的后果是,大量资源和资金被用于根据错误和/或有偏见的临床前结果对患者进行治疗。最令人痛心的是,患者将希望和数月或数年的生命献给了实验性治疗,而与动物实验所获得的有益结果相比,实验性治疗可能被证明疗效较差,甚至有害。
尽管声称临床前试验的结果可直接应用于人类是不恰当的,但研究人员在其工作结论中做出这种声称的情况并不少见,这可能是为了夸大其生理相关性。这种策略具有误导性,应该避免。
临床前研究的结果不能推广到人类群体中,因为它们缺乏外部有效性,这个概念提出的问题是 "观察到的效应在研究之外发生的可能性有多大?在临床前研究和临床研究中,研究结果只对具有相似特征(如物种、年龄和性别)的研究人群具有外部有效性。例如,考虑一项临床试验,该试验对患有 Y 种疾病的 30-50 岁高加索男性成年人进行了 X 干预治疗。该试验的结果只适用于类似人群:年龄在 30-50 岁之间、患有 Y 种疾病的男性成年人。如果在不同的人群(如 40-70 岁的高加索女性)中研究 X 干预,结果可能会有所不同。
外部有效性是一个理论概念,干预措施有可能在研究人群之外也适用。然而,临床研究是以概率为基础的,当研究人群不同时,结果在人群间转化的可能性就会降低。考虑到将一个人类群体的结果应用到另一个人类群体时需要谨慎,因此声称结果适用于一个物种和另一个物种是不恰当的。
如果临床前研究的方法质量较高,在多个动物模型中重现/复制,和/或在开始临床研究前对其进行评估,以评估其转化为人类的可能性,那么临床前研究转化为临床研究的失败可能会得到缓解。临床前研究的可转化性可以使用动物临床前研究临床相关性评估(RA-A)工具进行评估。该工具由 8 个领域、27 个问题组成,用于评估临床前研究结果成功转化为临床试验并在人类受试者身上显示出一致结果的可能性。该工具不应用于:评估临床前试验的 "质量";兽医、体外或计算机模拟研究( in silico research);评估开发新疾病动物模型的探索性临床前研究。RA-A 工具的八个领域概述如下:
领域 1:结果对人类疾病或状况的临床可转化性(结构有效性)
目的:评估临床前研究中主要/次要结果的统计阳性结果是否可转化为临床效益。评估内容如下
- 模型是否代表人类疾病?
- 研究人员是否对模型中存在的疾病进行了特征描述和确认?
- 干预的方法和时机是否与人类相关?
- 如果使用了替代结果,它们是否在以前的研究中得到验证,是否与临床结果相关?
- 是否进行过系统综述/Meta分析,以证明疾病的动物模型与人类模型之间的一致性?
领域 2:实验设计与分析
目的:评估研究人员如何设计研究和分析结果。重点是评估随机误差和测量误差。评估内容如下
- 样本量计算
- 数据的类型和分布
- 多重假设检验
- 剂量反应、准确性、精确性、抽样误差和测量误差的调整
领域 3:偏倚(内部有效性)
目的:评估研究的偏倚风险。评估内容如下
- 选择 (Selection)
- 混杂 (Confounding)
- 实施 (Performance)
- 探测 (Detection)
- 损耗 (Attrition)
- 选择性结果报告(推荐使用用于动物研究的 SYRCLE 偏倚风险工具,作为评估该领域偏倚风险的辅助工具)
领域 4:在一系列临床相关条件下结果的可重复性(外部有效性)
目的:评估本研究中报告的结果是否在一系列临床相关条件下重现。该领域评估的是使用以下动物模型是否能再现研究结果:
- 不同的疾病诱导方法
- 不同的基因组成
- 不同年龄
- 不同性别
领域 5:同一模型中方法和结果的可重复性
目的:评估本研究的方法和结果是否可在使用相同动物模型的其他研究中重复。评估内容如下
- 是否充分说明了进行研究的方法,以便能够复制研究结果?
- 是否有外部研究团队尝试独立或在单独的研究中复制研究方法和结果?
领域 6:研究结果的影响(研究结论)
目的:评估试验结论是否恰当地反映了试验结果。评估内容如下
- 研究人员在得出结论时是否考虑了所有的研究结果和局限性(构建有效性、实验设计和分析、偏差、外部有效性和可重复性)?
- 研究人员是否就开展临床试验前所需的进一步临床前研究提出了适当的建议?
领域 7:研究诚信
目的:评估研究人员是否按照研究伦理和诚信原则开展研究。评估内容如下
- 开展研究前是否获得伦理和监管部门的批准?
- 研究人员是否通过使用受密码保护的数据收集、存储、日志和分析程序来减少无意更改数据的风险,从而最大限度地减少数据错误?
领域 8:研究透明度
目的:评估研究人员是否按照动物研究 ARRIVE 核对表等指导原则透明地报告研究结果。评估内容如下:
- 研究人员是否在进行研究前注册和/或公布了研究方案?
- 方案与已完成研究中报告的方法和结果是否一致?
- 是否对偏离方案的情况进行了说明?
- 是否提供了动物个体数据供外部研究团队分析?
研究人员使用 RA-A 工具,对所有 27 个问题从五个答案中选择一个进行评估Yes、 Probably Yes、 No、Probably No 或 No Information。根据对每个问题的回答,对八个领域中的每个领域进行总体分类: 低度关注、中度关注或高度关注。通过这些领域分类,可对整个试验进行两种总体临床相关性分类:
1) 临床相关性高: 该试验已充分开展,其结果更有可能转化为人体试验结果。
2) 临床相关性不确定: 试验设计和实施的局限性表明,试验结果可能无法在人体试验中转化。
鉴于临床前试验在确定干预措施的安全性和有效性方面的重要性,以及基础科学在转化方面的失败,研究人员、从业人员和医疗保健利益相关者在建议将干预措施应用于人体研究之前了解这些要素至关重要。通过提高对这些转化要素的认识,可以改进临床前试验的设计、实施和评估。因此,可以获得更准确的人体试验研究干预措施的信号,从而优化用于更多临床前和临床研究的资源和资金。
最重要的是,如果能在对干预措施进行人体研究之前更好地了解其临床相关性,就不会浪费患者为最终可能失败的治疗所付出的宝贵希望和时间。学术界和医疗保健界需要成为平等的合作伙伴,了解临床前研究的局限性,倡导适当开展临床前研究,并确保在研究、医疗保健和公共讨论中适当解释和传播临床前研究的结果。