理性看待“专家意见”,别被带偏了!

专家意见是证据等级体系中最低等级的证据。是的,他们可能是各自领域的 “专家”,但作为专家并不一定意味着他们的观点是真实和公正的。AJE将在本期详细论述这一观点。

更新于2024年5月15日

理性看待“专家意见”,别被带偏了!

选择你最喜欢的与健康相关的播客,旨在帮助你优化身体、大脑和心灵。随便挑一集。播客的主持人可能会邀请一位 “专家 ”在节目中讨论最新、最棒的产品,以增强身体的某些机能。它可能是一种补品、工具、技术、书籍、教材等。你可能会感到欣喜若狂。“是的!” 你高兴地叫道。

“就是它了。这就是我一直期待找到的东西。” 你欣喜若狂,打电话到播客询问产品情况: “嘿,播客鲍勃(播客主持人),我有 X 种病症。我试过 Z 和 Y,但都无济于事。你觉得这个能帮我吗?

鲍勃的回答通常是免责声明:"好吧,我不是医生。我在这里说的任何话都不能被理解为医疗建议(咳咳)......不过,是的,我确实认为 V 可以帮助你。让我来告诉你具体的使用方法吧......”

现在,在你尝试 V 产品之前,请停下来。深呼吸。关掉播客。思考片刻。问自己 "这个专家是谁?他们到底有什么证据?我怎么知道他们说的是真的?”

你还不如去厨房开始剥洋葱。不要去管蜡烛。当你徒手慢慢剥开洋葱这种多年生草本开花植物(洋葱科)的层层表皮时,就让你的眼睛被泪水灼伤吧。

试图从根本上弄清谁是专家以及他们的说法是否属实是一件痛苦的事情。播客和一般的社交媒体创造了近乎宗教的社区,在那里,相同的思维模式得以延续,它们或明目张胆地或以潜移默化的暗流的形式穿梭于每条信息线中,钻进你的清醒意识和梦境。这些主题会波及到邻近的社交媒体社区,这些社区也有类似的目的。不知不觉中,你已经完全陷入了一个充满偏见的范式中,或者说至少有一种微妙的欺骗性光泽掩盖了真相。

“听取(某些)专家的意见有什么问题?”让我们来分析一些问题。

专家意见的问题

专家意见是证据等级体系中最低等级的证据。是的,他们可能是各自领域的 “专家”,但作为专家并不一定意味着他们的观点是真实和公正的。

学位是在学校里获得的,但 “专家 ”文凭却不是发下来的。专业知识可以通过努力获得,同行可以承认这个专家是真专家,专业知识也可以是自封的头衔。无论以何种方式宣称专业知识,它都可能是一个可疑的头衔。

专家可能极度偏颇,持有一种主导观点。他们可能在自己的领域工作了数年至数十年。他们可能是新皈依者,接受了持有一种意识形态和/或教授一种方法的导师的教育。

如果专家持有偏见,而不是接受多种观点和新出现的证据,他们可能会坚定不移地坚持单一范式。专家们可能更倾向于挑选符合其信仰体系的证据,可能更容易产生利益冲突,可能会选择性地专注于某一领域,而忽略了更广阔的视野,从而使他们的整体视角产生偏差,此外还有许多其他形式的偏见。当你听到有人全心全意地支持某一种理论/观点/产品等,而不承认相反的证据及其局限性时,你的偏见警报就应该响了。或者就是分享他们的观点,说明为什么相反的观点是错误的。

一枚硬币总有两面。有偏见的专家只能告诉你硬币的一面在某种情况下是什么样子,或者不了解硬币的两面;提供的结果只适用于某一人群,例如,对某一性别和有限年龄段的成年人进行的小型试验研究,从而使外部有效性受到质疑,或者更糟糕的是,将临床前试验的结论应用于临床,这应该被视为一种罪过; 不了解围绕某一主题的整体文献基础,只关注证实其信念的一组研究;对自己提出或支持的假设固执己见,即使存在相反的证据,也死死抓住不放;自吹自擂,给人的印象是他们已经解开了 X 病的谜团,他们认可的产品/范式,甚至可能是他们发现的秘密解决方案。

不带偏见的专家:

  • 了解一个话题的前前后后
  • 承认自己错了,承认自己不知道问题的答案
  • 提出问题以澄清他们真正不知道的事情,而不是假装知道答案
  • 了解围绕某一主题的文献的广度,承认相互冲突的观点
  • 给予应有的肯定
  • 避免夸大某个主题的证据

什么是替代结果(surrogate outcome)?

除了专家的潜在偏见外,了解什么是替代结果以及专家通常如何滥用替代结果也至关重要。

简而言之,替代结果是一种替代性结果,它间接地试图预测硬性临床(hard clinical outcomes )结果。替代结果通常是基于实验室或放射学的结果。

替代结果的例子包括

  • 胆固醇
  • 血压
  • C 反应蛋白
  • 血糖
  • 白细胞计数
  • 骨密度
  • 室性早搏

硬性临床结果的例子包括

  • 死亡
  • 心肌梗塞
  • 中风
  • 获得性免疫缺陷综合征
  • 骨折

从本质上讲,任何导致疾病或死亡的因素都是代偿因素。真正的疾病或死亡才是硬性的临床结果。

为什么使用替代结果?

通常使用替代结果是因为它们更便宜、更容易研究。然而,代用指标并不总是与临床结果相关。它们往往无法预测临床结果。换句话说,改变代用指标可能不会真正改变临床终点。实际上,它可能会以一种适得其反的方式改变临床结果。

例如,有 36 种癌症药物在临床试验中接受了代用指标的检查,并获得了美国食品及药物管理局的批准。然而,在实际应用中,有 19% 的药物没有或恶化了与健康相关的生活质量(HRQoL),尽管这些缺乏 HRQoL 益处的药物的年平均成本为 87,922 美元。同样,在 36 项测试癌症药物的试验中,对替代结果进行了检查并获得了 FDA 批准,其中只有 14% 的药物被发现能改善总生存期。超过 50%的药物未能延长生存期。

替代结果非常普遍

虽然这些替代结果的例子与药物有关,但替代结果在临床研究中也很普遍。你在播客广告中听到的很多内容都与替代结果有关,尤其是热门的新玩意儿和保健品。

例如,假设一种新的保健品含有大量从一种植物中分离出来的植物酚和甾醇,这种植物被发现可以降低胆固醇水平。从这种植物中分离出的化合物被放入一种保健品中,并在一项有 20 名参与者参加的小型临床试验中进行了测试。

该产品显著降低了胆固醇水平,并因其降低胆固醇的作用而在市场上销售。然而,尽管胆固醇降低了,但这种补充剂有可能会增加心血管疾病的风险,这种关联在一些观察性研究中已经出现过。如果专家从未对临床终点(心血管疾病)进行过研究,那么该产品可能确实会降低胆固醇水平,但却可能通过增加心血管疾病的发病率来恶化人体健康和服用者的生活质量。

同样,这只是一种理论假设。问题的关键在于:根据替代结果进行医疗宣称可能是一种危险的游戏,尤其是对那些流于形式的生物骇客保健品和玩具而言。除了替代结果的潜在危险之外,如果对重要的临床结果没有真正的影响,那么流于形式的产品至少可能完全是在浪费金钱。想看着大把大把的本杰明在马桶里转来转去,被冲到下水道深处吗?试试根据专家的建议购买产品吧。你可能会得到同样的效果。

从经济上获益的专家

怀有经济目的的专家通常会根据小规模研究进行的临床研究来销售产品。这些研究没有足够的统计能力来检测组间是否存在真正的差异,因此结果并不确定。这些试验中具有统计学意义的积极结果通常被高估。如果没有发现明显的效果,研究人员可能会因为这些研究没有显示出益处而将其埋没,这就带来了发表偏差,或者得出组间无差异的结论,而这是不正确的结论。对于效果不显著的低效试验,最好的说法就是缺乏证据。

从临床前到临床

专家们喜欢的另一个欺骗伎俩是将临床前研究的证据直接应用于临床研究。例如,如果服用 X 产品能在体外上调某种蛋白质,而该蛋白质与人体研究中的 Y 结果有关,专家们可能会声称 X 产品在人体中也能达到 Y 结果。这只是一种假设,而不是效果的证据,也是一种传播错误信念的不恰当策略。

几乎所有的变量之间都存在相关性,专家们喜欢利用相关性来达到目的。著名的烹饪书评论就说明了饮食疾病之间的大量相关性。Schoenfeld 和 Ioannidis 从烹饪书中随机挑选食物,并确定这些食物是否与癌症风险有关。80%以上的食物都经过了临床试验研究,并发表了研究报告,探讨这些食物与癌症风险的关系。在 264 种食物中,分别有 39% 和 33% 的食物会增加或降低患癌风险。在报告风险增加和降低的研究中,都观察到了较大的影响。报告风险增加的研究的中位死亡率(IQRs)为[2.20(1.60,3.44)],报告风险降低的研究的中位死亡率(IQRs)为[0.52(0.39,0.66)]。然而,在荟萃分析中进行汇总后,这些影响均为零[RR 中位数为 0.96(IQR:0.85,1.10)]。这些结果表明,大多数食物都与癌症风险有关,它们的单一研究效应被夸大了,但如果合并起来,这些效应就消失了。这给我们的启示是,变量之间的效应是常见的,在研究对人类健康有影响的结果时,尤其是在报告单一研究结果时,需要谨慎行事,并强调除部分结果外,还需关注整体(汇总结果)的重要性。

其他需要注意的迹象

应触发 “专家警报 ”的其他一些热门项目包括

  • 使用过多修饰词(may、potentially、possibly等)的人。临床研究得出的所有结果都是估计值。临床试验的目的是根据样本平均值估计群体平均值。没有任何结论是百分之百的 “真理”,因为不同的干预方案、研究人群、使用的方法等都可能存在差异。但是,如果你听到一位专家反复使用限定词来为一个结论辩护,那么这就增加了一种可能性,要么他们不知道自己在说什么,要么他们不确定但试图伪装成确定。无论哪种情况,修饰词都是试图掩盖偏见的挡箭牌。
  • 有人说已经进行了数千项研究,可以在 PubMed/MEDLINE 上找到。专家利用这种说法试图推销产品。例如,他们可能会说某种补充剂会影响 X 结果,这一点已经得到证实,因为在 PubMed 上有超过 1000 项研究记录了这种关联。这完全是假的。进行了大量研究并不意味着什么。这些研究可能完全否定了专家的观点,也可能存在差异、偏差和方法上的问题,以至于从个体和整体来看,都无法得出明确的结论。
  • 不能改变自己的观点,不能质疑自己信仰的人不值得信任。金融界常有一句名言:最好是 “坚定的信念,灵活的把握”(strong convictions loosely held)。换句话说,专家可以对研究和观点抱有坚定不移的信念,但如果出现相反的证据,这些专家应该有能力改变自己的观点。

我们能为专家意见问题做些什么?

我们如何才能超越这些问题,让更多人信任专家意见?

我们需要更好的研究、更好的数据、更好的证据综合以及更少的偏见。如果能够提供适当的培训,使研究得到正确的设计、实施、报告和解释,这些问题就可以得到缓解。这听起来可能过于简单化,但解决方案从培训开始,因为研究人员需要知道如何正确设计、开展和解释研究。

你可能会问:"难道研究人员不知道如何开展研究吗?他们花了多年时间获得临床领域的研究生学位。难道同行评审程序不会在论文发表前发现问题吗?

研究失败的例子

不幸的是,失败研究的例子不胜枚举。例如,对维生素抗氧化特性的研究表明,在观察性研究中,维生素与全因死亡率、癌症和心血管疾病呈反向关系。当进行多项随机对照试验来测试相同的关联时,观察性研究中研究的抗氧化剂补充剂的保护性质就消失了。对 37 项随机对照试验的重新分析表明,62% 的结果在重新审查后发生了变化,包括对应接受治疗的患者的重新解释,以及治疗效果的方向、幅度或统计意义的变化。

同样,在 49 项引用率较高的原始临床试验中,有 16% 的后续研究与原始研究相矛盾,16% 的后续研究显示治疗效果较弱。出现矛盾的原因可能是在进行、报告和分析方法上出现了错误。对 250 项对照试验的重新分析表明,治疗效果被高估了(P < 0.001)。

让这些研究问题更加复杂的是,本应保护生物医学文献的同行评审 “监督 ”系统已经崩溃。研究审稿人发现错误能力的随机试验表明,约75%的审稿人未能发现稿件中的重大错误,68%的审稿人无法识别结论是否得到结果支持。研究和出版过程的最终结果是,在心理学、遗传学、肿瘤学、心血管疾病和癌症等主要领域的研究中,有 35%-90% 的研究无法再现或复制。缺乏可再现和可复制的结果极为令人担忧,因为单项研究是系统综述/元分析和指南的基础,而系统综述/元分析和指南为临床和医疗保健政策决策提供依据。如果研究结果无法得到证实,那么有关研究应用的决策就可能出现偏差。简而言之,我们不知道研究结果是否属实。

我们该如何解决这个问题?

科学界该从何处着手纠正这一问题?虽然出版和同行评审的做法可以改进,但手稿送到出版商家门口时,研究已经完成。

糟糕的研究就是糟糕的研究。将一项研究定性为劣质或有偏见的研究可能会有所帮助,从而让阅读该研究的知识消费者了解其局限性。但是,这可能仍然无法阻止那些有目的的人利用这项研究来恶意宣传他们的主张。此外,参与临床研究的患者所花费的时间、资源和个人投资已经浪费在了一些事情上,而这些事情对围绕某个主题的整体文献库贡献甚微,或者助长了导致欺骗性和夸大健康声称的偏见。

研究人员需要正确地开展研究,并接受培训以使用适当的方法将偏差风险降至最低。这要从教育开始。我并不是在暗示数以千计的临床研究生学位都是胡扯。我对研究人员都是骗子、对自己在做什么一无所知的暗示感到恐惧。是的,有些研究人员是骗子,研究造假的例子不胜枚举,这里无法一一列举。科学是艰苦的,也是不完美的。人为错误时有发生。但欺诈、错误和缺乏适当设计和解释的试验之间是有区别的。虽然错误总是存在的,但可以通过适当的培训来确保试验的正确进行。临床研究项目需要确保提供有关如何设计无偏见试验的教育。

作为适当培训的辅助手段,或许需要设立一个 “方法委员会”,确保研究在进行之前已经过适当的设计,并且所有临床试验必须在试验开始前获得该方法委员会的批准。这就类似于伦理委员会,在试验开始前确保试验的安全性和伦理性。当然,在试验过程中和试验结束后可能会出现偏差。但是,如果研究的各个环节在一开始就准备就绪,偏差就会降到最低,理论上结果也会更加可靠。但这并不能阻止专家们胡言乱语,将基础研究中的证据不恰当地推断到人体研究中,或出于经济目的而做出欺骗性的声明。就像桥梁需要适当的地基来支撑过往货物的重量一样,研究也需要正确的设计来支撑结果和结论的重量。设计试验的是研究人员,对研究质量负责的也是研究人员。

我们生活在一个大多数东西都商品化的世界。即使是科学,一个旨在了解和促进人类生存条件的领域,也是一种商品。人们希望获得遗产,发现别人没有发现的东西,开拓未知领域。不幸的是,那些以科学为导向的生物黑客开拓者希望你相信他们独特的理论、产品和范式,但他们往往有失偏颇、视而不见,即使证据与他们的观点相悖,他们也无法看到和接受别有用心的观点。他们总能解释自己是对的,别人是错的,他们的范式 “只需要一个机会 ”就能被证明是正确的。

有时,没有证据可以回答问题。但是,如果除了理论和轶事,甚至是来自成千上万人的众包轶事(也就是没有证据)之外,没有其他证据,专家们就需要诚实地承认这种缺失。我们需要让那些基于低劣研究、未经证实的说法来推销新保健品的荒谬营销活动冷静下来。

撰稿人
标签
学术研究临床研究
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

AJE是Nature推荐润色品牌,解决论文语言问题更靠谱!

AJE为您提供英文论文润色、学术论文翻译、期刊选择、文稿排版等一系列学术服务,我们希望可以帮助您充分发挥您的研究潜力,助力您成功将论文发布在国际期刊上。