您好,请选择问题分类进行咨询。
联系电话
010-64938082
首页 > 千秋书院 > 中外书讯
浏览:14次发布时间 : 2026-04-29《被败坏的学术》科学出了什么问题?这本新书扒开了真相!



书名:被败坏的学术

作者:【英】斯图尔特·里奇

译者:赵泽铭

特约策划:领学东方

出版社:新华出版社

定价:78.00


1、内容简介


在真正重要的领域,如医学、教育、心理、健康、育儿等,我们都仰仗科学指引。科学的形象在大众心目中往往是崇高的、客观的、严谨的,实验室里穿着白大褂的研究者们遵循着严格的程序,一步步揭开自然的奥秘。然而,本书却揭示了科学家们难以避免的偏见与疏忽。


作者认为,许多广受认可且极具影响力的理论与主张,如“启动效应”与“成长型思维”、睡眠与营养、基因与微生物组……竟都建立在不可靠、夸大甚至欺诈性的论文基础上。


作者站在科学界新改革运动的前沿,致力于揭露并解决这些问题。在这项至关重要的调查中,他汇集了国外令人震惊的科学研究证据和丰富的案例,故事性很强,好像在读学术不端故事会,让人一读起来就放不下。但本书绝非一部绝望之作。在剖析问题之后,里奇以整整一章的篇幅提出了系统性的解决方案:研究预注册、鼓励复制研究、开放科学与数据共享、改进同行评议、引入专业统计审查……


这些被称为“开放科学”运动的实践,正在全球范围内重塑科研的底层逻辑。本书虽然以西方科研体系为案例,但其中揭示的问题具有跨文化的普遍性。对于正在从“科研大国”迈向“科研强国”的中国而言,它的参考价值尤为突出。


2、作者简介


【英】斯图尔特·里奇(Stuart Ritchie),英国心理学家,伦敦国王学院精神病学、心理学与神经科学研究所高级讲师,曾荣获2015 年美国心理科学协会颁发的“学术新星奖”。


他是“开放科学”运动的著名支持者,致力于改革科研实践、帮助科研人员在报告研究成果时更为透明。著有《智商的重要性》(Intelligence: All That Matters)、《被败坏的学术:科研中的造假、偏见、疏忽与炒作》。


其中《被败坏的学术:科研中的造假、偏见、疏忽与炒作》一书荣获泰晤士报2020 年年度好书、英国皇家学会 2021 年度科学图书奖。


3、译者简介


赵泽铭,一级翻译(副译审),同声传译;中国翻译协会专家会员;现任首都师范大学外国语学院讲师、硕士生导师;中国科学院大学理学博士。


出版《国富论》《银行业和金融服务的未来——如何抓住机会应对颠覆性创新和挑战》《长江中游文明化进程中的人地关系:以新石器时代为例(英文)》等多部译著。


4、编辑推荐


荣获《泰晤士报》2020年年度好书、英国皇家学会2021年度科学图书奖。


“这是一部通俗易懂且论述精湛的著作,深入剖析了21世纪科研人员面临的问题……对于想了解科学为何及如何未能实现其理想的人来说,这都是一本极佳的入门读物。”


书中充满了大量的科研故事、各类研究,以及详实严谨的证据,好像一本学术不端的故事会。


《泰晤士报》《出版人周刊》《柯克斯书评》《晚间标准报》《国家评论》《图书馆杂志》《连线》各大媒体鼎力推荐。


美亚评分4.6,好评如潮。


5、目录


出版者前言

前言

第一部分理想与现实

第一章科学如何运作

第二章复现危机

第二部分错误与缺陷

第三章造假

第四章偏见

第五章疏忽

第六章炒作

第三部分原因与对策

第七章不当激励

第八章修复科学

后记

附录

致谢

注释


6、精彩内容

前 言

人类智力还有一种独特、永久的错误,就是它较易被正面的东西所激动,较难被反面的东西所激动。

——弗朗西斯·培根(Francis Bacon)

《新工具》(Novum Organum)


2011年1月31日是一个神奇的日子。这一天,全世界终于发现大学生拥有超能力。


一篇全新的科学论文登上了新闻头条:一项对1000多人开展的实验发现了心灵预知(precognition)的证据,即利用超感官知觉预见未来的能力。这项研究并不是来自什么名不见经传的怪人,论文的作者是常春藤联盟成员康奈尔大学的顶级心理学教授达里尔·贝姆(Daryl Bem)。这篇论文也不是发表在不为人知的冷门期刊上,相反,它发表在了一部最受推崇的、主流的、经过同行评议的心理学学术期刊之上。科学似乎正式认可了一种此前被认为完全不可能发生的现象。


这篇论文发表的时候,我还是一名博士生,在爱丁堡大学研究心理学。我认真阅读了贝姆的论文。论文中的一个实验是这样开展的:本科生们看着电脑屏幕,屏幕上会出现两幅窗帘的图片。他们被告知,其中一幅图片的窗帘背后还有另一幅图片,而他们需要点击他们认为背后藏有图片的窗帘。由于没有其他额外信息,他们只能猜测。选好之后,窗帘消失,他们就可以看到自己的猜测是否准确。如此重复36次,实验结束。实验结果令人震惊。当窗帘背后的图片是一幅中性、无聊的物体(如椅子)的照片时,结果几乎是完全随机的:学生们选择的正确率为49.8%,基本上是一半一半。然而,怪就怪在这里:当窗帘背后的图片是色情图片时,学生们的正确率要高于平均值。准确地说,概率是53.1%,刚好超过“统计显著性”的阈值。在论文中贝姆认为,某种无意识的、进化的、来自心灵的性欲,甚至在色情图片出现在屏幕上之前,就已经对学生产生了轻微的暗示和引导。


贝姆的另外一些实验没这么明确,但同样令人费解。在其中一个实验中,屏幕上会出现40个互不相关的单词,每次显示一个。之后会对学生们进行突击记忆测试,学生们被要求尽可能多地输入他们记住的单词。之后,计算机随机抽取20个单词,再次向学生们展示。然后,实验结束。贝姆报告称,在记忆测试过程中,学生们更有可能记住即将再次出现的20个单词,尽管他们并不知道哪些单词会再次出现—除非凭借心灵直觉。用考试和复习类比,这就像是先考前复习,然后考试,然后考后再复习—而考后复习又以某种方式神奇地提高了你的考试成绩。除非物理定律突然完全失效,否则时间应该是单向度的:原因应该出现在结果之前,而非之后。但是,随着贝姆研究结果的发表,这些怪异的结果成了科学文献的一部分。


最重要的是,贝姆的实验非常简单,只需要一台台式电脑,不需要任何复杂设备。如果贝姆所言为实,那么任何研究人员只要按照他的实验方法论指引,甚至一名几乎没有任何资源的博士生,都可以产出超自然现象的证据。当时的我正是后者,所以我也进行了尝试。我联系了另外两位同样对实验结果持怀疑态度的心理学家—赫特福德大学的理查德·怀斯曼(Richard Wiseman)和伦敦大学金史密斯学院的克里斯托弗·弗伦奇(Christopher French)。我们一致同意在各自的大学里把贝姆的单词实验重复做三次。我们招募被试者,等待他们完成记忆测试,然后向一脸茫然的参与者们解释我们想要寻找的结果。花费了几周的时间,我们得出了结果:没有结果。我们的大学生并没有超能力,也不能预知未来:他们对测试后出现的单词的记忆没有任何差别。万幸,物理定律还是可靠的。


我们及时地把我们的研究成果撰写成了论文,将其寄给了发表贝姆研究成果的那部科学期刊—《个性与社会心理学期刊》(Journal of Personality and Social Psychology)的编辑部。我们的论文几乎被“秒拒”。几天之后,编辑就拒绝了我们的论文,还向我们解释说,他们期刊的出版政策是绝不发表重复先前实验的研究,无论这些研究的结果是否与先前的实验相一致。


我们因此感到愤愤不平,这有错吗?这部期刊曾经发表了一篇带有极其大胆的主张的论文。这些主张如果属实,不仅会引起心理学家的兴趣,而且可以彻底颠覆科学。这些结果已经进入了公共领域,还得到了大众传媒的大力宣传。论文作者贝姆还参加了脱口秀节目《科尔伯特报告》(The Colbert Report),节目主持人在节目中创造了“穿越时空的色情”这个令人印象深刻的短语。即便如此,期刊编辑们甚至不考虑发表一项对研究结果提出疑问的复现研究。


与此同时,另一个案例也在不断发酵,同样引发了对当前科学实践现状的令人担忧的讨论。世界上最负盛名的科学期刊之一,仅次于《自然》(Nature)的《科学》(Science)杂志,发表了荷兰蒂尔堡大学的戴德里克·斯塔佩尔(Diederik Stapel)的一篇研究论文。这篇题为《应对混乱》(“Coping with Chaos”)的论文提到了在实验室和街头开展的几项研究。研究发现,当人们处在更混乱或更肮脏的环境时会表现出更多的偏见,更加认可种族歧视的刻板印象。6这篇论文和斯塔佩尔的其他几十篇论文一起登上了全世界的头条。《自然》杂志的新闻部门评论道:“混乱助长刻板印象。”《悉尼先驱晨报》则使用了押韵的方式写道:“垃圾堆积之处,种族主义滋生。”这些结果反映了社会心理学研究的一种典型特征,即研究结果易于掌握,正如斯塔佩尔在论文摘要中写到的,研究结果带有“明确的政策启示”,呼吁“尽早发现环境混乱问题并立即进行干预”。


问题在于,所有这些内容都是假的。斯塔佩尔的一些同事发现他的实验结果有些过于完美,于是开始质疑研究的真实性。此外,通常情况下,资深学者往往十分忙碌,需要依靠学生来完成收集数据等琐碎的工作,而斯塔佩尔的论文显示他的研究都是亲自出马收集数据。2011年9月,同事们向校方提出这些问题之后,斯塔佩尔被停职。随后,学校开展了多项调查。


在随后撰写的忏悔式自传中,斯塔佩尔承认他没有收集数据开展研究,而是独自一人坐在办公室或是厨房的餐桌旁直到深夜,将他想象中的结果所需的数字输入电子表格,从头开始全部编造。斯塔佩尔写道:“我做了一些可怕甚至是令人厌恶的事情。我伪造了研究数据,编造了从未发生过的研究。我独自完成了编造,非常清楚地知道自己到底在做什么……我没有任何感觉:没有厌恶,没有羞耻,也没有后悔。”斯塔佩尔的科学造假出人意料地复杂、严密:“我编造了开展研究的整个学校、与我讨论过实验设计的老师、做过的讲座、参与的社会研究课程,还有我为感谢人们的参与而送出的礼物。”


斯塔佩尔叙述了他的造假经历。他打印了似乎要发给参与者的空白表格,向同事和学生展示,宣布他要去开展研究……然后趁人不备把这些表格统统扔进垃圾箱。这种行为注定无法持续。调查结果显而易见,他在停职后不久即被学校解雇。之后,由于数据造假,他的不少于项研究被撤稿—也就是被剔出科学文献的世界。


受人尊敬的教授发表了看似不可能(贝姆)和完全虚假(斯塔佩尔)的研究结果,这震动了心理学界乃至整个科学界。这些知名的科学期刊为什么会允许他们发表?还有多少其他不可信的研究已经发表?事实证明,这些案例恰恰说明了我们进行科学研究的方式存在更为普遍的问题。


这两个案例的关键问题都与复现(replication)有关。一个值得认真对待的科学发现不可能是偶然发生的,也不可能是因为设备出现了故障,更不可能来自科学家的造假或弄虚作假。它必须真实发生过。如果确实如此,那么理论上其他研究人员也应该能够观察到与原作者大致相同的结果。在许多方面,这就是科学的本质,也是科学与其他认识世界的方式之间的区别:如果无法复现,那么就很难把你的工作描述为科学。


因此,令人担忧的不是贝姆的实验并不可靠,也不是斯塔佩尔的实验只是他的虚构,我们永远都不会摆脱错误或虚假的结果(当然,也无法摆脱造假者)。真正有问题的是,科学界如何应对这两种情况。我们尝试复现贝姆的实验,却被发表原始实验的期刊无情拒绝;而斯塔佩尔的实验甚至从来没有人尝试复现。换句话说,科学共同体已经表明他们满足于相信这些研究中存在的夸大主张,而不会去检验这些结果的可靠性。如果不对结果的可复现性进行交叉验证,又怎么能知道它们不仅仅是偶然事件或伪造呢?


在其臭名昭著的研究发表数年之后,贝姆本人在采访中所说的一段话或许可以完美概括许多科学家对复现的态度。贝姆说:“我完全支持[科学的]严谨性,但是我没有足够的耐心……如果你看过我过去所有的实验,它们的背后都是修辞手法。我收集数据来支持我的观点,我把数据作为说服别人的论据,我从来没有真正担心过‘[自己的]研究能否复现’。”


担心结果能否复现不是一种选择,而是一种必须。它是科学的基本精神:这种精神本应在同行评议和期刊发表的体系中体现出来,而这些体系本来的作用是一种防火墙,阻止虚假发现、错误实验和可疑数据的侵入。然而,在后文中,本书将会告诉读者,这个体系现在已经遭到严重破坏。科学家们发现的重要知识被认为不够有趣,无法发表,它们被篡改或干脆隐藏起来,不仅歪曲了科学记录,还损害了我们的医学、技术、教育干预措施和政府政策。人们将大量资源投入科学研究,以期获得有用的回报,但资源却被浪费在毫无价值的研究上。完全可以避免的错误和失误经常越过同行评议的“马奇诺防线”。书籍、媒体报道和我们的头脑中充斥着错误、夸大或严重误导的“事实”。在最糟糕的情况下,特别是在医学科学领域,患者的生命正在因此消逝。


其他的书籍会介绍古往今来的科学家与伪科学者展开的激烈斗争,后者包括神创论、顺势医疗、地平说和占星术的支持者及其同类。这些伪科学的拥趸对科学的误解和滥用通常是无意的,有时是恶意的,但总是不负责任的。这本书与它们不同。这本书向读者揭示了科学本身的深刻堕落:这种堕落影响了从事研究实践和发表研究成果的整个文化。科学这门学科本应具备最严格的怀疑主义、最敏锐的理性和最坚定的经验主义,但是却堕落到充斥着纷乱的无能、妄想、谎言和自欺欺人的境地。在这个过程中,科学的核心目标—接近真理—正在遭到破坏。


本书的第一部分首先指出,科学实践远不止开展实验或验证假说。科学在本质上是一种社会活动,你需要让其他人(也就是其他科学家)相信你的发现。由于科学同时还是一种人类活动,所有科学家都会受到人性弱点的影响,例如非理性、偏见、疏忽、圈内偏袒,以及为了达到目的而彻头彻尾的作弊。为了让科学家们能够在努力超越人性固有局限的同时相互说服,科学发展出了一套制衡的体系,理论上可以分开科学的精华与糟粕。第一章介绍了审查和验证的进程,这一进程最终导致了“在同行评议的科学期刊上发表论文”这一所谓的黄金标准的出现。然而,第二章指出,这个过程肯定出了大问题:在不同的科学领域中,许多已发表的研究成果无法复现,其真实性非常值得怀疑。


接下来,在第二部分,我们会探究背后的原因。我们会发现,出版体系非但没有中和或是超越所有的人为因素,反而允许它们在科学记录上留下痕迹,而原因正是其相信并认可自己的客观和公正性。奇特的自满和怪异的傲慢已经在出版体系中占据了上风,同行评议制度的存在似乎只能阻止别人认识到其背后的缺陷。经过同行评议的论文被认为是最接近世界运作方式的客观事实的描述。但是在看过数十篇这种论文之后,我们发现,同行评议并不能确保科学家们给出诚实(第三章)、公正(第四章)、严谨(第五章)或冷静(第六章)的结论。


本书的第三部分深入探讨了科学实践。第七章显示,不只是科学体系没能有效应对我们讨论过的各种渎职行为,事实上,当前学术研究的组织方式助长了这些问题,鼓励研究人员专注于声望、经费和地位,代价则是严谨、可靠的结果。最后,在我们诊断出问题所在之后,第八章介绍了一系列十分激进的科学实践改革措施。这些措施有助于重塑科学的初衷:发现世界的事实。


为了说明科学研究的弱点,我将在书中引用不同领域的发人深省的案例。书中会有大量来自心理学领域的案例,部分原因是我本人就在从事心理学研究。但我的学术背景并不是书中选入如此之多心理学案例的唯一原因,另外一部分原因在于,在贝姆和斯塔佩尔事件以及许多其他事件之后,心理学家们开始了激烈的自我反思。也许比起其他任何领域,我们(心理学)已经开始认识到了学科内部根深蒂固的缺陷,开始制定系统的方法来解决这些问题。这些方法也已经被越来越多的其他学科采用。


修复我们残缺不全的科学体系的第一步,就是学会发现并纠正可能将其引入歧途的错误。实现这一点的唯一途径就是进行更多的科学研究。在整本书中,我都会借鉴元科学的概念。元科学是一种相对较新的科学研究形式,专注于科学研究进程本身。如果说科学是揭示和消除错误的过程,那么元科学则代表这一过程转向科学的内部。


我们可以从错误中学到很多东西。音乐家托德·朗德格伦(Todd Rundgren)的一张专辑中录有一段语音介绍,鼓励听众一起尝试一个他称之为“录音室之声”(Sounds of the Studio)的小游戏。朗德格伦向听众介绍了录制音乐时可能出现的所有失误,包括嗡嗡声、嘶嘶声、(每当有人唱到含p音的单词时)麦克风的喷麦声,以及不流畅的剪辑等。他建议听众在接下来的歌曲和其他唱片中留意这些错误。就如同更好地了解录音室的失误可以让你获得对音乐制作的新认识,了解科学如何出错也可以增进你对知识获取过程的了解。


发现科学运作方式中存在的严重问题会让人感到不安。你在新闻和科普读物中读到或在纪录片中看到的——那些让你兴奋得想与朋友分享,或是重新思考世界是如何运转的——引人入胜的发现,有多少是建立在无法复现的脆弱研究的基础之上?医生为你开出的处方或是其他治疗方法,有多少是基于有缺陷的科学证据?又有多少次,你根据一项科学研究的结果改变了自己的饮食、消费习惯或其他生活方式,但几个月后这些依据又被更新的研究全盘推翻?政客们曾多少次引用经不起推敲的科学研究,制定直接影响人们生活的法律或政策?所有这些问题的答案都远超你的想象。


希望每项科学研究都是真实的,也就是希望每项研究都能报告一些板上钉钉的事实,永远不会被未来的研究推翻,这种想法未免太过天真。在这个过于混乱的世界里,这一点远远无法实现。我们唯一能够期待的,就是我们的科学研究值得信赖—它们能够如实地报告研究中发生的事情。如果备受推崇的同行评议程序无法证明这种信任,那么科学将会失去其最基本、最可取的品质之一,也会失去它最擅长的能力:通过持续不断的新发现、新技术、新疗法和新对策彻底变革我们的世界。


我意在赞美科学,而非埋葬科学。这本书不是对科学本身或是科学方法的攻击;相反,它是对这些方法的辩护,也是对科学原理的辩护。更广泛地说,它是对当前的科学实践方式的辩护。正因为科学的重要性,才使得我们遇到的所有灾难如此令人不安。如果任由科学被玷污,任由科学进步如此严重地停滞不前,我们就有可能毁掉人类在世界上取得的最伟大的成就之一。


不过,损失并非无法弥补。原则上说,即使不在实践中,科学仍有可能成为我们所需要的强大而可靠的知识体系。当我们在浏览本书中提到的一系列科学失败事件时,我们仿佛在掀开一个充满造假、偏见、疏忽和炒作的潘多拉魔盒,然而万幸的是其中还冒出了一丝脆弱的希望和安慰——这正是我们需要坚持的乐观想法:这些问题几乎都已经被其他科学家发现了。为了解决这些问题、清理已经造成的混乱局面而提出的元科学的巧妙观点在很大程度上就来自科学共同体内部。即便自我批判精神已经在许多领域中被深深埋没,它依然存在于科学之中,依然在激励着真正的科学。万幸如此。当你翻开下一页,开始阅读这本书的正文时,你就会发现,现在的情况的确已经相当混乱。


(转自微信公众号:叙拉古之惑。转载仅供学习交流,图文如有侵权,请来函删除。

关于千秋业 | 网站声明 | 诚聘英才 | 联系我们
2007 - 2012版权所有 © 北京千秋业教育顾问有限公司
地址:北京市朝阳区安立路68号(阳光广场)B2座16层1602室 邮编:100101
联系电话:010-64938082 传真:010-64938079 E-mail:1946642092@qq.com