失实为什么我们所知道的一切,有一半可能都将是错的
[美] 塞缪尔•阿贝斯曼(Samuel Arbesman) 著赵晖 译中信出版社#图书在版编目(CIP)数据失实:为什么我们所知道的一切,有一半可能都将是错的 /(美)阿贝斯曼著;赵晖译. —北京:中信出版社,2013.10书名原文:The Half-Life of Facts: Why Everything We Know Has an Expiration DateISBN 978–7–5086–4200–0I. ①失… II. ①阿… ②赵… III. ①科学计量学-通俗读物 IV. ①G301-49中国版本图书馆CIP数据核字(2013)第204133号Copyright © 2012 by Samuel ArbesmanFirst published in the United States by Penguin PressSimplified Chinese translation copyright © 2013 by China CITIC PressALL RIGHTS RESERVED
本书仅限于中国大陆地区发行销售失实:为什么我们所知道的一切,有一半可能都将是错的
著 者:[美] 塞缪尔·阿贝斯曼译 者:赵 晖策划推广:中信出版社(China CITIC Press)出版发行: 中信出版集团股份有限公司(北京市朝阳区惠新东街甲4号富盛大厦2座 邮编 100029)(CITIC Publishing Group)
中信出版社官网:<http://www.publish.citic.com/>官方微博:<http://weibo.com/citicpub>更多好书,尽在中信飞书 App:<http://m.feishu8.com>(中信电子书直销平台)#致德布拉#
目录
第1章 事实半衰期
第2章 发现的步伐
第3章 真相的渐近线
第4章 万事万物的摩尔定律
第5章 事实的传播
第6章 隐藏的事实
第7章 知识相变
第8章 珠穆朗玛峰与错误的发现
第9章 被人类影响的事实
第10章 知识的边缘
致谢
注释
第1章 事实半衰期
20世纪30年代末,当我祖父还在牙医学校读书的时候,接受的是国家最先进的医学教育。他学习各种解剖知识,涉及生物化学和细胞生物学的许多方面。他还学到了人体细胞的染色体数目。问题是,他学习的时候,这个数字是48。生物学家们首次实现人体细胞的细胞核可视化是在1912年,他们数出48条染色体,于是这个数字正式写入教科书。1953年,一位著名的细胞学家甚至说:“人类体内有48条常染色体1,这已成为无可争辩的事实了。”
但是在1956年,就职于纽约纪念斯隆–凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center)和瑞典的癌症染色体实验室(Cancer Chromosome Laboratory)的两位研究人员——蒋有兴(Joe Hin Tjio)和阿尔伯特·莱文(Albert Levan)2决定用一种最新的技术来观测细胞。他们反复地计数,却都只观察到了46条染色体。蒋有兴和莱文与前辈们交流了实验结果,才发现他们竟然也一直遇到类似的问题。其他科学家甚至因此过早地中止了一些工作——他们认定本该有48条染色体,但是却只能找到其中的46条。但是,蒋有兴和莱文没有墨守成规。相反,他们做出了一个大胆的猜想,即其他人一直都在使用错误的数字,人体细胞的染色体仅有46条。
事实一直在变化。医生曾建议人们吸烟,现在又警告称吸烟致命。吃肉曾被认为对人体有益,然后又变成有害,最后又变成有益——而现在这成了一个见仁见智的话题。医生建议女士做乳房X光造影检查的最低年龄线不断提高[1]。我们曾经认为地球是宇宙的中心,但是自从日心说被广泛认可后,我们的星球就被降级。我始终不确定红酒是否有利于我的健康。再举一个我自己家里的例子。我的父亲是一位皮肤科医生,他告诉我,他在医学院的时候曾连续两年参加过一项考试,其中有一道多项选择题被重复考查,题目原封不动,备选答案也只字未改,但是第一年的答案是一个选项,第二年的答案却是另一个选项。
在我们周围,其他类型的事实也在发生改变。10年前的网络与今日的高速网络不可同日而语。科学研究领域的通用语言已经从拉丁语变成德语,之后又变成英语,而且一定会再次发生变化。仅在过去的一百年里,地球人口已经从不到20亿猛增到70亿以上。人类突破了地球引力的束缚,实现了月球漫步,并把史前古器物送到了外太阳系。而在国际象棋、跳棋甚至机智问答(Jeopardy!)等领域中[2],人工智能胜过了人类智能。
我们的世界似乎一直处在不断的变化之中。知识日新月异,连最见多识广的人也难以跟上变化的脚步。这些改变看似偶然,而且令人不明就里,(恐龙有羽毛吗?那是什么时候发生的事?)但是,轰轰烈烈的变革背后其实蕴含着系统的、可用科学和数学知识解释的规律。
知识就像放射性物质。如果你观察的只是单个铀原子,那么你很难预测它是否会衰变——裂变以及释放能量。可能这就是下一秒的事,也可能你坐下盯着它几千年甚至几百万年,它才会发生裂变。
但是当你面对的是由数以万亿计的原子构成的一组铀时,未知的事情就即刻清晰起来。我们知道铀原子聚在一起时如何变化。一组铀原子的变化是极有规律的。如果我们把微粒放在一起,那么一项叫作巨量定律的概率定律就派上用场了,即使是微乎其微的一个铀原子也将显现出变化规律。如果有足够的耐心,我们会看到有一半的铀在7.04亿年中有规律地完成裂变。这个数字(7.04亿年)是可测的,叫作铀的半衰期。
其实,如果把事实看成一个由信息组成的巨大整体,那么事实也是可以预测的。归结起来,事实是有半衰期的:我们可以测算一门学科半数的知识被颠覆需要多长时间。由此就有了研究新事实以何种速度产生、新科技以何种速度发展、甚至事件以何种速度传播的科学。于是也就可以用科学的方式了解知识的变迁。
这是一个强有力的观点。面对变化多端的世界,我们不必茫然无措。相反,我们可以认识事物的总体发展和演变,就像认识放射性物质的变化一样。本书旨在引导你接受一个惊人的观念:我们的知识——甚至是那些人人都深信不疑的知识——在以一种容易理解的、系统的方式发生变化。
知道知识如何变化,究竟有多大用处呢?你可能觉得挺有意思,我们儿时所知道的恐龙——行动缓慢、长着鳞片、灰绿色的——现在移动快速、长满羽毛、色彩鲜艳得如同美国国家广播电视台(NBC)里的孔雀。但是,若不是家中有一个6岁的孩子,这些变化可能并不会对你的生活产生任何显著的影响。
我可以告诉你,在某些医学领域,知识的新旧更替还用不上半个世纪——时间比一个人的寿命都短——知道这一点能激励我们不断地更新已有知识,我们要想保持健康的饮食习惯,掌握正确的锻炼方式,就不能依赖年少时别人告诉我们的那一套。我可以这么说,了解语言如何变化有助于我们更好地理解下一代人的俚语和方言。
话说回来,这样的实例固然重要(错误的医学知识仍会不断出现),但这还不是关键所在。事实如何变化、知识如何传播、我们如何适应新的想法,通晓这些问题的重要性在于:了解知识的运作有益于我们认知世界。而更为重要的是,由此我们每个人便可防患于未然,并弥补这些知识的内在缺陷。
我们如何组织和解释我们周遭的一切,这就是事实。人们不会只学习新知,却把它完全独立于已有知识以外。我们会不断把新知融入自幼形成的个人知识小体系内。如果未能做到这一点,我们就说:认知失调了。
人类总是在规范周围的环境。在童年时代,我们给玩具起名字,成年后,我们给物种、化学元素、小行星和城市起名字。通过命名,或者更广义地说,通过分类,我们要创建一种规则,从而避免世界陷入混乱,变得可怕。
而我们认知事实时也是这么做的。事实——无论它是关于我们的周遭环境、现有的知识形态,还是关于我们自己——可以给予我们一种掌控感和舒适感。当我们在黄昏时分瞟见什么东西,我们不必以为那是一只令人毛骨悚然的夜鸟:我们称之为蝙蝠,它是一种有翼的哺乳动物,夜间出来活动,通过自身的回声定位来“看”东西,很可能它被附近的双足哺乳动物弄得担惊受怕。这么一说,就不那么可怕了吧?
但是,当事实变化时,我们会有一点点的失控。突然间,事情就变了模样。如果几十年来医生一直不知道吸烟危害着我们的健康,我们就会担心,今天的医学知识究竟还有多少也是错误的。假若我刚刚发现我的父母与我的育儿方法大相径庭——在他们的时代,那样的育儿方法是可以接受的——我会有点儿担心他们对我的抚养。又比方说,科学家们已经发现了数以百计的太阳系外行星,而我却一直以为行星只有那么零星几个,那么我可能会感到些许震惊,至少会有点儿惊讶。
但是,如果我们能够掌握事实变化的基本规律和模式,我们就可以更好地应对身边的种种不确定性。
需要明确的是:我说的“事实”非常直观——我指的是个人、社会或与世界现状有关的任何主体所知道的一些知识。我们总是希望事实能准确地代表和展现客观真相,但其实不然。
某些领域的事实就是客观真理3。对科学的不懈追求让我们比以往任何时候都更加接近这个真相,而也正是因为不断逼近真相,我们才有了许多新的发现,以往的认识才得以发生变化。不过,我指的“事实”也很宽泛,我只是想指我们的个人知识觉悟状态。它可以指无论最后成立与否的科学性知识,也可以指一种更加明确的事实,比如当前跑得最快的人或者是最强大的计算机,它们都是你我身边的事实。
人人都满意是不可能的,尽管这样,我还是想说说我选择这个词的两个原因:第一个原因是不想卷入某种认识论的兔子洞[3],我这么说你可能很不解。套用美国最高法院大法官波特·斯图尔特(Potter Stewart)的话说[4],当我们看到的时候我们会知道那是事实。而第二个原因,也是更为重要的原因,就算很多知识类型不同,但是它们的变化方式却是类似的。虽然一些事实是关于逼近真相的,一些事实是关于我们周遭的,但是只有把各种类型的事实视为一体4,我们才能清楚地看出它们是如何运作的。
而且,我有一个简单易行的方法,用我的方法组织事实,甚至能免去探究知识变化背后的数学和科学知识的麻烦。我的方法就是通过变化速率来组织我们已有的事实。
假使我们把世界上所有的事实(涵盖了我们知道的一切知识)全都按照其变化速率依次排列。在队列的最左边,是变化速率最快的事实,它们一直瞬息万变。例如,明天天气将会如何,或者昨天股市收盘于多少点。而在最右边,是变化非常缓慢的事实,实际上,说它们一成不变更为确切。例如,地球分为多少个大洲,或者人的手有几根指头。
在这两者之间,是那些不断变化但是变化速率不会太快的事实——因此,它们可以算是最难应对的事实。事实可能会在几年或者几十年间,或者一生中发生改变。这个星球上有多少亿人,就属于这类事实。我上学那会儿,这个数字还是50亿,而在2012年,全球人口又跨过了70亿大关。我的祖父出生于1917年,那时的全球人口总数还不足20亿。同属此类的事实还有太阳系外已知行星的数目,或者类似的,在我们的太阳系里有多少颗行星。我们对恐龙的了解,以及一台电脑的平均计算速率,都属于这个范畴。我们所知道的绝大多数事实似乎都属于此类,我称之为“中央事实”(Mesofacts)5——变化速率位于中间的事实。
大量的科学知识是由中央事实组成的。比方说,已知的化学元素的数目是一个中央事实。如果你在婴儿潮时期出生,于1970年学习高中化学,并且和我们一样,你没有定期更新化学知识的习惯,那么你不会发现周期表中至少又新出现了12个元素,现在元素总数达到了118个。在你高中毕业之后,人们又发现了不少新元素,这个数目比原来元素总数的1/10还多。我之前所提到的所有关于恐龙的知识,也都是由中央事实组成的。
科技也含有非常多的中央事实,从交通提速到信息存储——从软盘到云存储。技术进步还使得摩天大楼屡创新高。
在人类能力领域,世界纪录不断被打破。我们一度认为,有些游戏对计算机来说过于复杂,但是现在,从“奥赛罗”和跳棋到国际象棋,在与机器的屡次较量中,我们已经开始力不从心,而机器越来越多地稳操胜券。
中央事实就在我们的身边,意识到此类事实的存在将大有裨益,它们的存在使我们免于一些生活插曲的搅扰。
如果我的祖父在牙医学校的时候就得知,那儿传授的某些知识将会在他毕业不久之后过时,他至少会有个心理准备。他这一代牙医就不会惊讶于基本的生物学事实更迭,也不会一直使用过时的知识。其实,许多医学院校现在都在这样做:他们接纳医学中的中央事实,并教导外科医生,知识的变化是常态,而不是偶然现象。
但是仅仅知道知识在这样变化是远远不够的。我们最终会有点儿疯狂,因为我们太想跟上身边那些事实变化的脚步,结果永远奔跑在某种信息跑步机上。不过这又何苦呢,毕竟变化有迹可循:事实的变化蕴含着数学规律,我们要做的是掌握知识的演化模式。唯有这样,我们才能更好地为知识的变化做准备。
不断变化的科学知识背后蕴含着数学规律。科学知识的积累进展顺利,因此,我们寻求更好地了解世界的过程,也就是事实被定期推翻的过程。同样地,科技知识(从处理能力到信息存储)的进步和变化也是规律变化的一个组成部分。无须多言,科学和技术这两个领域影响着我们生活中方方面面的事实:从疾病的传播到我们的旅行方式,甚至还有计算机病毒在互联网上的蔓延。这些领域的知识都在系统地发生改变。
事实的创造遵循特定的科学原则,同理,知识的传播也遵循特定的科学原则;我们如何获得新的信息,如何消除错误,这些问题都遵循数学规律。而且,当我们对认知偏差有了新的认识以后,我们就会发现,许多熟知的东西其实是万变不离其宗的:这些变化遵循一定的科学模式,而这些模式又可以通过认知科学的研究成果来解释。
这并不是说我们可以了解一切。世事难料,但是一旦我们察觉到了这些新事实,我们就不能置之不理。我是想说,我们总是有办法去了解知识的改变方式,并且我们可以让错综复杂、变幻无穷的事实变得井井有条。
威廉·麦克尼尔·狄克逊(William Macneile Dixon)是19世纪末至20世纪初英国的一位文学教授,他曾经这样写道:“现实不会静静地坐着等你为它画像。它们不断振动,满是混乱和困惑。”
现在,物理学知识让我们懂得了振动的原理。我们再也不会困惑为什么拨动吉他的弦,节奏和音调就变了。我们已有的知识瞬息万变,现在是时候去揭开它的面纱了,知识的变化都是有规律的。关于事实振动背后的科学,本书将为你一一道来。
[1]利用X光造影做乳腺癌筛检有年龄上的限制,太年轻就每年接受乳房X光造影可能会对乳房产生负面影响。但随着年龄增长,乳房组织脂肪增多,腺体减少,通过乳房X光造影能更容易发现变化。——译者注[2] 美国一个人机大战的益智节目。——译者注
[3]兔子洞,语出著名英国儿童文学作品《爱丽丝梦游仙境》,后被广泛用来比喻进入未知世界的入口。——译者注
第2章 发现的步伐
1947年,当德里克·普赖斯(Derek J. de Solla Price)1来到莱佛士学院(现在的新加坡国立大学)讲授应用数学课的时候,他并没有打算倡导一种审视科学的新方式。他计划继续研究物理和数学,但是他的这个计划因学院图书馆的建设而改变了。莱佛士学院是一个规模甚小的大学,所以图书馆在建期间,藏书被交由学生和教师保管,暂存在他们的宿舍和公寓里。
普赖斯最后拿到了一整套的《哲学学报》(Philosophical Transactions),这是一份伦敦的英国皇家学会主办的科学性杂志,它的历史可以追溯到1665年。一回到家,他就把期刊按时间顺序分作几堆,靠墙码了起来:每一堆的出版时间都晚于前一堆。有一天,他无所事事地看着图书馆强加给他的这一大堆杂志,却猛然发现,这一堆堆装订成册的杂志高度既不完全相同,也不是乱七八糟的。相反,他发觉它们的高度符合一个特定的数学模型:指数曲线。普赖斯简单的观察,正是科学知识如何增长这一复杂定量理论的起源。
我们的日常生活总体上呈线性增长,或者说,它的改变可以画成一条直线。当某个东西每年以相同的数量增加,且速率恒定,这便是线性增长。如果我们开车去某地,一路上时速不变,我们把每一小时所行进的路程做个图,就是一条直线。再者,如果我们有一台速率恒定的机器,它每小时生产3个部件,那么数个小时后,部件的数目会与小时数呈线性对应关系。
由于线性增长易于推测(我们的大脑似乎特别习惯于这样的思考方式),我们通常会采用这种思考方式。如果前天60华氏度,昨天65华氏度,那我们八成会觉得今天70华氏度。
但是有的改变并不遵循线性关系,这样的例子也有很多。如果你连续看了好几天夏日的日落,那么你在心里预期日落的时间会符合一条线性曲线,这也不无道理:每一天,太阳落山都正好比前一天晚那么几分钟。其实你却会发现,一个地点的日落遵循的是一条正弦曲线——波浪形,看起来像一根绳子上下摇晃后的轨迹,而不是我们想当然的那样。冬至和夏至时分——一年中最短和最长的两天——我们处在波浪的顶端或底端,每天的日落时间只是微微变化;春分和秋分的时候,日落时间处在波浪最陡峭的地方,每天的日出和日落时间相差甚远。我们很难直观地在脑海里想象出这样的曲线。
对我们来说,许多呈指数增长的变化不大容易察觉。当我们遇到就在我们身边的指数曲线时,我们往往不会这么思考,因为很难构思出图形。指数增长就是以相同的比例或者相同的百分比增加,而不是每一秒、每一分钟或每一小时以同等数量增长。如果细菌每隔一小时的数量翻番,那就是指数增长,因为它们以每小时200%的恒定速率增长。复利也类似:如果我们的钱每年以一定的比例增长,我们就可以用指数曲线来描述这种增长。
图1 直线(黑色)、指数曲线(灰色)、正弦曲线(虚线)
你可能已经发现,指数增长是非常迅速的。即使最初我们只是每过一个小时或每过一天往底数上增加一点儿,过不了多久,这一数量就很可能会变得非常大。试想一下,假如我们有一美分,每天钱会翻一倍。一个星期后,我们每天将得到将近1.50美元。但是再过一个星期,我们每天的所得将超过80美元。不出一个月,我们每天的所得将超过1亿美元!
指数增长得名于指数的使用:指数就是一个底数与自身相乘的次数,很多时候,底数是一个特殊的常量;而对指数增长来说,底数通常是e,也称为纳皮尔常量,约等于2.72。又比如π,这些数字总是出现在最奇怪的情况下,不管是细菌翻倍还是无限的多数求和。等式的指数部分包括指数增长率。该值越大,数值的增长越快,翻倍的速度也就越快。
普赖斯很熟悉这种指数增长曲线,因此,他量一量那一堆堆杂志的高度,就立刻明白了。不过,也许只有他分到的那些杂志才遵循这种奇怪的模式。于是,他开始大量收集数据,这种习惯也成为他日后乃至一生的研究风格。
他统计了刊登在文献上的文章的数量,文章不仅有普通物理学方面的,还有更为专业的领域的,如涉及线性代数的分支领域。它们似乎都具备指数曲线所需的要素。普赖斯恍然大悟,他可能找到了一种认识科学发展的新方法。1950年,普赖斯在阿姆斯特丹的一次会议上介绍了他的研究工作。1951年,他把这一发现结果发表2在法国的一本小型期刊上,标题为《科学发展的定量量度》(Quantitative Measures of the Development of Science)。
但是没有一个人对此感兴趣。
普赖斯并没有止步不前。他回到剑桥,继续在新的领域进行针对科学定量研究的探索,即科学计量学,不久之后,人们就熟知了这门研究科学的科学。当时这门科学还很新,但是普赖斯下定决心,要收集大量的数据,借以认识科学如何变化。
到了20世纪60年代,他成为这个领域的权威先驱。他从科学的方方面面收集数据,整理出了不把科学的增长视为偶然的证据,这一知识从属于定律。
他把最初对科学期刊的研究进行了扩展,不管是天文学还是化学,只要一个领域显示出这种增长趋势,他就去收集这个领域里各种各样的数据。针对科学和技术的各个领域,普赖斯统统计算出了倍增时间——数量增加一倍需要多久,按一定比例呈指数增长——这个时间可以粗略地度量不同种类的事实如何随时间的推移而改变。下面截取了他于1963年出版的《小科学,大科学》(Little Science, Big Science)3里的一些倍增时间:
领域倍增时间(年)国家人物传记大辞典条目数100大学数量50重大发现数量;已知的化学元素数量;仪器精度20科学杂志数量;已知的化合物数量;科学机构成员数量15已知的小行星数量;美国的工程师数量10事实的增长终于开始受制于严谨的数学。
普赖斯进行自然科学研究的同时,类似的研究也在社会科学领域开展起来。1947年,一位名为哈维·雷曼(Harvey Lehman)的心理学家在期刊《社会力量》(Social Forces)上发表了一篇有趣的小论文4。雷曼梳理了各种各样的字典、百科全书、年表,着手统计了多年来各个领域的研究中重大贡献的数量。从遗传学、数学到艺术,无论是科学新发现、新定理还是新歌剧,他都一一审视。他发现随着时间的推移,所有新事物的产生都呈指数增长趋势。而这不是近几十年才有的特点。每一个领域他都统计了上百年的历史。他查阅了逾600年(从1275年至1875年)的哲学,逾300年(从1600年至1900年)的植物学,逾400年(从1500年至1900年)的地质学。
他发现,每个领域都具有其独特的增长率。这里列出雷曼发现的一些倍增时间(这些领域的年度重大贡献数量翻一番所需要的年数),其中包括一些较新的研究领域5:
领域倍增时间(年)医药与卫生87哲学77数学63地质46昆虫39化学35遗传学32大歌剧20与此同时,许多思想家也渐渐意识到,知识的增长有一定的模式可循,而绝非随心所欲。同样地,不同类型的增长对应着不同类型的知识创造。例如,与科学领域相比,歌剧领域的变化就快得多。科学同歌剧创作一样,具有内在的创造性,但是科学同时也受制于我们对大自然的了解。科学发展的速度不及我们弄明白世间事物的速度。但是,大歌剧并不受限于真实,唯一的衡量标准就是美,也无须进行严格的实验,因此它发展得更加迅速。
此外,有一些发现更多地依赖于其他领域的发展,这些发现要基于其他领域的研究成果,通过比较各种发现,我们隐约找到了重大发现的增长方式。例如:遗传学和化学是基础科学,它们的发展速度相当。但是相比较而言,医药与卫生的发展就慢得多,而且这两个领域的新发现依赖于更为基础的领域。也许这暗示着,越是基础的知识领域,前进速度越快,而基于基础领域的衍生领域发展的速度则相对较慢。
普赖斯和雷曼的研究表明,系统地看待知识的增长终于成为可能,随之而来的是一波发现的浪潮。
普赖斯通过研究科学文章和它们的属性来审视科学的发展,这已被证实为科学计量学领域最成功和最快速的途径。虽然科技的进步和一篇论文没有必然联系——一些论文可能有多个发现,其他论文可能只证实了我们已知的事物——但是科技的进步往往很值得研究学习。
从科学论文中,我们获得了很多用于测算和研究的数据。我们可以看看标题和文本,然后运用计算语言的复杂算法或文本采掘来确定它属于哪个学科领域。我们可以看看论文的作者,然后创建一个合著论文的作者关系网。我们可以查查每一位作者,看看在不同的机构之间,哪些合作最为有效。我们可以梳理论文的引证,从而理解论文所论述的研究内容。
从出版物的层次来研究科学,我们可以得到各种振奋人心的结果。哈佛医学院的一组研究人员6对其科研工作者发表的数以万计的文章进行了研究,并把他们在校园里的办公场所绘制成图。通过这种方式,他们发现了距离对合作的影响。结果正如他们所料:两个人的距离越近,合作研究所产生的影响就越大。他们发现,如果你与协作者同在一栋建筑内,那么你的工作会更加出色。
被其他出版物引用的次数也反映了一篇论文或一项研究成果的影响力。越是重要的成果,就越有可能被其他出版物引用,这意味着此项成果已经为其后的研究奠定了一定的基础。虽然这种说法有漏洞——就算意见相左,你还是可以引用其文——但是科学计量学的诸多领域仍致力于探索文献引用之间的关系、科学影响以及不同科学家的重要性。
通过这种方法,科学计量学甚至可以判断什么类型的团队做出的研究影响最大。例如,美国西北大学(Northwestern University)的一组研究人员7发现,影响力大的研究成果往往来自于协作团队,而非单独的科学家。换句话说,孕育爱因斯坦式的孤胆英雄的时代正在渐行渐远,你也可以算算看。
文献引用也可以作为其他度量标准的基石。统计一下一本期刊里文章被引用的平均次数,我们便得到了所谓的影响因子(impact factor)。影响因子被广泛使用,而且经受了深度考量:科学家希望自己的论文发表在影响因子较高的期刊上,因为这样可以名利双收。影响因子最高的期刊包括《自然》(Nature)和《科学》(Science)这样的一般科学性出版物,也包括《新英格兰医学杂志》(New England Journal of Medicine)这样高收益的医学期刊,它们甚至已经渗透到公众的意识当中——毫无疑问这是由于那一篇篇引用频率高的论文。
科学计量学甚至让科学家有了吹嘘的工具,比如h指数(h-index),它衡量的是一篇论文对其他研究人员的影响。它是由乔治·赫希(Jorge Hirsch)提出的8(注意到h,是他用自己的名字来命名的),主要用来计算一位科学家发表的多少文章被引用的多少次数。如果你的h指数为45,就意味着你有45篇文章,每一篇被引用了至少45次(虽然可能你发表过的文章多于45篇,被引用的次数少于45次)。额外收获是,从统计数据来看,你更可能成为一位美国国家科学院(National Academy of Sciences)院士。
这么说你也无须惊讶:在过去的半个世纪里,科学计量学领域发生了爆炸式增长。当时普赖斯和他的同事们是手动把引文列表,他的研究生团队做了很多枯燥乏味的重复性工作;现在我们有了计算机和庞大的数据库,就可以更加轻松地处理棘手的分析项目。例如:现在许多科学数据库(包括谷歌学术搜索功能)能够自动计算h指数,而这在几十年前几乎是无法想象的。由于具备了这种能力,现在我们的科学计量结果遍地开花。我们每年花费数十亿美元进行研究,依靠科学实现了诸如治疗癌症和太空旅行之类的事情,我们也开始用工具来分析到底什么样的研究才有用。
科学计量学能证明金钱与研究成果的关系。美国国家科学基金会(The National Science Foundation)研究了科学家们每发表一篇文章时,他们的大学付出的相应花费9。其他的研究着眼于年龄与科学的关系。例如,在过去的几十年里,获美国国立卫生研究院资助的科学家的年龄逐年上升,这一定程度上引发了对较年轻的科学家能力的担忧。
甚至有研究在探讨德高望重与科学产出之间的关系。例如,在20世纪60年代,哈里特·朱克曼(Harriet Zuckerman)——一位从事科研人员及群体互动研究的科学社会学家——决定研究一下诺贝尔奖得主的科研产量10,以探求他们有别于稍逊色的同行们的根源。她惊人地发现了诺贝尔奖得主的善行,朱克曼称之为位高则任重。总的来说,在科研论文发表时,贡献最大的作者的名字排在最前面。不过也有例外,而且各个领域都不尽相同,但是朱克曼认为这是一个有用的经验法则。她发现,职业生涯早期时,诺贝尔奖得主是众多出版物的第一作者。但是不久之后,他们开始把第一作者身份让给自己的年轻同事。而且这种情况早在他们获得诺贝尔奖之前就存在了。
正如一位慷慨的诺贝尔化学奖得主所说:“年轻人成为主要作者、第一作者是有好处的,而且即使我的名字排得靠后,这也无损于我的名誉。”而对于那些成就不如诺贝尔奖得主的同行来说,他们会更努力地为自己保住第一作者的身份,从而为自己赢得更多的荣誉。到40多岁时,诺贝尔奖得主只在26%的论文中任第一作者,与此相对,成就不及他们的同行则在56%的论文中任第一作者。更友善的人确实更有创意,更成功,甚至更容易赢得诺贝尔奖。
这一点在科研工作者身上似乎再明显不过,至少我们把所有人群作为研究对象时是这么个理儿。但是,与知识本身相关的规律是怎样的,它们又是如何产生的呢?要回答这个问题,我们得思考一下小行星。
亚瑟·C·克拉克(Arthur C. Clarke)是我年轻时最喜欢的作家。他对世界的认知富有远见,他虚构未来,构想丰富,而且往往预示着人类最积极的一面。他因《2001年:太空漫游》(2001: A Space Odyssey)一书名声大噪,此外他还写了几十本著作,发表过多篇散文和短篇小说。
他在1973年出版的另一本著作《与拉玛相会》(Rendezvous with Rama)中描绘到,一个巨大的圆柱形飞船闯入太阳系,人类派出航天员探险队侦察情况。这艘飞船被命名为“拉玛”,最初人们认为它是一颗小行星;但是,一套名为“太空卫士”的自动化望远镜检测出了它的真实面目。自2077年一颗流星撞击意大利北部起,“太空卫士”就投入使用,于是人类建立起了一个提前预警系统,开始防范与地球运行路径有可能交叉的任何物体对人类造成潜在的威胁。
此书出版数年之后,人们真的发起了一个类似的项目。发起者为了向克拉克致敬,就把这个项目命名为“太空卫士调查”。这个项目运用了多种探测方法,其中包括空间自动检测对象。不但科幻小说变成了现实,“太空卫士调查”还开启了一种全新的科研方法:自动化。运用自动图像处理技术来检测近地物体,这一部分工作就叫作太空监视。得益于此,1992年,人类发现第一颗彗星,并蹩脚地将其命名为C/ 1992 J1。
自动化科学应用广泛,从生物学到天文学到理论数学,皆是通过计算机来实现新的发现,识别新的事实。我们的项目也丰富多彩,有通过研究海水的基因序列发现新物种的,也有让化学家自动探寻合成特定化学产品的方法的。你甚至可以从一个叫作TheoryMine的网站获得一条新数学定理,它由复杂的计算机程序编写而成,这个程序会自动生成一个数学证明,并用你或你心爱的人的名字为定理命名。这是挂上了个性牌照的自动发现。
但是,新鲜上演的大事还远不止这样:现在有一项名为公民科学的运动。我们每个人每天都与当下的科学发现息息相关。这怎么可能?原理相当简单。虽然计算机擅长做很多事情,像加总数字、统计文档的字数等等,但是也有很多简单的事情它们做不好:我们仍然在为照片归类、阅读模糊文本方面领先于计算机。虽然挡了以全球统治为使命、依赖于文字指示的机器人的路,但是计算机的这种自身局限性倒是为计算机科学开创了一个全新的领域——人脑运算:容易搞定的任务之所以分配给多人执行,往往要么为了省钱,要么是有人巧妙地把任务藏在了游戏里。其中最有名的一个例子是,我们常常会读对错乱的文字11,从而向一个网站证明我们是人类。原本的大麻烦,现在被人们巧妙地数字化为《纽约时报》(The New York Times)的资料库。识别出错乱的已知单词,与计算机无法识别的单词配上对,就这样,日常用户正帮着把报纸和书籍转换成数字格式。
科学家们开始利用这种人脑运算。过于复杂、计算机(甚至是一个人)无法梳理的大量数据,研究人员就依靠公民科学工作者来处理。例如,在星系动物园普查(Galaxy Zoo)中,参与者要对科学家们分发的星系照片进行分类。参与者不是专家;他们只是被培训了一分钟的人,但是他们对太空感兴趣,或者是他们想要推动科技进步。
一些勇敢的科学家化繁为简——他们发现,如果要预测不同化学构造的蛋白质的折叠形状,那一个叫作“蛋白质折叠”(Foldit)的网络小游戏的玩家其实比最好的计算机还要能干。
我们在很多需要新知识的任务中仍然领先一步,这要归功于我们的模式检测能力和大脑工作的特异性。所以,事实上,正在改变的事实并不是脱离一般民众的。我们现在是科技进步的一部分。不仅仅是科学家、发明家甚至探险家,我们每个人都能够参与到知识创造的过程中来。
从知识的角度看,时下情势大好:有史以来我们第一次拥有了巨大的计算能力,科学发现的许多相关信息得以数字化——网上可供分析的科学数据多得惊人。此外,通过计算得出,发现也走上了自动化之路,而公民科学赋予它广泛的社会基础。
这些合力改变了科学新知识的产生方式,还赋予我们科学发现的大量数据。这就引出了我与一位合作者,尼古拉斯·克里斯塔基斯(Nicholas Christakis),探究已久的尤里卡计量学(Eurekometrics)12。尤里卡计量学研究的是科学发现本身。那些更传统的、使用引文的科学计量学方法仍然是非常重要的。它可以告诉我们科学家如何合作,可以测算科学研究的影响,可以做出科学知识的增长趋势图,但是它们通常不会明说内容本身抑或其属性。比如说,我们关注的并不是植物生物学杂志里文章的属性,相反,我们是想知道已发现的植物物种的属性。
举一个尤里卡计量学的简单例子——也是我参与过的一项研究——人类有所发现为何越来越难。
如果回顾历史,你会有一种感觉,科学发现曾经易如反掌。伽利略把物体沿斜坡滚下;罗伯特·胡克(Robert Hooke)玩弹簧玩出了弹性;牛顿斜眼瞟见一个织补针,于是理解了色彩感知。想问出正确的问题,没有创造力和知识可不行(也许得无拘无束),但实验本身可能并不深奥。如果你想在今天的物理学领域有所斩获,那么加入一个万人团队吧,倒腾价值数十亿美元的粒子加速器可能会有一点帮助。发现新事物需要越来越多的钱、越来越多的精力、越来越多的人。
最近才有人着手测量科学发现的难度。肯定是越来越难了,但是到底难了多少?它改变的速度有多快?
我从尤里卡计量学的角度探索这个问题,研究了三个具体的科学领域:哺乳动物、小行星和化学元素。研究这些领域主要有两个好处:它们分属不同的科学领域,而且在过去的几百年里有准确的发现数据可供追溯。首个哺乳动物发现于18世纪60年代,正是卡尔·林奈(Carl Linnaeus)开创了分类之后。首个小行星名为谷神星,发现于1801年(其实它体积很大,几乎配称为一颗行星)。而首个现代化学元素磷,发现于1669年(我刻意不提自古闻名的元素,如铅和金)。
如何分析科学发现越来越难呢,考量之后,我决定从大小入手。我假定大小可以代表发现的容易程度:生物或者小行星越小,就越难发现;化学领域则相反,最大的元素是最难形成、最难检测到的,所以我用了大小的反比。在此基础上,我绘制了随着时间的推移发现的平均难易度。
我发现,把难度做个简单代替,就可以了解发现发生的模式:各个数据集都遵循一条曲线,且曲线的形状大致相同。不管什么情况下,发现的容易程度都会下降,不管什么情况下,它都呈指数衰减趋势。
意思是说,发现的容易程度不是每年等量下降的——而是每年等比例下降的。例如,新发现的小行星的体积每年以2.5%的速率变小。在最初的几年中,发现的容易程度迅速下降;早期的研究人员把易摘的果实采完之后,它会在很长一段时间内继续“衰减”,发现变得难了,但绝非不可能的事情。
连医药领域也有一个相似的观点。乔治梅森大学(George Mason University)的经济学家泰勒·考恩(Tyler Cowen)认为,如果你把20世纪中叶每10年间现代医学领域重大进步或者决定性时刻的数量做个统计——按詹姆斯·勒法努(James Le Fanu)的记载顺序——你会得到一条下降曲线:“20世纪40年代有6个这样的时刻13,20世纪50年代有7个这样的时刻,20世纪60年代有6个这样的时刻,1970年和1971年各有1个这样的时刻,而从1973年到1998年的25年间仅有7个这样的时刻。”
但是这挺奇妙的:在我研究过的每个领域,虽然新发现渐少,但是发现的总量日益增加。我们不断发现更多的小行星、新型的哺乳动物、越来越多奇异的化学元素。每个领域的发现速率并不相同——比如说,我们发现小行星的速率比发现新型哺乳动物的速率要快得多——但是不论在哪个领域,我们的发现并未走入穷途末路的境地。其实据我所知,科学发现已经枯竭的只有一个领域,那就是重要内部器官“领域”。
人体解剖始于史前心肺的发现,这些器官你很难忽视,尤其是当你的同事用庞然大物开膛取胆的时候。随后便发现了更为微小的器官,如脑垂体。1880年,一位名为伊瓦尔·桑德斯特伦(Ivar Sandstr?m)的瑞典医科学生14发现了甲状旁腺,这也是最晚被发现的一个主要的人体器官。就是这样。这个领域发现的时代帷幕就此落下。
但总体来看,科学发展还是很迅速的。我们倾注了更多的精力,更多的人力资源,以及更多的聪明才智,以期向发现和知识更进一步。举一个简单的例子:科学计量学领域要研究的第一个变量——迄今为止科学家的总人数。1861年,耶鲁大学授予了美国第一个博士学位。自那以后,在美国和世界各地的科学家数量在迅速增长。例如,1920年,美国实验生物学社团联合会(Federation of American Societies for Experimental Biology)的科学家数量还不足500人,到了20世纪90年代末,这一数字远远超过了5万。短短的80年间竟然猛增了100倍,这预示着在科学家的绝对数量方面科学力量的增强。
其实,不管在过去300年里的任何时候,如果你说15“有史以来80%的科学家都还健在”,你的说法都是成立的。这使得更多的科研能通过大的科学团队来完成。不仅如此,影响力大的研究正在通过越来越多的科学家团队完成。当然,这样的增长是不可持续的,科学家数量的长期指数增长意味着在某个时点上,科学家的数量要超过地球上人类的数量了。虽然这在超人的家园氪星上并不稀奇,那里人人都是科学家,但是在地球上,我看这种情况不大可能发生。但是这种快速的增长表明,科学发现绝不是快要结束了。
例如,在药物研究方面,投入一美元能够产出的药物数量在下降,制药公司便把更多的资金投入药物的研发。同样是呈指数增长,在相对更为不易的科学领域,有效益的科技常常会遵循一条类似的曲线:计算机的数据处理能力呈指数增长趋势,意味着那些对我们来说一度很棘手的问题,如分形的可视化、某些数学定理的证明、整个群体模拟,现在可以轻松完成了。一些科学家运用智慧和创新,用低投入取得了新发现。当斯坦利·米尔格兰姆(Stanley Milgram)进行著名的“六度人脉”(Six Degrees of Separation)实验,也就是那个证明地球上人与人的联系比我们想象中更密切的实验,在实验中,他使用的仅仅是明信片和邮票。
当一个领域的研究变难时,此领域的科学家们不是投入更大的努力,就是转移探究注意力来应对挑战。物理学家已经转战生物学,提出前人从未思考过的新问题。数学家和计算科学家已经把他们的公式和算法应用于社会科学,并且取得了一些关于社会的运作方式基础的新发现。再者,科学家从其他领域引进技术,构建新的方法,把问题化难为易。
无论科学发现是如何发生的,它的车轮滚滚向前。我们所处的时代非同寻常,因为科学家的数量正迅速增长,而且我们还站在巨人的肩膀上。合作项目有很多,从曼哈顿项目到粒子加速器,从过去到将来,它们一刻不停地为我们揭示着宇宙的奥秘。然而,尽管在这个大科学时代,知识的积累快得惊人,但是这种科学的增长并非不可预见。科学事实本身,以及是什么在推动发现和创新前行,都可以用科学计量学来解释。
然而,科学计量学除了可以解释科学知识的增长,它还可以解释事实是如何被推翻的。
第3章 真相的渐近线
生活在约6500万年到1亿年前的白垩纪晚期的生物,一定不会对下列生物感到陌生:可怕的霸王龙、鸭嘴龙、众多的鸟类,甚至多种小型哺乳动物。如果进行海洋探险,也会看到各种各样的海洋生物。其中一种动物叫作腔棘鱼(Coelacanths)——它们通体发灰,长着厚嘴唇,是那个时期最可怕的生物之一。白垩纪末期,一颗巨大的流星击中地球,撞上了今天的墨西哥尤卡坦半岛,无数沉积的火山灰喷发,直冲云霄,地球陷入了灾难性的气候变化,生物大规模灭绝。除了我们至爱的恐龙,海洋生物里的凶悍版灰姑娘——腔棘鱼也消失了。
但是到了1938年,也就是“二战”前夕,这一点发生了改变。尽管白垩纪与古近纪交界时那场大规模生物灭绝的原因尚未可知,但是众多那个时期灭绝的物种已经被记载下来。从霸王龙到腔棘鱼,人们对以往遗漏的物种进行了细致的研究。那时候,南非一位年轻的女士玛罗丽·考特内–拉蒂莫(Marjorie Courtenay-Latimer)1,她居住在距离开普敦不远的东伦敦镇,在当地一个小型博物馆任馆长。她和那个地区的一位渔翁是好朋友,他常把捕到的鱼给她看,让她把任何可能的收获放进博物馆里。
1938年年底的一个冬日,考特内–拉蒂莫路过码头,去看渔夫网里捕到的鱼时,一只长相奇怪的鱼鳍冒了出来。她把它从鱼堆里挖出来,描述道:“我从未见过如此美丽的鱼,5英尺长,浅青色、带荧光银条纹”。毫无疑问,她作为一名科学家,这么说是带着发现了新物种的喜悦。换了别人,看到的准是一只非常丑陋、油腻腻、臭烘烘的鱼。
考特内–拉蒂莫带着这条又大又臭的鱼钻进出租车返回博物馆时,司机肯定是这么想的。但是她认为这条鱼很重要,而且她的这一预感得到了验证。她把博物馆的藏书查阅了个遍,终于确定她手上这条就是匿迹已久的腔棘鱼。令考特内–拉蒂莫疑惑不解的是,这条鱼竟然顶住了数千万年生物进化的压力,在印度洋存活了下来,而且样子一点儿也没变。附近某大学的一位教授证实了这一点。他一看到她发现的鱼的草图,就发出了电报,内容为“保护骨骼和鳃最关键=所描述的鱼”。
重赏之下,又过了15年,第二条腔棘鱼标本才姗姗来迟。这一次是在马达加斯加和非洲大陆之间的科摩罗群岛发现的。奇迹就这么发生了:被认定为早已灭绝的物种被发现活得好好的。
人们把唯有获得确凿的证据才能证明其并未灭绝的生物称为拉撒路物种(Lazarus taxa),腔棘鱼就是一个很好的例子2。当然,想要预测一个灭绝物种是否尚存活在这个星球的某个角落,这几乎是不可能的。但是,如果去观察大批的物种,那么有时我们可以判断最终有多少物种可能不曾灭绝,以及有多大的可能性一个事实其实是不正确的、需要人们去推翻。
2010年,澳大利亚昆士兰大学(University of Queensland)的两位生物学家3把在过去500年里很可能已灭绝的所有哺乳动物列成表,一共有187种。然后,他们检查有多少物种最终又被重新归类为未灭绝。答案是:有超过1/3的据称消失在了时间的无底洞里的哺乳动物重现身影。
这种大型分析不只是为了了解拉撒路物种的特性。推而广之,它能让我们了解整个科学的知识结构,以及我们如何推翻长久以来持有的科学信念。观察科学的内在变化,我们就可以发现科学知识调整的模式。它可以引领我们去测算事实的半衰期。
随着科学知识迅速增长,它会导致一些古老真理被倾覆,即知识的新旧交替。虽然我们很难否认这种新旧交替——这又让我回想起,虽然在报纸上看了那么多次,我还是记不住红酒对健康的好处——但是它确实很难衡量。不过,如果我们能够量化这种新旧交替,就可以摸出不确定性的门道,甚至可以度量我们每过多久应该重新审视课题一次。
几年前,巴黎一家医院的一个科学家团队4决定就此进行实际测算。他们要重新审视他们从事的专业领域:肝硬化和肝炎。他们选取了行业里50多年中的500多篇文章,让一批专家来做评审。
每位专家负责说出,依据最近的发现,一篇论文得出的结论是正确的、过时的、还是错误的。如此一来,他们创建了一个易于理解的图表,显示出经受过去几十年考验之后仍为事实的内容的数量。他们取得了一些惊人的发现:论文的数量锐减,这一条仍成立5。
此外,通过研究曲线跃过图表中50%那个点的位置,他们还算出了这个领域准确的事实半衰期:45年。从本质上来讲,信息就像放射性物质:大约每过45年,医学界肝硬化或肝炎方面的临床知识就会有一半过时或者被推翻。这大约是放射性同位素钐-151半衰期的两倍时长。
自出版之日起的时间(年)
图2 肝炎和肝硬化等领域知识的真相衰减。纵轴50%的点约对应横轴45年,意思是推翻这些领域一半的知识大约需要45年。
数据来源: Poynard,“临床研究知识生还:基于事实的安魂曲?”《内科医学年鉴》(Annals of Internal Medicine),136,no. 12(2002):888–95。
正如前文所述,每个单独的放射性原子的衰变存在很大的不确定性,而聚在一起之后放射性原子的衰变就不再是随机的了。它们的衰变会受系统影响,而且只要一个数字就能迅速地说明问题(半衰期)它代表的是按放射性衰变定义来说,一半的物质发生衰变需要多长时间。
一个领域的知识也可以呈指数衰减趋势,即按一个固定比例减少。按照芝诺悖论(Zeno’s Paradoxes)的其中一个悖论来说,我们不断逼近终点线的中点,但是永远都到不了。此例中,终点线代表最初那批肝硬化和肝炎的研究中没有一个仍是正确的。虽然总是存在极小数量的引用距今几十年甚至上百年的论文的情况,但是若干年后,大量的文章终将沦为无关紧要的境地。当然,其中有一些文章并没错,它们只是过时了而已。这些科学家指出,治疗方法在过去几十年并没有完全失效;它们只是被新的东西所取代,比如注射新型疫苗就无须再进行相应疾病的治疗。
就像我们无法分辨哪一个放射性原子会发生衰变,我们也无法预测哪一篇文章的结论会被推翻。但是无论如何,我们可以观察事物的总体,并看出一个领域随时间变化的规律。此外,有一项关于手术信息的倾覆的研究,其结果并无二致。澳大利亚的两位医生发现,在那个领域,每过45年也有一半的事实失实。正如之前法国科学家所说的那样,所有这些结果都验证了一句有名的医学格言,格言出自19世纪至20世纪早期的英国神经学家约翰·休林·杰克逊(John Hughlings Jackson)之口:“揪出一个错误的医学观点需要50年,而得出一个正确的医学观点需要100年。”
这意味着,尽管科学知识在不断增长、新文章在发表、现有理论被驳斥、新领域分支变成多个子领域,以及学术界拨款申请和资金捐助的流程存在混乱不堪的现象,我们仍有方法来衡量事实的推翻和知识的不断更新。我不是草率地把医学半衰期推广至所有科学领域。其他领域也进行了针对半衰期的研究。
不幸的是,召来一个专家小组,让他们梳理过去的科学结论并赞同或否定一篇论文的有效性,这个办法不太可行。因此,为了能比较快地观察许许多多的科学,我们不得不以牺牲精确为代价。有一个便捷的方法,那就是观察引文的寿命。正如前面所说,引用是科学领域的共同特点,也是我们测算一篇论文影响力的标准。
大多数论文从未被引用过。亦有不少论文只被引用过一次即被遗忘。其他的论文只被作者在自己的论文中引用。但是,还是有大量的论文被其他人引用的——毫无疑问,这一点说明了科学努力没有白费。还有更为罕见的论文,就算与同一领域内地位高一级的基础出版物相比,它们被引用的次数都多出许多6。
要了解一篇论文的“真相”的衰减,我们可以测算一个领域里一篇普通的论文多久后不再被引用。无论是因为论文不再有趣、不再相关,还是与新的研究成果相矛盾,这篇论文已经不再是活生生的科学文献的一部分了。它过时了。从某种意义上说,其他论文不再引用半数的科学文献所花费的时间也是一种半衰期。
现在我们意识到知识是如何淘汰的,然而半衰期还有一个非常实际的应用。在20世纪70年代,信息领域的学者们关注知识的半衰期出于一个特殊的原因:防止图书馆书满为患。
我们处在现代数字化信息时代,所以这在我们听来甚是奇怪。但是在20世纪70年代,各地的图书管理员都面临着非常真实的知识指数增长:他们的图书馆藏书堆不下了。他们需要遴选出哪些藏书可以安全下架。如果能知道一本书的半衰期,或者一篇文章的言论多久后会过时,那真能给避免图书馆藏书量超负荷帮上大忙。知道了藏书的半衰期,图书管理员就知道图书上架后多久不再有用、应该如何处理。
所以,针对这个领域的研究一时潮涌。为了解答诸如一本数十载无人借阅的书是否还重要、是否应该放在书架上等问题,信息领域的科学家们研究引用的数据,甚至研究图书馆里的使用数据。
通过这一点,我们就可以看出,不同领域的半衰期是不同的。例如,《物理评论杂志》(Physical Review)是物理学界很重要的期刊,一项针对该期刊上所有论文的研究7发现,物理学的半衰期约为10年。其他研究人员甚至按子领域算出8,原子核物理学的半衰期约为5.1年,固体物理学的半衰期约为6年,等离子体物理学的半衰期约为5.4年等。在医学方面9:泌尿科期刊的半衰期为7.1年,而整形外科期刊的寿命比较长,其半衰期约为9.3年(请注意,这个数字远小于前面计算的45年的半衰期,因为我们现在讨论的是引文,而非被推翻或认为过时)。普赖斯自己研究了不同领域的期刊10,他发现,计算机科学文献的更新速率远远快于精神病学,而两者的更新速率都远远快于人文领域,如美国南北战争史。
出版物的半衰期因类型而异。2008年时,唐蓉(Rong Tang)研究了不同领域的学术著作11,并发现了以下领域的半衰期。
领域半衰期(年)物理13.07经济9.38数学9.17心理学7.15历史7.13宗教8.76看起来,在她研究的领域里,物理学的半衰期最长,至少物理学书籍的半衰期是这么回事。这与针对文章半衰期的研究发现恰恰相反,自然科学领域文章的寿命比社会科学领域文章的寿命短得多。这很可能是由于在自然科学领域,只有那些经过审查的研究才能出版成书。
不过,总的来说有一点是明确的,那就是有一些领域好比注入人体内的正电子放射性同位素,其衰变非常迅速,通过正电子发射型计算机断层扫描技术(PET)可以看出。其他领域则慢得多,它们好比碳的放射性同位素,如用于科学测定古文物年代的碳–14。但是总体而言,这些测算为我们认识科学事实的改变奠定了基础。
事实为什么被推翻的故事——是科学家太草率还是别的原因呢?——请见第8章,它与我们从事科学研究以及衡量事物的方式有关。但是面对大部分科学知识都在衰变这个事实,我们不该痛心吗?
有言道,今日如蜜糖,明日如砒霜。但是我们并不能完全认定我们的科学框架——重力、遗传学、电磁学——的基本原理很可能是错的,也可能是知识半衰期的一部分。
但这不是科学的运作方式。虽然有一部分当前被接受的科学理论会被推翻,但是推翻重建总归是利大于弊:它让我们更接近科学真相。
在1974 年,三位在普渡大学(Purdue University)热物理研究性能中心工作的科学家12发布了《物理与化学参考数据》(Journal of Physical and Chemical Reference Data)杂志的补编。这可不是个小工程——它是一本多达800页的著作,就围绕一个主题:周期表中元素的热导率。
热导率是指每种元素传导热能的难易程度。例如,与气体(或塑料)相比,金属是更好的热导体;这就是为什么煎锅的手把儿往往是塑料的而不是金属的。材料具有不同的固有热导率,但是有一些因素会影响热导率。其中最重要的因素是温度。一般来说,一个东西本身越热,导热性就越好。
这一补编详尽无遗地对每一种化学元素进行了研究,并检验了热导率的概念。但是测算这些曲线——试图确定温度与每种元素热导率之间的关系——绝非易事。因此,他们结合了很多前人的测算研究成果,希望基于这些研究成果来确定这些曲线究竟是什么样子。
进行了大量的测算之后,再加上观察研究成果落在曲线上的具体位置,我们开始明白对各种元素来说热导率曲线的真实特点。从图中可见:噪点和不确定性很多。但是当测算次数足够多时,相关特性就在图中非常清晰地呈现出来(此例中即热导率和温度)。如果移除了某部分结果,或者是只看补编中针对数以百计的论文之一的研究成果,我们得到的将是不同的、不完整的、不准确的关于热导率和温度之间的关系图。
开氏温度
图3 多个实验得出的铜随着温度变化的热传导率
数据来源: 元素热传导率[J].《物理与化学参考数据》(Journal of Physical and Chemical Reference Data),1,no. 2(1972年4月):279–421,美国物理研究所。
科学就是这样前进的。
这并不是说,当新理论产生或旧事实被反驳时,以前的知识就作废了,我们就得从零开始。相反,知识的积累可以让我们对周围的世界有一个更全面、更准确的认识。
艾萨克·阿西莫夫(Isaac Asimov)在一篇很棒的论文13中用地球的曲率阐述了这一点:
人们以为地球是平的,他们想错了。人们以为地球是球体,他们也想错了。但是如果你认为这两个观点一样错,那么你就是错上加错。
显然,人们认为地球的形状不再是平面,而是球体时,他们的看法发生了巨大的改变。毫不隐晦地说,是人们思想的形状发生改变了。但是正如阿西莫夫解释的那样,在实际运用中,地球是平面的这种说法错得没有那么离谱。认为地球是平的这个观点包含一层意思:地球没有一点儿弧度,或者说每英里的曲率为零英寸。海上的船总是出现于平坦的地平线,所以不难看出,实际上每英里的曲率是不为零的。但是阿西莫夫计算得出,地球的曲率接近于零。地球这么大体积的一个球体,却只有8英寸的曲率。它确实增大了地球的体积,但是如果你把英寸换算成英里,想象一下,你会发现8英寸真是太微乎其微了。
认为地球是圆的球体也是不正确的。其实,我们生活在一个庞然大物上,它是一个扁球体,曲率在每英里7.973~8.027英寸波动。每一个连续的世界观、事实和理论都加深了我们对世界本真和环境状态的认识。就地球的曲率而言,每一个新的理论都让我们更接近关于脚下地球曲率的真相。与此类似,再举一个更复杂的例子,爱因斯坦的相对论是如何纳入牛顿的研究成果,并使得它们更普遍的。牛顿力学仍然可以为我们的日常生活所用(其实我们也乐此不疲),但是爱因斯坦重塑了我们对边缘世界的理解,例如当我们以接近光速的速度移动时会发生什么。
有时候我们的认识大错特错,或者其准确性并不如人所愿。但是大致而言,集聚的科学知识还是加深了我们对这个世界的理解。
为了让这一点更清楚,加州理工学院的一位理论物理学家肖恩·卡罗尔(Sean Carroll)在他的博客上连载了一系列文章14,开篇之作题为《日常物理学蕴含的规律都懂了》(The Laws Underlying the Physics of Everyday Life Really Are Completely Understood)。这并不是说,包括“风云变幻、意识、引力N体问题和光合作用”等复杂概念在内的日常生活的方方面面都为人所知了,卡罗尔其实是认为,人们已经充分认识了事物的基本规律,如亚原子粒子在日常气温下的运动规律:
在100年前,很容易提出的一个基本问题,物理学也给不出令人满意的解答。“是什么让桌子垮塌?”“为什么存在不同的元素?”“从大脑到肌肉传播的是什么样的信号?”但是现在众人察察。(我指的还是了解万事万物的基本原理,而不是细枝末节。)过了50年,我们或多或少弄明白了一些,这取决于你想给核力量找多少麻烦。但是,毫无疑问,在20世纪的时候,人类对显而易见的世界背后的基本规律的探索就已经大功告成了。
卡罗尔甚至列出了一个电子在常温下运动的方程15。当然,这个例子很笼统,也很乐观(我们的世界不是一个方程就能描述清楚的),但这就是我们揭秘周遭一切事物的方式:我们的发现模式决定了接近真相要层层深入。回过头来说物种,人们已经把想法付诸行动。
2010年,国际海洋生物普查计划(Census of Marine Life)完成了第一个10年工作。这个项目涉及来自80多个国家的2 000多名科学家,他们负责记载和分类海洋中的所有生物。这个项目牵涉十几个规模稍小的项目,与其合作的组织和公司包括美国航空航天局(NASA)、谷歌等。
他们都知道,这项工作还远未完成,但是这个团队发表了几千篇科学论文,还发现了1 000多个新物种。《每日科学》(Science Daily)对这个令人难以置信的项目评论16如下:
仅在东南大西洋安哥拉盆地的两处停靠点,他们就从区区5.4平方米(6.5平方码)范围内发现了近700种桡足类物种(其中99%都很陌生),这个数字几乎是整个南半球物种数量的两倍。
凯文·凯利(Kevin Kelly)把这种分布称为17“生物长尾”[5]。在媒体界,一小部分电影在票房收入上取得巨大成功——它们是大片。同样的事情在互联网也不鲜见:极少的几个网站吸引了全世界大部分的注意力。在城市发展方面,少数几个城市的人口占了世界人口中的相当大的比例。但是,这些超级巨星不是故事的全部。它们确实举足轻重,但是不容小觑的还有那些更“冷门”的电影或城市,它们是经常为人遗忘但很重要的长尾。了解长尾的分布有助于我们体味世界对流行文化或城市生活的容纳。
物种和许多其他的发现也是如此。正如前文所说,新兴领域的发现来得容易,往往正是这些发现解释了很多正在发生的事情,以物种为例,它们是非常大的发现。很多我们已知的事情其实非常普遍,或比较容易了解;它们构成了发现的主体。但是也有更多数不胜数的发现处在这个发现分布的尾部,尽管相比较而言它们罕见得多。无论是探寻海洋生活的多样性,还是探索地球的形状,深入研究将为我们揭开世界的真实面目。
所以,我们面临的难题其实是发现的长尾。我们欲求摆脱长尾困境,求索的结果可能并不如重磅炸弹类的发现那般重要或惊天动地,但是一样可以令人兴奋和惊喜。在认识世界可能性的过程中,每一个新的小发现都能教给我们一些东西,渐渐地,我们对所处的环境有了更完整的了解。无论是海洋生物普查项目的参与者发现的无氧状态下生存的多细胞生物,还是死于6 000万年前的虾,每一个新的发现都丰富了我们对宇宙复杂性和多样性的了解。
科学的积累和科学对世间万物的阐释具有特定的规律,立足于这个规律,我们可以创造一项关于人类世界的理论。这门研究科学的科学错综复杂,经过不断改进,它可以解释事实的创建和推翻,同样,它也可以帮助我们理解别样事实的改变。而很多此类事实都与技术的世界相关。
[5]在一些超级丰富但种群稀少的物种中,存在着生物的长尾现象。在长尾的末端,可能有超过10亿个物种,但这些物种的种群非常小。像其他类型的长尾一样,这些小种群物种的总和超过了那些最普遍的物种总和。——译者注
第4章 万事万物的摩尔定律
20世纪90年代初,我第一次接触到互联网。我启动了300波特的调制解调器,它开始像R2-D2宇航技工机器人那样嗡嗡作响,于是我开始远程登录。然后,我们的大苹果机麦金托什(Macintosh)屏幕上布满文字,并提示我们,通过这个在现在看来早已过时的协议,我们与当地大学的计算机建立好了连接。点击了一系列的文本菜单后,我开始进行我的第一次下载:从古登堡项目(Project Gutenberg)下载柏拉图所著《理想国》(The Republic)的文本文件。我下载完之后(虽然花了将近一个小时)欣喜若狂。我仍记忆犹新,那时我蹦来蹦去,庆祝我只用了一根电话线在枯燥的哔哔声中就把整本书下载到我们的电脑里了。
此后过了快10年,我才阅读了《理想国》。我读的时候,曾经叹为观止的文本文档已变得稀松平常,没人会再大惊小怪。2012年,人们每晚都用自己的电脑下载电影,再也不提调制解调器这个“神器”。我们已经从背景扎眼、文字闪烁的早期网页时代一跃进入了美观的互动网站时代,它们用的是层叠样式表、JavaScript和众多使得基于多媒体的体验更流畅的功能。再也没有人会想起调制解调器,抑或关注具体的带宽速度。当然,也没有人再使用波特这个词。
要说20世纪90年代变化的程度和速度,我们可以看看《今日秀》节目(Today Show)。1994年1月,有一次有人让布赖恩特·冈贝尔(Bryant Gumbel)大声读出一个电子邮箱地址。
他不知如何是好,尤其是在读“a和环在它外面的圈”的时候。@这个符号现在是我们的第二天性,但是冈贝尔茫然不知。接着,冈贝尔和凯蒂·库里克(Katie Couric)开始讨论什么是互联网。他们甚至问场下的观众:“‘互联网’到底是什么呢?”
自1885年第一台安德伍德(Underwood)打字机诞生以来,@这个符号就一直出现在键盘上1。然而在1971年人们开始用它分隔电子邮箱地址以后,它才引起了人们的重视。即便是这样,几十年后人们对@的使用才频繁起来。冈贝尔的疑惑以及我们此刻的取笑就是互联网迅速发展的佐证。
当然,这些变化并不仅限于互联网。当我想到386处理器,我总会想起在朋友的台式电脑上玩“模拟城市2000”游戏(SimCity 2000)的情景,时至今日,计算机不论是在软件还是在硬件方面都取得了长足进步。在数字存储介质中,我用过5.25英寸软盘、3.5英寸软盘、压缩光盘、可复写CD、闪存驱动器、带刻录的DVD光盘,甚至用过Commodore牌的磁带机,到了2012年,只要我能接入互联网,我就能随时存储我的文档,这就是:云存储。竟然不到30年的时间跨度。
我们的技术知识迅速发展,这显而易见,我们不会对此感到惊讶。但在快速适应身边的变化(详见第9章)之余,我们应该惊讶于这些技术知识的发展竟是有规律的,既不是随机的,也不是无章可循的。总是存在一种模式,不断影响着我们周边的各种事实,甚至影响着那些与技术无关的事实。第一个例子是什么?摩尔定律。
我们或多或少都听说过摩尔定律。它说的是计算机处理能力的快速成倍增加趋势。但它究竟是什么,又是怎么来的呢?由此名声大噪的戈登·摩尔(Gordon Moore),是一位退休的化学家和物理学家,他也是英特尔公司的创始人之一。在1968年的时候,他与罗伯特·诺伊斯(Robert Noyce)创立了英特尔公司,并且共同发明了每一台现代计算机的核心——集成电路。但是他提出摩尔定律的时候并不出名,也算不上特别富有。其实那时他都还没有创立英特尔公司。1965年时,摩尔在一本名为《电子学》(Electronics)的杂志上发表了一篇小论文2,题为《让集成电路板填满更多的元件》(Cramming More Components Onto Integrated Circuits)。
文中,摩尔预测了1970至1975年一个电路板所能集成的电路数目的最大值。他认为,一个电路板所能集成的电路数目会以某个速度持续增加。从本质上讲,摩尔定律就是说一个芯片或电路的处理能力将每年翻番。他得出这样的结论,并没有通过详尽的数据收集和分析;其实他只用了四个数据点。
令人难以置信的是,他竟然说对了。自1965年以来,尽管较之他推算那时被考虑进来的数据已越来越多,但是这个定律基本上算是正确的。虽然因为有了更多的数据,我们现在知道倍增周期约为18个月而非一年,但这个原理仍然成立。它安然度过了个人计算机革命、从286到486到奔腾的升级以及此后许多的进步。我们经历了与科学上类似的、呈指数增长的技术进步:处理能力每年以恒定的速率增长,而不是定量增长。而根据最初的公式,年均增长率约为200%。
摩尔定律不只为我们做越来越多的计算提供了便利。它还衍生了许多其他的副产品。处理能力的迅速翻倍使得更多事情成为可能。例如,数码相机像素数3的增加要归功于摩尔定律。
还有更有趣的。如果你把芯片的摩尔定律推广到信息技术和一般处理能力,摩尔定律便成为解释基本技术变革的最新的技术准则。
这是什么意思?我们先说说处理能力。请不要只关心一个集成电路所集成的电路有多少,让我们打开思路。这些集成电路是做什么用的?有了它们才能进行计算。因此,如果我们要衡量电脑每秒的计算能力,或者衡量给定成本下每秒的计算能力(买个人电脑时这一点可能会派上用场),我们可以忽略技术背后的东西,转而看看它们是做什么用的。
克里斯·玛吉(Chris Magee)就是这么做的。玛吉是麻省理工学院的一位教授,他所在的工程系统部是一个专门挑战任何形式的单纯描述的跨学科部门。他的同事来自众多领域——物理学、计算机科学、工程学,甚至还有航空航天科学领域。这些人的共同点是他们都从工程学、科学管理以及定量社会科学的角度思考复杂的系统——从交通到卫生保健。
玛吉与博士后研究员高熙峰(Heebyung Koh)4决定研究一下人类在计算能力方面取得了多少进步,他们称之为“信息化改造”(information transformation)。他们把有史以来的各种信息变换编制成庞大的数据集,从19世纪算起,几乎无一遗漏:最开始是1892年的手工计算,一分钟打一下卡。之后是:1919年IBM公司的霍尔瑞斯制表器,比之前大约只快了四倍;1946年的ENIAC,公认为世界上第一台计算机,它采用真空管,每秒可完成约4 000次计算;1977年的Apple II,每秒可执行两万次计算;当然,处理能力超强的先进机器越来越多。
把各种技术一一罗列,我们就清楚了:尽管这些技术各不相同,有人类的大脑,有打孔卡,有真空管,还有集成电路——人类计算方面的总体能力还是取得了平稳而长足的进步。纵观之,随着时间的推移,我们的信息化改造能力大致呈指数增长。
但这是如何发生的呢?是不是说,新技术或者创新总是遥遥领先于目前所使用的技术呢?如果新的技术没有那么好,那还该不该采用呢?这些技术合在一起为什么会产生如此平滑和规律性的曲线呢?真实情况混乱多了,但也有意思多了。
其实一个人的创新在多数情况下都是未经验证的,可能会比目前正在使用的好,但它显然还是一项未尽的工作。这就是说,新技术最初也就好一点点。开发人员对其进行改进完善(这是工程和实际应用与基础科学所不同之处),然后他们开始认识到这项创新的潜力。由此,创新的作用开始呈指数增长。
但是随后它会达到极限。而达到极限后,会出现一个引进新技术的机会,即使这时新技术仍处于实验阶段,既未经检验又很奇怪。在数学界,两个连续的创新之间的改进增长期以及瓶颈期被称为一系列稳步上升的逻辑曲线(logistic curves)。
它是指数曲线的一种变体。想象一下有盖培养皿中的细菌。最初,它们贪婪地吸取培养皿里的营养物质,按指数曲线成倍地快速增长。细菌一分为二,二分为四,以此类推,100万个细菌变成200万个细菌。但是很快,这些细菌数量达到了极限。尽管对一个细菌来说培养皿非常大,但对这堆细菌来说培养皿的大小远不是无限的,所以供它们生长的空间不够了5,它们简直是自己限制了自己的生长。
不久之后,增长速度就减缓下来,最终培养皿里细菌的数量稳定了,并将持续很长一段时间。这一数量被称为承载能力(carrying capacity)。有一个数学函数专门解释事物开始迅速地呈指数增长,仅在达到一定的承载能力时才放缓下来,这就是逻辑曲线。
当然,逻辑曲线所描述的远不止细菌。它包罗万象,不仅适用于森林中鹿的栖息,还适用于世界网民数量随时间的变化。它也可以解释人们如何采用新事物。
当新科技产品尚且无人拥有,它的发展潜力是巨大的。比如说,要是人们开始购买最新的苹果移动设备,那么苹果移动设备的用户增速将会越来越快,这服从指数曲线规律。当然,这种增长不可能永远持续下去。最终,总人口中此产品的用户数达到饱和。按照逻辑曲线,一旦达到了承载能力,增长就放缓了。
这些曲线也因酷似S形而常被人们称为“S曲线”。我们讨论创新采纳时常使用这一术语。哈佛商学院的克莱顿·克里斯坦森(Clayton Christensen)教授6认为,观察连续的技术中的单个技术(如转换信息)时,可以依次组合出一系列紧密耦合并连续的S曲线——每一条曲线代表着一种技术的发展和寿命。而与玛吉和高的发现相一致,组合在一起的S曲线正是一条平滑稳定的指数曲线。这就是所谓的“S曲线链理论”,它让用于解释多年来我们看到的变化形状的多个技术的组合方式一目了然。
但是玛吉和高并不单单是推广摩尔定律并检验信息化改造。他们对技术功能的逐年变化进行了大量研究,然后发现不管是信息存储、信息传输还是处理能源问题,它们背后都有数学规律可循7。
图4 S曲线链(或逻辑曲线链)。S曲线组合在一起,就是一条随时间变化的平滑曲线。
甚至还有人发现机器人技术能力8也在持续倍增。麻省理工学院的罗德尼·布鲁克斯(Rodney Brooks)教授亲历过许多当前机器人技术的进步,他自己也是这个领域的先驱。他甚至与他人共同创办了公司,并研发出名为鲁姆巴(Roomba)的智能机器人。在对机器人技术逐年进步的研究中,布鲁克斯发现它们的运动能力——一个机器人能移动的最远距离和最快速度——在26年里翻倍13次。倍增时间大约为两年:这意味着一切进展顺利,且这数字与摩尔定律很接近。
凯文·凯利在他的著作《科技想要什么》(What Technology Wants)9中广泛收集了一类遵循指数曲线的技术增长率。如下表所示,各种技术的倍增时间充当着各自的半衰期,预示着指数增长:这就是你手头知识过期、然后你渴望知识升级所需的时间。
技术倍增时间(月)无线(位/秒)10数码相机(像素/美元)12像素(/阵列)19硬盘存储(千兆字节/美元)20DNA测序(美元/碱基)22带宽(千比特/秒·美元)30值得一提的是,上表与第2章普赖斯的研究图表具有惊人的相似性。技术知识与科学知识一样表现出了快速增长。
但是,技术进步与科学进步之间的关系更加密切。只要看看科学前缀你就明白了。
我将在第8章中探讨测算的进步是如何创造新事实和新知识的。但是我们现有用来了解周遭的工具是影响测算的途径之一。通过观察一个小不点儿——科学前缀,我们就可以看到测算技术的进步所带来的影响。
国际计量局负责定义米的长度,并在相当长的时间中保持千克原器,还负责提供官方的度量前缀。我们都知道长度单位厘(10–2),测量硬盘空间的单位千兆(十亿)。但奇怪的前缀远不止这些。例如,毫微微代表千万亿分之一, 泽代表千的七次方(1021)。最新的前缀还有尧(1024)和幺(10–24),这两个前缀都是1991年被确立的。
不过,虽然前缀很有趣,没准你能因此赢得酒吧赌博,但是发明新的前缀可不是为了好玩。它们是应运而生的。与技术和科学一样,前缀数量也呈快速的指数增长。如果把对应这些年人们所引入的前缀数绘制成图10,你会得到一个大致的指数曲线。
只有当科学智慧的火候到了的时候,我们才会去衡量数量,无论是测量能源使用情况、测定微小的原子,还是思考天文距离。如果用处不大,有了毫微微或更大的前缀也毫无意义。然而,随着我们的认识日渐深入,上至宇宙中星系的数量,下至亚原子粒子的大小,我们需要用到的前缀也大大增多。例如,基因组测序的成本下降很快11,最近甚至还大大超过了指数衰减的速度。技术的发展促进了科学进步,与之俱来的还有新的度量前缀。
科学领域的这些技术倍增12其实并不少见。例如,蛋白质组学针对蛋白质及其在细胞体内的相互作用进行大规模的数据分析,这个领域符合摩尔定律13,那就是技术水平每年翻一倍。
连神经系统科学的前进步伐都与摩尔定律一致:与记录单个神经元相关的技术进步一直呈指数增长。具体说来,能够被同时记录下来的神经元数目14也呈指数增长,大约每7年半就会翻一倍。
科学与技术紧密相连15,那么,我们该如何区分科学知识和技术创新呢?有时候我们能区分,有时却不能。这并不是说二者没有差异。正如科学社会学家乔纳森·科尔(Jonathan Cole)所说:
科学与技术是密切相关的,但是二者并不是一回事。科学涉及的是日积月累的科学探索造就的新的自然知识体系——物理学、生物学、社会和行为科学等等无所不包。而广义的技术,指的是我们征服自然以满足自身需要和欲望的过程。有些人认为技术就是小玩意儿和各种产品,其实不然,技术还包括个人或公司从制定一套操作标准和作业限制到敲定特定情况的解决方案的全过程。
杜克大学的工程和历史学教授亨利·佩特罗斯基(Henry Petroski)16的表述更为简洁:“科学就是认识宇宙万物的起源、性质和行为;技术就是通过重组世界来实现创新,从而解决问题。”科学修正的事实是我们对世界的认识,而技术修正的事实是我们在世界上的行为。
但是有时候,并不是基础科学引领了新技术,而是技术促成了科学进步,这样的例子确实存在。例如,蒸汽机发明100多年后,人们才清楚地了解了热力学——即关于能量的物理学。
技术知识和科学知识前后相继的顺序不易分辨,甚至两者本身也常常让人混淆。铁的磁性就很好地说明了这一点。
铁是有磁性的,每个玩过磁铁吸回形针的人都知道。铁比铝的磁性强,你将铝箔靠近磁铁就明白了。这些磁性的差异一测便知,一种材料带有磁性的强弱(或不带磁性)就叫作磁导率(magnetic permeability)。
事实证明,铁的磁导率会随时间而变化。确切地说,每过5年,铁的磁性就会增强一倍。这听起来可不对。铁的磁性不是不变吗?铁是一种化学元素,那么不管多少铁都应该是一样的,就像雪一样纯净。那为什么铁的磁导率会随时间的推移而增强呢?
其实,人们使用的铁自始至终都不是纯净物。它含有各种各样的杂质;很多年前你得到的铁绝不是纯净物。1928年,工程师特里夫·杜威·延森(Trygve Dewey Yensen)17开始探索数百年来铁的磁性。延森查阅了自1870年以来的文献,后来他发现,铁的磁导率稳步增强,呈现出指数增长趋势。而这都要归功于技术。
随着提纯技术的进步,铁的磁导率不断增强。乍眼一看明明是科学范畴的事实,其实却与技术能力密切相关。技术进步了,我们就会看到科学事实也跟着稳步而有规律地改变。技术的进步不但改变了我们已知的科学事实,还激发了新的发现,反映出科学知识与技术知识紧密相关的属性。
以元素周期表为例。众所周知,化学元素的数目逐年增加,总的来看一帆风顺,但是如果你仔细瞅瞅数据,你就会发现根本没这么简单。和德里克·普赖斯的发现一样,元素周期表中元素数量的增加也是一条逻辑曲线。他认为,这是由于技术不断进步,方法越来越先进。例如,从17世纪后期的科学革命到19世纪末,人们运用包括电击在内的各种化学方法,把化合物分解成单独的构成元素,最后一共发现了60多个元素。其中有许多元素都被汉弗莱·戴维爵士(Sir Humphry Davy)所发现,如钙、钠和硼等。
不过没过多久,这些方法就不好用了,新化学元素的发现步伐也放缓下来。但是,紧随摩尔定律的轨迹,一种新的技术诞生了,这就是粒子加速器,它的原子粉碎能力使得新发现又焕发了活力。我们通过高能粒子加速器发现了较重的和较大的化学元素原子。这些进步真真切切地写就了新的事实。
技术进步促进了事实变迁,有时很快,且涉及方方面面:新基因组排序(截至2011年年底,近200种物种已经完成测序);探寻小行星(通常是使用能检测到宇宙中移动物体的复杂的计算机算法);甚至是通过越来越强大的计算能力来证明新的数学定理。
甚至还有新的事实把技术与人类行为结合在一起。得益于技术进步,运动员的装备,例如泳衣、运动鞋和训练设施等越发精良,于是他们打破了世界纪录。甚至连棋盘游戏也经历了变革。正如之前所说,过去几十年来,游戏已越来越成为18计算机的专长,事实已被改变。计算机击败了人类的第一个游戏是跳棋——那是在1990年。1997年,计算机又取得了国际象棋和“奥赛罗”的胜利,自2011年起,智力问答都成了计算机的专长。
现在,计算机可以把人击得一败涂地,它们可以用反问的形式回答问题,尽管这些问题长久以来被认为只有人脑才能回答。
技术对许多其他领域的知识也产生了巨大影响。我立马想到的是医药行业。有一大批医学知识在发生改变,同样地,我们的医学进步也没有止境。例如,17世纪的约翰·威尔金斯(John Wilkins),那个自称创建了通用语言从而助力了组织事实和想法的第一人,就被更新了的医学知识击倒了。
威尔金斯可能死于肾结石并发症。当时,肾结石过大只有两种选择:可怕的手术(从阴囊附近割到膀胱,而病人是有意识的)或者痛苦的死亡。威尔金斯没有选择手术,而选择了手术的病人通常也不能幸存。但是自科学革命以来,医学进步使得诸如声波打碎肾结石、溶解肾结石这些其他疗法成为可能——存活率还很高。
医学进步如此之快,以至于来自几个世纪前的访客都认不出我们现在使用的是什么,而来自几十年前的访客也只是略知一二。天花疫苗产生后,这种病在这个星球上已经完全根除。分娩原本有生命危险,而现在成了安全的常规手术。一度造成黑死病的腺鼠疫,现在很容易用抗生素治愈。事实上,有一年夏天在圣达菲(Santa Fe)度假的时候,有人告诉我们这个地区有黑死病。他们不是有意要吓唬我们,他们之所以这么说,为的是等我们回家以后告诉医生,人类仍有感染黑死病的可能。这样的话,如果人们不幸发病,医生就可以使用速效药治疗这种曾经席卷中世纪的可怕疾病。
让我们的童年夏天饱受威胁的脊髓灰质炎[6]已变成了遥远的回忆。几年前,我有幸参加了一个在史密森美国国家历史博物馆举办的脊髓灰质炎展览。这种病在历史书籍中有过记载,我肯定没经历过,但是我的一位伯父因患这种疾病而变瘸,我妻子的姨妈在儿童时代也得了这种病。病患经历、恐惧和铁肺[7],读来都让人触目惊心。但是医疗进步了,现在在发达国家,人们普遍认为脊髓灰质炎19已经永远成了历史。
技术甚至可以影响经济事实。曾经极度昂贵的计算机芯片已经愈发强大,变成了一次性弃用型产品。同样地,铝曾经是地球上的贵金属20,可是由于提炼技术的进步,铝的价格暴跌。现在残羹冷炙都用铝制品来盛装。
但是有时候,医疗水平与技术的进步在翻天覆地地改变我们的生活方式:从互联网的发展便可一目了然;同时,这也可能从根本上改变了人类的天性。技术事实带来的极端变化可以从人类寿命方面窥见一斑。
在过去的100年里,发达国家的人均寿命快速增长。这得益于众多因素,比如婴儿死亡率的降低、卫生条件的改善、福利医疗和公共卫生的举措等等。自1960年以来,美国人的人均寿命每年都在延长0.4岁21。这种人均寿命本身也在加速增长。
如果持续加速,有趣的事情就该发生了。如果我们给人均寿命增加一岁多——就是简单地把不足一岁变成一岁多——我们就得到了所谓的死亡逃逸速度(actuarial escape velocity)22。这意味着,我们每年多活一年多,我们就可以生生世世地活下去。让我再次强调这一点:技术和医疗能力的些许改变——周遭世界的事实改变——就可以从根本上使人变得不朽。死亡逃逸速度这个词因奥布里·格雷(Aubrey de Grey)而得到传播,他是一位执着于生命不朽的大胡子科学家。奥布里·格雷终其一生都在研究这一死亡逃逸速度。
即使按最乐观的估计,我们要实现长生不老的梦想至少还要等上几十年。也很有可能永远实现不了。但是,我们可以从这种简单粗略的估计中得到启示:技术知识不仅会发生改变,而且可以改变得如此之快,以至于引发其他知识连锁的剧烈变化。以此例来说,人的寿命由短到长,再到很长,再到永生。关于知识的间断进步,以及它是如何发生的,详见第7章。但是,我的意思很明确:技术的变化会影响许多别的事实,有时深刻的变革可能就发生在我们身边。
但与此相反呢?与其过于乐观地认为技术将给世界带来巨大的积极变化,我们是不是应该持一丝悲观态度呢?会不会终有一天我们将到达技术的终点?这也有数学规律可循吗?
反对者预测科学进步终会结束,因此人们预测创新通常也会有同样的宿命。这里面有两个有名的故事,分别是:美国专利和商标办的负责人说发明已经穷尽;专利局一位专员笃信此事,甚至辞职了。
但这些故事所说的事情并没有发生。后一个故事是说,美国专利局专员亨利·埃尔斯沃思(Henry Ellsworth)在1943年给国会的一份报告中写道:“我们不再轻信年复一年的艺术进步,它似乎预示着人类终将止步不前。”但埃尔斯沃思用的反例是持续增长的事实。他认为从本质上讲,尽管我们总是觉得已经到了瓶颈期,但是指数增长这一事实仍是惊人的,是值得赞叹的。而前一个故事,即美国专利和商标办负责人的声明——新发明已成过去——根本就是无稽之谈。
然而,这些被我们用来自嘲无知的故事说明了社会上一个观点:不但创新不会止步,任何认为技术知识增长将停止的观点都经不起考验。技术的发展,以及随之而来的事实变化,似乎并没有要结束的样子。当然,它们最终肯定会结束。物理学家汤姆·墨菲(Tom Murphy)用反证法证明23,基于某些能源约束的基本推论,3000年内我们会用尽整个星系里所有的能量。因此从长远来看,渐趋近上限的逻辑曲线可能比一条单纯的无穷指数曲线更有用,不妨把曲线由指数化转为逻辑化。
与此同时,技术和科学正以令人难以置信的速度系统地发展。但是亟待解决的问题尚存:为什么这些领域持续增长?又是为什么,它们的增长方式这么有规律,常常都是呈指数曲线的数学形状?
还有一些人站到了定律的对立面,认为摩尔定律之类的规律仅仅是自证命题24。一旦摩尔量化了一个集成电路中电路数目的翻倍率,预测出未来10年会发生什么,那一切就简化成了努力实现的问题。而一旦1975年的预测成真,行业就有了达到摩尔定律预测的下一个新的里程碑的持续动力,因为如果哪家公司落在了这条曲线的后面,它就会关门大吉。既然预言有可能成真,不想败下阵来的公司就不得不使其成真。
这就类似于有名的霍桑效应(Hawthorne effect)25,如果被观察者知道自己是观察对象,他们的举止就会发生改变。此效应得名于20世纪二三十年代在芝加哥郊外的霍桑工厂进行的一次实验。科学家希望测定环境因素的变化(如照明条件)对工人劳动生产率产生的影响。他们发现,改变工人行为的各种办法——无论是增加照明强度还是改变其他环境因素——都可以提高生产率。然而,一旦实验结束,生产率就下降了。
研究人员认为,影响生产力的是实验观测本身,而非环境因素。霍桑效应的定义是“关注和重视等心理激励手段所带来的员工工作效率的增加”。虽然只要是观察和研究下发生的改变都算数,但是霍桑效应最大的贡献当属对生产力的启示:如果一个行业里的成员知道他们正在被观察研究,尤其是和预测指标相联系,那么也许他们会更有动力去提高生产率,达到测算的期望。
但是这其实是说不通的,甚至是不可能的。在许多技术领域,这些倍增现象都先于摩尔定律的提出。如前文所述,计算能力领域的规律早在19世纪末20世纪初的时候就是成立的,那时戈登·摩尔还没有出生。因此,由摩尔命名的正在发生的现象实际上并不是因摩尔定律而产生。
那么,一切改变都遵循这些指数曲线,而且变化得如此迅速,究竟是为什么呢?答案可能与知识累积有关。任何新事物——想法、发现或者技术上的突破——必须建立在已知事物的基础上。这是世界的常规运作方式。科学理念互为基石,从而衍生出新的科学知识,带来新的突破。说到技术进步和科学进步,我们可以引导我们所拥有的知识来创造新的事实。我们必须积累一定的知识,才能学习新的东西。
高和玛吉认为,技术进步的幅度与之前已有的知识量成正比。方法、想法或者能让技术愈臻完善的东西积累得越多,技术进步的潜力就越大。
我所说的可以从数学的角度来描述。我们期望的与当前规模成比例的增长正是:指数增长。这意味着,如果技术像科学一样具有自我推动、循序渐进的本质特点,那么我们可以轻而易举地达到这些倍增和指数增长速度。许多研究人员已经提出了各种各样的数学模型,试图用不断累积的知识这一核心理念来给出解释。
因此,尽管指数增长不是一个自证命题,它还是反馈回来一种势在必行的技术趋势:科学或者技术知识的基石越多,新技术提高的速度越快。
但是为什么总是这样呢?技术或科学改变并不会自动发生;人们需要创建新的思想和观念。因此,除了知识积累之外,我们还需要了解知识增长的另一个重要板块:人口增长。
介于1万年到1.2万年前的某个时点,澳大利亚和塔斯马尼亚岛之间的陆桥被摧毁了。之前,人们可以轻松往返于澳大利亚和南部海岸的这个小岛。陆桥消失后不久,发生了一件事:人烟稀少的塔斯马尼亚岛26成为这个星球上技术最落后的社会之一。
根据人类学家的记载,17世纪欧洲探险家来到塔斯马尼亚岛的时候,塔斯马尼亚岛民的工具箱里只有24种工具,其中包括最常见的岩石和棍棒。与此相对,海峡对岸不远处的原住民则拥有数百种技术:捕鱼网、船、刺矛、御寒服装等等。
塔斯马尼亚人要么从来没有发明过这些技术,要么就是在过去的几千年间遗失了这些技术。
人类学家约瑟夫·亨里奇(Joseph Henrich)试图通过数学建模来解释为什么会出现这样的技术遗失以及这么久的创新空白期。模型归根结底还是简单的数字。在大型的群体里,互动的人们能够传承已有技能,不断推陈出新。而在小型的群体里,不存在分工和意见交换,也就不具备合力创新的条件。
想象一下,随机选出一小群人,把他们困在一个荒岛上。他们掌握的知识只是重建现代化文明所需的必要知识的一个小小的子集——假定吉利根的教授们不在其列——而且,每个人所具备的技能也屈指可数,只占必要技能中微小的一部分。很像经济学上劳动分工的概念,即使我们每个人都身怀两三种技能,要想娴熟地运用所有的技能,并把它们传承给我们的后代,任务仍然非常艰巨。相比较而言,文化知识的维护和创造在大型群体中更容易实现;每个人专门负责一小块区域的知识,并成为行家里手。
事实上,许多经济学家认为,人口增长与创新和新事实的发展是携手并进的。乔治梅森大学的经济学家布赖恩·卡普兰(Bryan Caplan)写道:
人类历史上,人口最稠密的时期27——很明显是在近几个世纪——所诞生的科学、技术和文化创新较之以前人口较少的时期明显要多。今天,人口较多的国家的科学、技术和文化创新也比人口较少的国家来得多。
经济学家迈克尔·克雷默(Michael Kremer)曾在文章里全面而出彩地论述过28这一点,那是一篇经典的论文:《人口增长与技术变革:公元前100万年到公元1990年》(Population Growth and Technological Change: One Million B.C. to 1990)。
这样的时间跨度可不简单。就像《神秘博士》[8]中的旅行一样,克雷默告诉我们,在历史长河中,世界人口的增长与技术进步是步调一致的。
克雷默的方法很巧妙,他只运用了一些假设。首先,他指出,人口的增长受限于技术的进步。这个假设自托马斯·马尔萨斯(Thomas Malthus)以后就有了,道理很简单,那就是我们需要更多的技术来支持人口的不断增长,无论是通过更高效的粮食生产、更有效的废物管理,还是其他类似的考量。
反过来,克雷默还指出,技术发展应该与人口规模成比例。如果发明面前人人平等,那么人越多,创新也就越多。但是,最近的研究成果29显示,人口密度的增长往往会导致创新快于人口规模的增长,这么看来,似乎克雷默给出的还是保守估计。还是让我们看看克雷默的数学分析会把我们带向何处。
基于这两个假设30,再加上一点相关的数学知识,克雷默发现,人口的增长速度与目前的人口基数成正比。需要明确的一点是:这比指数增长快得多,它是目前为止我们见过的速度最快的增长。指数增长以恒定的速率增长,而人口增长的速度越来越快,而且是随着人口的增长而不断加快。这就叫作双曲线增长率,而且如果任其发展,它甚至可能导致无限的增长。
克雷默发现,有史以来,人口的增长似乎一直遵循这样的规律,并且人口的增长可能促进了我们身边的技术剧变。世界人口的增长与当前的人口数量成正比——地球上人越多,人口增速就越快。
此外,他发现自己的模型还适用于世界历史的其他方面。例如,就像约一万年前塔斯马尼亚岛与澳大利亚分离开一样,其他地方也有许多陆桥被破坏,导致一些地方虽有人烟但与世隔绝。迄今为止,最大的是由欧、亚、非组成的旧大陆(Old World),其次是美洲,接下来依次是澳大利亚、塔斯马尼亚岛和弗林德斯岛(Flinders Island),此岛是塔斯马尼亚岛海岸的一个小岛屿。
克雷默曾预测,最大的地区——指人口最多的地区——技术最为先进。诞生过火药和其他技术的旧大陆一马当先。排在第二位的是美洲,那里城市星罗棋布,他们拥有先进的历法和发达的农业。另一方面,澳洲原住民仍然以狩猎为生,而正如前文所说,塔斯马尼亚岛民落后到连一些最基本的技术都不会。
最惨的是我们的小弗林德斯岛,有证据表明,陆桥被毁坏后的
4 000年里,那里的人慢慢灭绝了,这可能是因为技术倒退(technological regress)。克雷默用这个短语来描述丧失基本的生存技能。
但是人口真的是唯一的原因吗?还是原因更为复杂?
在物理学中,用来解释最大量的研究系统的简单模型被称为一级动力模型31。添加的“动力”越多,模型越精确,因为这个术语是由拟合函数推导出来的复杂曲线图。第一级动力代表基本形状,第二级动力代表它的摆动,以此类推。每多一级连续的动力(即越来越高级的动力),虽然整体模型会变得更加精确,但是每一级动力能够独立解释的曲线形状就越来越少。第一级模型解释大体情况,而较高级的模型解释细节。
人口数量很可能就属于技术的一级动力模型;看来,技术与人口之间确实存在上千年的携手增长。然而,我们知道,一个人的创新能力不可能独立于群体而存在,按照克雷默的假设,我们也能知道,某些人口密度高的地区32未必产生的创新就多。
同样,人口数量固然重要,人口的构成也很重要,它会对事实的改变造成影响。著名的科学社会学家罗伯特·默顿(Robert Merton)在《17世纪英国的科学、技术与社会》(Science, Technology, and Society in Seventeenth-Century England)一文中声称,17世纪英国人的关注领域33决定了那个阶段科学家和工程师的工作重心。你无须为科学家和工程师如此痴迷于精工表件的制作而感到惊讶,因为那时精确测量公海经度是当务之急,而要想精确测量公海经度,那精工表件必不可少。
此外,默顿认为,不只是人口数量在影响创新,影响创新的还有这些人本身:事实证明,当时大多数人才都投身到了科学家队伍,而不是去做教堂里的工作人员或应征入伍。这转而加速了英国的创新进程。这一回,加速英国创新进程的并不是人口规模。
日新月异的全球技术和不断变化的事实并不只依赖于婴儿潮和人口增长的推动力。新知、创新技术的产生和发展受诸多因素影响,例如民众的关注领域、人口的构成等等。但是如果忽略了人口增长这一重要因素,你就错失了拼图的一大块。
我们已经探讨了技术变革以及它背后蕴含的数学规律,更了不起的是,我们通过研究得出,技术变革往往是可预测的。我们现在明白了,为什么创新会如我们所见的那样遵循特定的形态规律。并且我们还明确了技术变革本身会引起其他事实的广泛变化。但是有一大技术领域,它不但自身遵循清晰的轨迹,而且在其他事实和知识片段的传播中起着显著的作用:旅行和交流。
英国有一位流行病学家戴维·布拉德利(David Bradley),1989年时,他决定绘制一张特别的地图34。他对传染现象很感兴趣,于是希望一探究竟,看看人们到底可以把病原体传播到多远的地方。
他使用了自己家族的数据。他绘制了往前四代人——他的曾祖父、祖父、父亲和他自己——一生的行程。他的曾祖父只在凯特琳村活动,村落位于伦敦北部的北安普敦郡。他的游历范围用一个边长为25英里的正方形就能覆盖。而他的祖父足迹远一些,到过伦敦。他的游历范围用一个边长为250英里的正方形可以覆盖。布拉德利的父亲更加国际化,他走遍了欧洲大陆,所以他的游历范围差不多是一个边长为2 500英里的正方形。布拉德利自己,一位享誉全球的科学家,走遍了世界各地。他游历的范围是边长为25 000英里的正方形,地球不是一个正方形网格,所以他的行程大约有环地球一周那么长。布拉德利家族的每一代人一生的游历范围都比上一代翻了10倍,在空间上、在每个朝向上都比上一代人拓展了一个数量级。
一代代人在距离上的指数增长体现在游历的增加。如果我们不看每代人行走的地理距离,而来看一看这个范围,我们会发现范围也是呈指数增长的,增速是距离的平方(因为范围是正方形)。布拉德利关注的是游历的增加对疾病的传播造成的影响,他假定游历的增加会导致疾病传播的增加。
但是,布拉德利家族游历距离的指数增长不仅说明技术在进步,还说明技术进步本身使得其他知识更为广泛地扩散。更为普遍的传播从戴维·布拉德利家族的例子中可见一斑:在过去的几百年里,个人、信息以及思想的传播已经大大提速。你也不会惊讶,这种增速遵循数学规律。
例如,200年间法国人的日均行程上限一直呈指数增长,这从另一个方面印证了布拉德利的亲身经历。曲线的起点是1800年,也就是人类从马背上的时代进入了铁路交通时代。航空和海上运输也具有类似的趋势。海上交通的曲线开始得早一点儿(大约在1750年),而航空交通开始得晚些(直到20世纪20年代才有人开始飞行),但是,像陆上交通一样,其他运输方式35也遵循特定的数学规律。
图5 无论使用何种交通工具,法国人的日均行程都在逐年增加。请注意,行程是一个对数轴,即代表运动距离随着时间的推移呈指数增加。粗黑线表示一般指数增长的趋势。
数据来源: Grübler,《技术和全球变化》(Technology and Global Change)(剑桥大学出版社,2003年)。
这些交通工具的提速对我们所处的世界有着不言而喻的影响。
意大利的物理学家兼系统分析员切萨雷·马尔凯蒂(Cesare Marchetti)对柏林市进行了一项细致的研究36,该研究表明,城市的发展与技术的发展一致。从早期以步行和四轮马车为界,到后来扩大到以电车和地铁为界,柏林的版图无不由技术发展所决定,而现在这种技术发展比以往任何时候都更强大。马尔凯蒂发现了一个简单的规律:无论是从南到北还是由西向东,柏林市区的行程范围都不超过半小时(基于当前的技术水平)。随着交通运输水平的提高,人们可出行的距离相应增加,城市的规模也相应扩大。从这个角度来看,一个城市的界限就是方便人们出行互动的范围。
此外,布拉德利的直觉是非常准的,交通运输的速度对理解疾病的传播具有重要意义。人们的旅行具有一定速度,疾病的传播也具有同样的速度。在14世纪的欧洲(正值中世纪),黑死病正是随着人们的迁移而等速蔓延开来的37。
这样的例子并不少见。一个自然形成的城区的大小;信息传遍世界各地需要多久时间;一个理性的人能够忍受的上下班时长——我们明白了这些事实都万变不离其宗,都基于交通技术的发展,即使它们不断变化,也仍受制于技术改变的规律。归根结底,每个事实都遵从着自己的摩尔定律。
从交流、城市发展到信息处理和医疗发展,我们日常生活中的各种事实都要受技术进步的约束。虽然不可能对每一个技术进步都事无巨细——比如我们还会使用磁盘或CD吗?我们将如何往一平方英寸的面积里塞进更多的晶体管?——但是总有一些能用数学来说明的、可预测的规律来解释这些变化。一旦我们认识到这一点,尤其是再配合着对科学进步的理解,我们就能明白技术是如何改变我们身边的知识的。
但是事实究竟是如何传播的呢?这又是如何影响知识逐年变化的呢?旅行与交流领域的技术会影响我们这个世界的某些事实,同理,它们也会影响事实的传播和我们每一个人对事实的感知,改变我们已获得的知识。
人类所知的事实源于我们接触的事实,这就和知识的传播有关系了。知识的传播是不是也像知识的增长和颠覆那样好理解呢?要解答这个问题,让我们来看看总统预备选举。
[6]脊髓灰质炎又名小儿麻痹症。——译者注[7]铁肺为人工呼吸器的一种。——编者注[8]《神秘博士》(Doctor Who)是一部由英国广播公司出品的科幻电视剧。该剧讲述了名为“Doctor”的神秘外星时间旅行者,随着他的时空机器TARDIS的冒险故事。——译者注
第5章 事实的传播
1972年,在竞选民主党总统候选人的提名时,乔治·华莱士(George Wallace)的腹部被亚瑟·布雷默(Arthur Bremer)射中数枪。在此之前,时任阿拉巴马州州长的华莱士在民意调查中一直遥遥领先。这次暗杀行动为他的竞选活动画下了句点(他的命保住了,但是落下了终身瘫痪),并且扭转了大选的局面,最终麦戈文(McGovern)获得了民主党总统候选人的提名。
就在当天,也就是1972年5月15日,一家名为消费者研究公司的小型公司恰巧要进行一次市场调研,一组电话访问员1接到任务正在进行准备工作。该公司的老板戴维·施瓦茨(David Schwartz)一听到暗杀总统候选人的消息,立刻意识到这是一个千载难逢的机会:他们正好可以利用这次暗杀行动来实际测算一下,重要的新闻要花上多长时间才能在人群中传播开来。于是,他给其中一些电话银行访问员重新分派了任务,他的团队开始给纽约市里的人们打电话,试图对每一个小时里消息的传播情况进行研究。数个小时时间里,他们呼叫了数百人,并依此绘制出一条清晰的数学曲线,以此来显示随着时间的推移消息的扩散情况。每过一个小时,听说过这则消息的受访者就多出许多。到了那天晚上10点,几乎每个受访者都表示获知了这则新闻,有通过广播知晓的,有通过电视知晓的,也有通过口口相传知晓的。这则重磅信息传播得非常迅速,但它的传播不是在一瞬间完成的。这条新闻在纽约市传得满城风雨,而且是通过一种可衡量且可预测的方式。
事实并不总是如此迅速地扩散。不妨想想玛丽·泰(Mary Tai)的例子2。1994年2月,泰在《糖尿病护理》(Diabetes Care)杂志上撰写了一篇论文,名为《测定糖耐量的总面积和其他代谢曲线的数学模型》(A Mathematical Model for the Detemination of Total Area Under Glucose Tolerance and Other Metabolic Curves)。乍看之下,这似乎不大像一篇用定量的方法来研究新陈代谢某些方面的专业期刊文章。但是请仔细看看文章标题的最后几个字。要帮帮忙吗?想想如何测定曲线下的面积。然后再想想高中和大学时候的数学课。
就算泰称其为“自己的模型”,泰的“发现”充其量也就是微积分。泰并不是积分学的第一人,毫无疑问她会为此感到非常失望。微积分其实是在17世纪后半期由牛顿和戈特弗里德·莱布尼兹(Gottfried Leibniz)发现的,这比泰的与糖尿病相关的计算足足早了300年。也就是说,泰重新发现的被称为计算曲线下面积的梯形法则[9],牛顿似乎早就已经知道了。然而,泰的文章通过了编辑审阅,获得发表,并且被科学文献引用了上百次。
随后出版的一期《糖尿病护理》刊登了多封回应泰的来信,它们指出,这种技术早就众所周知,并且在很多介绍微积分的教科书里都有。但是这个例子应该能警醒我们:尽管我们的技术在进步,甚至考虑到在前一章中说过的传播速度的提高,但是在许多情况下,知识的传播比我们想象中慢得多。
事实的创造及衰落均受数学规律的制约。但具体说来,我们并不是一瞬间就知悉或者揭穿了新的事实。作为个体,我们所知的事实源于我们所接收到的信息。要想明白我们是如何知晓信息的,那了解正确信息和错误信息如何以及为什么传播,就与了解它们如何以及为什么没有传播同等重要。我们并不总是同步地掌握知识,不论我们所说的知识是新的大理论还是不正确的简单事实——它是时断时续地在人群中散播开来的。但是,事实的传播、为人知悉以及知识的变革也都是有规律可循的。
科学本身最能说明这个问题了。
虽然泰的例子可能有点儿极端,但是泰犯下的错误在科学界可并不鲜见。说到科学知识的扩散,很难像我们期望得那么快。学科快速增长并形成分支;因此任何一个人想要掌握一个领域里所有的已有知识都非常困难。
在过去的几十年里,跨学科研究一直开展得如火如荼。分子生物学家与应用数学家合作,社会学家与物理学家合作,甚至经济学家与遗传学家合作。只要你能想到两个领域,这两个领域的名称就可以组合在一起,成为一个新的学科。如果物理学家涉足某个领域,那么人们一定会说这个领域将要发生一次转变。如今物理学已经和生物学、经济学和社会学融合在一起,诸如生物物理学、经济物理学、社会物理学这些新的词汇就是最好的证据。
总体而言,这是一个好的趋势,因为如果某个领域内一个众所周知的想法在另一领域里尚属空白,那么这个想法常可以激发头脑风暴,让人们触类旁通,发现一些令人兴奋的新东西。但是,如果多个领域只是看似相关,其实内部的知识并未达到真正融合的话,偶尔就会出现假象,人们以为新发现诞生了,但是归根结底那只是在一个领域重新创造了其他领域里老早就有的东西。泰的经历就是一个特例,但是没那么笑料百出的例子也比比皆是。
我自己的研究涉及众多学科,尚不能避免这个问题。2010年的秋天,我还是哈佛大学的一名博士后研究员,我与同事尤卡-佩卡·翁内拉(Jukka-Pekka Onnela)共同研究一个项目,他也是一名博士后,现在是哈佛大学公共卫生学院的一名教授。这个项目涉及欧洲一个国家的手机网络呼叫的大量匿名数据集。除了要知道谁打电话给谁(这对理解社会关系有重要意义),我们还掌握了呼叫者的位置信息,锁定到了具体的手机塔。根据我们收集的数据,我们可以把呼叫者的位置绘制在国家地图上。
如果你绘出了这种图,你会得到一张均匀分布的网格点图。我们的一项工作内容就是要确认网格上是否有点集群,如果有,那么就要计算我们所研究的人群有多少在这些集群中。我已经知道了许多根据点的位置来归类点集群的复杂方式,但是这些方法的前提都是需要事先知道有多少集群。例如,如果你知道有3个数据群,那么这些算法将把你的数据和位置分为3个不同的组。但是,如果你不知道有多少个集群,那该怎么办呢?
于是翁内拉和我开始在线寻求帮助,虽然我们发现了很多有关集群的信息,但就是没有找到能解决我们的问题的办法。在这个漫长的过程中,我们两人甚至想要试试自创的方法。接着我计上心来:“为什么我们不去大厅找艾伦谈谈呢?”我们说的艾伦就是艾伦·扎斯拉夫斯基(Alan Zaslavsky),他是哈佛大学卫生保健政策系的一位统计学家,只要是统计和数学方面的问题(大多数其他科目的事情也是如此)你都可以咨询他,他可是个专家。因此,我们走到大厅,敲开了他的门。他那时不忙,所以我们聊了一会,不出5分钟我们就豁然开朗了:我们要找的东西几十年以前就有了,叫作赤池(Akaike)信息标准。
但是,如果我们当初没有找到艾伦,那么我们很可能会再次概括出一些多年以前就有的顶尖工作成果,我们很可能还远不如赤池当初做得好。我们掌握的知识在普遍增长,那么事实要有效地传播只会变得更加困难。
当然,这些问题根本不是今天才出现的。即使是在我们的信息爆炸时代以前,知识传播过慢以及根本没有传播的例子也比比皆是,这搞得我们焦头烂额。新奥尔良战役之所以发生,就是因为19世纪初的1812年战争结束的消息传播得太慢:英美之间的战争都已经结束了两个星期,新奥尔良战役中的英美士兵还在短兵相接。通过向西海岸传播林肯在1860年的选举中获胜的消息,小马快递提速到了七天多一点儿。
但是,为什么知识的传播如此不规律呢?地理因素绝对是原因之一:生活在电报触手可及的地方的人们知晓林肯当选的消息要远远快于加利福尼亚州的人们。你越是接近华盛顿特区,你就会越快知道1812年战争结束的消息。但是,有没有其他的影响因素呢?
有一个案例深入研究了知识的传播,总的来说它本身也催化了知识的普遍传播,它也是千百年来影响最为深远的创新之一:印刷术。
印刷术是人类文明的基础技术之一。不同于诸如水车一类的推广,印刷机的推广充当了知识进一步传播的催化剂。印刷机促进新的事实的传播与发展,就好像催化剂酶加快其他化学反应一样,仅仅在它诞生后的50年里,欧洲的图书价格就下降了2/3,这可比任何一种成本的下降都惊人。但是,印刷机本身的推广迅速吗?印刷机的推广有没有什么模式呢?
大约在1440年,约翰内斯·古登堡(Johannes Gutenberg)在美因茨(Mainz)发明了印刷机。尽管这个发明极具开创意义,而且此后一直占据着重要的地位,但是印刷机并没有立即在世界各处遍地开花。甚至没有在欧洲流行开来。光是在美因茨周边城市的缓慢渗透和推广就用了几十年。
普及初期,印刷机大多在德国和意大利北部使用,直到1476年,英国才出现了第一台印刷机。不过,信息从德国传播到英国并不需要几十年时间。人们竭力遏制黑死病的传播,但用了不到10年它就传遍了欧洲大陆以及英吉利海峡,速度比印刷机的推广快得多。显然地理距离并不是唯一的影响因素。那么,究竟为什么印刷机的推广会这么耗时呢?
美国大学的经济学教授杰里迈亚·迪特马尔(Jeremiah Dittmar)为此开展了细致的研究。他探究印刷机给特定城市带来的影响3,以及印刷机从一个地方传到另一个地方的原因。下一页有一些城市地图,展示了随着时间的推移印刷机的推广情况。
印刷机的推广为什么就不能只受到距离的影响呢?人们知道了这项技术以后,难道不能轻松用之吗?
图6 随着时间的推移活字印刷机的推广
资料来源: 迪特马尔,《信息技术和经济的变革:印刷机的影响》(Information Technology and Economic Change: The Impact of The Printing Press),《经济学人》季刊(The Quarterly Journal of Economics)126,第3期(2011年8月1日):1133–72,牛津大学出版社许可出版。
原来,印刷机非常复杂。古登堡的这项技术创新可不是简简单单地在酿酒的榨汁机器的壳子上加上活字印刷术。古登堡引入的技术4涉及的领域多得惊人,此外,他还在此基础上进行了一系列的创新,这也是他的成就的伟大之处。他运用冶金技术制作出的活字金属,不仅长得一样(古登堡坚持这么做),而且可以随意排列,使得整个页面一下子就能一起打印出来。他进行化学创新,研发出了比以往任何时候都好的墨水。古登堡甚至还推崇分工劳动,他雇用了大量工人,其中还有为数不少的文盲,但是印制书本的速度却是前所未有的快。他甚至采用了高端的错误检查机制,以确保活字的排放正确无误:每一块活字的一边上都有一条直线,于是如果活字放倒了,工人可以一目了然。
正是有了这么多技术知识的组合,印刷机才得以诞生,并且节约了成本。因此,地理距离(也就是古登堡所在的美因茨离那些城市的距离)虽然很大程度上可以解释那些城市引进印刷机技术的延迟,但它并不是唯一的原因。
重要的因素总是更加微妙:人与人的接触。最先使用印刷机的城市之所以使用印刷机,是因为德国人居住在这里,或者说掌握了生产一台印刷机所需的技能和技术的德国人居住在这里。人与人的接触使得这些半专有技术得以推广。如果两个人的文化背景相同,语言和传统相似,那么彼此之间就更可能建立信任。正是如此,就像犹太人和胡格诺派教徒建立起了广泛的贸易和财务网络,德国人用自己建立在信任和学徒身份之上的社会关系对印刷的技术进行了推广。
事实的传播里有这么一条规律:通过社会关系网传播信息。当然,印刷机时代的地理和社会关系更加密不可分。正如前文所说,黑死病席卷欧洲时,它的传播速度与那个世纪的人们迁移的速度相当。但是,社会关系对于知识的传播来说也是非常重要的。
观察一下印刷机影响下的城市人口规模,你就能发现这一点。迪特马尔研究城市规模后发现,与小城市相比,越是大的城市,就越有可能采用活字印刷技术。虽然只有1/3的欧洲城市在活字印刷推广的早期采用了这项技术,但是这些城市的人口之和超过了欧洲人口的一半。这没什么稀奇。城市越大,人口越多,城市间的社会纽带所带来的机会也就越多。就像德国人之间的纽带一样,越多的人口就意味着越多的纽带。要了解事实的传播,归结到最后就要了解社会关系网。
你要知道一点,那就是社会关系带来了事实的传播。这一点几乎是显而易见的。但是,在这背后究竟有没有什么规律呢?我们可以量化事实是如何在人与人之间传播的吗?令人高兴的是,有一个领域专门致力于解释这样的社会关系网,它的名字叫作网络科学。网络科学探讨的是关联的运作,无论是人与人之间,还是计算机之间,甚至是相互作用的蛋白质之间的关联。网络科学中的数学不关心是什么与什么关联,也不关心通过这些网络传播的是什么。不论网络传播的是创新、是一条条新闻、是细菌或者其他任何东西,了解网络科学都具有很重大的意义。
因此,要说网络科学与信息和事实的传播方式有很大的关系,你一定不会惊讶,就好像你知道疾病是从一个人传染给另一个人的一样。
我们都生活在社会关系网之中。我们有朋友、邻居和亲戚。相应地,我们的朋友、邻居和亲戚也有各自的社会关系网。以此类推,你几乎可以触及这个星球上所有的人。简单地说,这就是六度人脉的意思。
但是,只谈人与人的社会距离是非常片面的。在过去的几十年中,网络科学在逐步发展,虽尚不能全面地反映我们的社会交往,但是已然更为深入、详尽。在一个社交网中,为什么最受欢迎的人比次受欢迎的人朋友多很多,现在我们能从数学角度明白个中道理。我们还测算出,一个人的亲密社交圈里的人数基本保持稳定5(约4个人)。我们知道不同国家的社会团体是如何分布的6,我们甚至能明白友谊随时间建立和破裂的情况。了解了这些,我们才开始真正懂得我们的社会结构,以及这些社会关系对我们的影响。
一些最前沿的研究正致力于探秘社会关系对我们以及事物传播的影响。尼古拉斯·克里斯塔基斯实验室是这个领域的巨头之一,而我是在这里工作的一名博士后。如果你不知道尼古拉斯·克里斯塔基斯,那你是否记得《纽约时报》报道他研究成果的大标题,或者他的长期合作者詹姆斯·福勒(James Fowler)7:“是你的朋友让你变得肥胖吗”;“发现自己胖了?都是朋友惹的祸”;“研究发现:社会因素影响人们戒烟”;“研究发现:陌生人或许能让你开心”。
这些研究不断证实,我们的行为会在我们的社会关系网中产生纹波效应,我们的朋友、朋友的朋友、甚至朋友的朋友的朋友,都可能受到影响。
但是,正如健康行为会传播,事实和知识也会传播。信息的传播靠的是社会空间而不是物理空间,所以,了解社会关系网以及它们的运作方式就显得至关重要。在这个全球化的时代,我们可以日行千里,通达四海,因此,我们与他人的纽带比我们身处何方重要得多。不论我们是想抢占市场的广告人,还是仅仅巴望轻几斤的瘦身减肥者,我们都迫切地需要新的社交关系网给出的种种答案。比如说:
我们身边的每一种社会关系——朋友、亲戚、配偶、邻居——分别是如何影响每一个事实和行为的传播的?既然距离会影响信息的传播,那它与我们的社会纽带相关吗?人们的社会关系网是什么样子的,而它的形状——规则的、随机的、或者居于两者之间的——会不会影响我们的互动呢?还有,我们的社会纽带——比如我们有多少朋友,朋友间有多少互相认识——会不会影响我们自己的基因呢?
众多疑问都有待社交关系网领域的科学家给出解答。他们最近已经开始研究我们当下最关心的问题,那就是事实传播与否的案例以及个中缘由。
早在20世纪70年代,一位名叫马克·格兰诺维特(Mark Granovetter)的社会学家曾经做过一个简单的思想小实验:他假设人与人之间的社会关系或强或弱。强的社会纽带连接的是我们与父母、配偶或亲密的朋友。弱的社会纽带连接的是我们与从高中到大学认识的鲜有交谈的朋友、工作上相识但下了班就不再打交道的人,此外还有现代社会里我们大多数的Facebook(脸谱网)“好友”。
格兰诺维特的思想实验如下:如果我们的纽带有且只有这两种,那么我们的社会关系网会是什么样子呢?他认为,和你都很要好的两个朋友可能互相认识,也很可能彼此要好。因此,社会关系网里大量的纽带都是由交情匪浅的群体小三角之间的强纽带构成的。然而,这些关系瓷实的群体有时也会通过弱纽带与其他关系瓷实的群体相连接。在两个由弱纽带连接的群体间,弱纽带对促进群体间社交关系网内的信息传播非常重要。换句话说(用他著名论文的标题来说),格兰诺维特探讨的是“弱纽带的力量”。
格兰诺维特甚至用了一些简单的数据作为论据:他调查了一群人找到工作的途径。他发现,那些被引荐差事的求职者与介绍人之间的纽带都很“弱”。
最近,科学家们已经能够检验格兰诺维特这一论点是否正确。前面提到过我的前同事尤卡-佩卡·翁内拉,他其实就参与了该领域一篇重要论文的写作。为了了解信息的传播,他引入了异常丰富的数据集(这些数据集日后被许多科学论文所援引):欧洲一个国家一系列匿名的手机通话信息。
用这些通话数据,翁内拉和他的同事们构建出了一个遍布整个国家的社会关系网。他们不仅得出了人与人之间的纽带,还根据若干个月里人们与他人的通话时长得出了这些纽带的强弱。
由此他们用社交关系网进行了一项测试:他们用计算机抽象模拟了一次传播——传播的可以是一种疾病、一条流言蜚语、一个事实,或是随便其他什么东西。基于“两个人之间的纽带越强,传播就越有可能发生”这个基本假设,他们开始在手机网络里传播消息。
这一假设是完全合理的。和感冒患者相处的时间越长,就越容易被传染。你和某人交谈得越频繁,他们就越有可能向你爆出几则八卦。
每一千个通话模拟中,研究团队会随机选择几个人来开始传播。而每一次,他们都会加权推测每两个交谈的人里谁可能会受到影响。纽带越强,就越可能受到影响。通过屡次模拟,他们测算出所有人都被影响所需要的时间,并且记录下了在此过程中发生的变化。
他们通过实验研究了社交关系网之后发现,弱的纽带对于知识的传播并没有那么重要。不出格兰诺维特所料,弱的纽带确实维系了社会关系,但是它们并不足以传播事实。虽然弱的纽带连接了不同的社会群体,但是它们还没有强大到能有效地传播什么。
但是,强的纽带也没有那么重要。虽然强的纽带可以轻松地传播事实,但大部分情况下它们传播的对象已经知道了这个事实,因为强的纽带只存在于紧密联系的群体,而群体里的成员往往拥有相似的知识体系。
所以,格兰诺维特的观点并不完全正确。毕竟,最重要的是介于强弱纽带之间的中间地带,它们不会因为连接太弱而无法传播,也不会因为连接太强而成为社会性(和信息性)的同系群体。
正是这种纽带使得知识传播、信息扩散,有时甚至会以讹传讹。你稍稍信得过但算不上最亲密的朋友、你的同事、关系比陌生人好一点但比哥们儿又差一点的人:这些人的纽带在信息传播的过程中最为重要。他们联通了足够差异化的社交圈子,从而使得事实能够传播到一个可继续传播的新群体。
从印刷机和古登堡的创新的推广上我们就能明白一二。传播新事实的关键人物是那些居住在其他城市的德国人。这些拥有必要的知识和技能的人(通常与古登堡也有一些关系)具备了把这些创新传播到新的群体的能力。
信息的传播以及为我们知晓的方式与我们彼此的关系密切相关,并且,社会关系学可以为我们的研究提供指导。但是,人们传播的东西并不一定是正确的。真理的传播有多快,谣言的传播就有多快。
错误的知识尤其害人不浅。科学能否解释错误知识是如何在人群中传播并且混淆视听的呢?要回答这个问题,我们就得研究这些错误,让我从许多年前亲身经历的一件事讲起吧:著名的雷龙的例子。
我还是个孩子的时候,特别痴迷恐龙。一个6岁的小男孩对自己好奇的天性全无办法。我认识各种类型的蜥脚类和兽脚类恐龙,我熟悉它们的饮食习惯,前几代人认为这些远古的庞然大物行动迟缓、头脑简单、冷血,可这些误解被最新理论推翻了,它们是恒温动物,这我全都知道。
以前我在幼儿园上课时有一个有趣的活动,八年级学生必须两两配对分组。有人会负责采访我们的兴趣、愿望和梦想,然后根据采访撰写一本故事书。我的书自然主题非常明确:古生物学家塞缪尔·阿贝斯曼博士有幸被派到南美洲去调查关于活恐龙的传言是真是假,如果属实就把它捕捉到。
但是,尽管我痴迷恐龙,但是有一个最基本的事实我搞错了,而且没有人纠正过我:那就是雷龙这个名字。四条腿的蜥臀目,长长的脖子,小脑袋,它是我童年的最爱。但是,它其实只存在于我的幻想里,那种我编出来要去南美洲抓的恐龙的名字其实叫迷惑龙。
到了19世纪60年代,恐龙化石的挖掘工作进行得如火如荼。19世纪50年代,达尔文出版了《物种起源》(On the Origin of Species)一书,而早在那之前的数十年,人们就已经摒弃了这些化石是在洪水中丧生的生物的骨骼这一观点。现在,我们知道它们真的是许久之前存在过的怪物,是进化论里众多生物华彩篇章的其中一页。
科学发现的浪潮中涌现出两位美国古生物学家:爱德华·柯普(Edward Cope)和奥斯尼尔·马什(Othniel Marsh)。虽然历史把他们捆绑在了一起,但是两人差异很大。柯普没有什么古生物学背景,更未接受过正规的相关教育,他只是在哈弗福特学院(Haverford College)任教时获得了一个荣誉硕士学位。而马什是海德堡大学(University of Heidelberg)博士科班出身,任耶鲁大学的教授,并且兼任皮博迪自然历史博物馆(Peabody Museum of Natural History)的馆长。
从1863年起,马什和柯普的比赛就打响了,虽然“比赛”这个词并不那么准确。有一些人管这叫“大美洲淘恐龙化石热”,我觉得也不大对。兵不厌诈,两位古生物学家的挖掘工作伴随着贿赂、盗窃甚至诋毁对方的专业信誉,如果你把这些都算上,那么用“骨头大战”(Bone Wars)这个词来指代这场冲突当然再贴切不过了,这也是最常见的叫法。
马什和柯普最初是合作者,但是他们很快就出现了分歧。导火索似乎是在柯普为一种水生生物(名为依拉丝莫龙,一种尼斯湖水怪)重建骨架的过程中,马什指出了他的一个错误。再加上马什背地里买通工人,让工人把新泽西地区他俩从地盘里挖出来的化石都给他,就这样,战火四起。马什是一个坚定的达尔文主义者,而柯普则信仰更古老的理论——新拉马克主义,这些差异加剧了两人的冲突。最终,两人成了死对头,无所不用其极地各自发掘新型恐龙。
在这期间,奥斯尼尔·马什于1879年发表了他对雷龙的研究成果。雷龙的完整学名为秀丽雷龙(Brontosaurus excelsus),来源于拉丁文,大意是“最崇高的雷霆蜥蜴[10]”。1877年,也就是两年之前,他还提交了一篇题为《发现侏罗系新恐龙类爬行动物》的论文,在论文中,他描述了一只较小的恐龙(显然是幼龙),他管它叫迷惑龙。这个名字的意思是“迷惑人的蜥蜴”,因为据马什观察,这种龙的骨骼与另一个物种的骨骼很类似。马什在文中还针对柯普,表示他自己的这些研究优于柯普的研究,其中提到柯普的“研究结论自然不会得到解剖学家的信任”8。
后来出土了一具完整的骨架,完善了对雷龙的研究,它美不胜收,预示着雷龙成为一种享誉全球的流行文化。与此相反,迷惑龙沦为一小堆骨盆和肩胛骨,鲜有人问津了。
马什和柯普继续废寝忘食地进行恐龙化石的研究工作,时常彼此恶语相向。有一次马什在《美国博物学家》(American Naturalist)上发表了与柯普不同的见解,柯普竟然为了发表自己的言论而买下了这家科学期刊。尽管他们互相怀有敌意,但是他们实际上并没有再为雷龙的事发生争执。
但是在1903年,古生物学者埃尔默·里格斯(Elmer Riggs)提出了一个质疑。这一次是马什犯了错。但是就算柯普知道了这事也不会感到欣慰(马什和柯普在几年前就已经长眠了),可这是一个相当大的错误。里格斯认为,雷龙其实只是另一种迷惑龙。因此,雷龙不复存在。因为雷龙是在迷惑龙之后被人们发现的,所以迷惑龙的名字靠前,应优先选用。所以就算雷龙这个名字再令人印象深刻,正确的叫法也应该是迷惑龙。
虽然如此,许多古生物学家坚持叫它们雷龙。为什么芝麻大点儿的事情也要混淆视听呢?
后来,在1978年,又有两名古生物学家麦肯托什(J. S. McIntosh)和戴维·伯曼(David Berman)发现了惊天秘密:一开始雷龙的头安错了!安的是另一种大型食草恐龙的头。他们还发现,迷惑龙其实也被错安了别的物种的头[11]。于是如梦初醒的科学家们觉得是时候进行亡羊补牢了;后来科学家都开始叫它们迷惑龙。
但是雷龙这个名字还是响当当的,丝毫未受影响。它已经不再是一种恐龙。它风靡于各种类型的通俗读物,我童年时代知道的恐龙知识就是从这些书本上获得的。发现分类错误近一个世纪之后,也是古生物界牢骚满腹了20多年之后,1989年,美国邮政服务发行了一套含有四种恐龙的邮票,里面竟然还有它。在20世纪90年代初期,我读了斯蒂芬·杰·古尔德(Stephen Jay Gould)的文章《雷龙霸王》(Bully for Brontosaurus)之后才知道分类有错误,他认为美国邮政服务做得对,虽然从严格意义上说雷龙这个名字是不正确的。
从那时起,迷惑龙这个词开始逐渐为人们所习用,虽然速度还是很缓慢,我们从谷歌Ngram阅读器中就可以看出。
图7 逐年使用雷龙 (黑色曲线)一词与使用迷惑龙(灰色曲线)一词的次数,曲线平滑处理后统计。
数据来源:谷歌图书 Ngrams and the Cultural Observatory。
但是,错误的知识总是如此长盛不衰吗?很不幸,这样的例子比比皆是,错误本不该存在那么久,但是通常却很难避免。
在第9章中,我们将研究人们拒绝改变已拥有知识的原因,至少要弄明白为什么人们忽视了知识数据库的时常更新。但是,一个新的事实(即使是错误的)是如何在人群中传播的呢?错误的扩散有没有什么规律?
大力水手(Popeye the Sailor)的例子是最奇怪的错误传播之一。大力水手口音古怪,前臂异常,吃了菠菜后靠着某种反超人元素而威力无穷。菠菜赋予他力量,也许也给了他独特的说话腔调。但是为什么大力水手要吃这么多菠菜?他痴迷于这样一种奇怪的食物是出于什么原因呢?
50多年前就有这种说法了。早在1870年,德国化学家埃里希·冯·沃尔夫(Erich von Wolf)研究了菠菜以及许多其他绿色蔬菜的含铁量。但是在抄录研究数据时,他一不小心点错了小数点,搞错了菠菜中铁含量的数量级。每100克菠菜实际上只含有3.5毫克铁,他却写成了35毫克。如果真是如此,那么吃100克菠菜就相当于吃了一个回形针那么多的铁。
错误的数据被印刷出版,菠菜的营养价值也因此蒙上了传奇色彩。正是因为菠菜了不起的健康属性,工作室的负责人在创造大力水手这个形象的时候,才设计了他多吃菠菜成为大力士的桥段。据说,因为大力水手,美国人的菠菜消费量提升了1/3!
这个错误最终在1937年复查数字的时候得到了纠正。可惜覆水难收。毫无疑问,要是今天大力水手还流行,那么这个错误还会继续传啊传9。因为实在是波及甚广,所以在1981年的时候,《英国医学杂志》(British Medical Journal)专门针对菠菜发表了一篇文章,竭尽全力来揭穿这一谬误。
总而言之,这些错误之所以蔓延,是因为与深入研究文献得出的正确事实比起来,你最先知道的或者听起来对的事情传播起来更容易。
迈克尔·莫布森(Michael Mauboussin)是美盛资产管理公司(Legg Mason Global Asset Management)的首席投资战略师,他在一篇关于事实核实的文章中现身说法,讲述了这种错误的传播。他著书《三思而后行》(Think Twice)的时候10,在一本书的统计数据中看到了一个方程,用这个方程可以计算波尔多地区产出的葡萄酒的价值。但是奇怪的是,不管莫布森怎么试,用这个方程就是行不通。原来,他的消息来源错漏百出,有一些数字小得可怜,有一些数字存在舍入误差,致使方程的意义发生了彻底改变。莫布森查阅了原始的科学论文之后,才终于算出了正确的答案。
小错误尽管后来被纠正了,仍难免传得人尽皆知,这样的例子有很多。如果你想花上几天时间来钻研这些旷日持久又广泛蔓延的错误,Snopes.com不失为一个好去处。也可以看看维基百科(Wikipedia)。兰德尔·门罗(Randall Munroe)在傻得可爱的网络漫画xkcd里描绘了一个他理想中的世界11,在这个世界里,小学生每周都要阅读维基百科页面上的常见谬误,从而既能了解事实真相,又具有批判性的态度。这两个网站上面全都是众所周知的都市传说、虚假事实和谬误。
经验告诉我们,要研究错误如何逐年传播,就必须搞懂非主流观点这个词是什么意思。虽然这个词是喜好反常观点的作者的至爱(这类作者不可能不受到非主流观点的影响),但是它也清楚地表明了有些知识尽管不对却越传越厉害。作者自然会告诉你纠正谬误的办法,但是这些办法至今还未深入人心。而且这个词一点儿也不新,在19世纪纠正月亮盈亏、医学知识、遗传天才的虚假知识的书报里,这个词都屡见不鲜12。
还有一些例子说的是人为误传,尽管有的是因为一时疏忽,而不是蓄意而为。但是,正因为我们往往不会深究消息的来源,这些人为误传可能会造成重重问题。例如:我书架上有一本名叫《理论词典》(Dictionary of Theories)的书,有一天在细读的时候,我碰到了一个奇怪的条目:
小行星运动论13(1809) 天文学 由卡尔·弗里德里希·高斯(C F Gauss,1777—1855)始创,后来詹姆斯·莫里亚蒂(James Moriarty,1840—1891)在一本晦涩的教科书中进行了精妙阐述,此后做出贡献的数学家还包括卡尔·维尔斯特拉斯(K Weierstrass,1815—1897)和约翰·恩瑟·李特尔伍德(J E Littlewood,1885—1977)。
小行星,也就是现在公认的小的星体,介于两个大引力场之间,受到的万有引力可以忽略不计,它与地球和月球引力作用下的航天器的运动轨迹相似。
约翰·鲍尔斯(J F Bowers),《詹姆斯·莫里亚蒂:一位被遗忘的数学家》(James Moriarty: A Forgotten Mathematician),《新科学家》(New Scientist),124(1989),1696–7,17–19。
我从来没有听说过这个理论,但是我没觉得太惊讶,因为字典中的有些说法本来就不好懂。但是最后面的引文确实把我看得云里雾里,因为它引的专著作者是詹姆斯·莫里亚蒂,而莫里亚蒂正是福尔摩斯的死敌。
就算听起来没错,但是莫里亚蒂根本就不存在呀。然而,他就这么被一篇虚构的引文带入了真实世界。我进一步搜索找到了《新科学家》 上的那篇文章14,原来这是英国利兹大学(University of Leeds)数学学院的约翰·鲍尔斯针对莫里亚蒂教授的数学贡献(包括莫里亚蒂对小行星受万有引力作用的分析)所进行的一项研究。
但是对莫里亚蒂的文献引用15并没有就此结束。我发现,在美国南加州大学物理学博士克里斯蒂安·肯纳韦(Kristian Kennaway)的一篇论文里,也有对莫里亚蒂一项著名研究的引用:一篇关于二项式定理的论文,发表它的不是别的杂志,正是《波西米亚统计期刊》(Bohemian Journal of Counting)。
这无疑是肯纳韦的恶搞,想看看他的委员会成员是否会察觉(我的姨妈曾把一个香蕉面包的制作配方写进她的硕士论文,但谁也没发现),但是肯纳韦对莫里亚蒂数学研究的引用确实说明了一些东西,为使用虚构人物研究成果的数学观点提供了依据。
到目前为止,这方面的例子我见得不多,而且我并不认为这种真假之间的古怪重叠会传播多远。但是这确实引人深思。
谬误传播得很快。而有先发优势的信息也往往会有不好的影响。无论是真是假,首次印刷出版的信息在人脑中先入为主后都不易改变。曾任《纽约客》(The New Yorker)事实检查员的萨拉·利平科特(Sara Lippincott)对此有过明确的表述。这些错误“将代代相传16,欺骗一代代的研究学者,他们照着最初的错误又制造了新的错误,如此以往,就成了大错误的爆炸”。真强大。这些错误变得比以往任何时候都难以纠正。困难得像试图在风中收集蒲公英飘飞的种子一样。
我自己就是一个受害者,我曾经向他人散布说:将水慢慢煮沸,水里的青蛙就不会跳出锅。我在进《波士顿环球报》(Boston Globe)时提到了这一点,想说明如果情况慢慢地发生改变,人们就不会察觉。其后不久,我参加了《大西洋月刊》(The Atlantic)的作者詹姆斯·法洛斯(James Fallows)的一项研究17,他致力于消除人们观念中的这一谬误,事实上,青蛙除非是脑死亡,否则绝不可能待在锅内。
我们能否用一种严谨的方式去认识各种各样的谎言到底是如何不断传播的?所幸我们有深入研究这种传播方式的科学探索。但是,那门科学要求我们先走一点弯路,去研究一些古代手稿中老旧的错误、它们与遗传的惊人联系以及这两个领域是如何对待错误的。
我们从孩子们的电话游戏中就能了解事实是如何被歪曲传播的:孩子们围坐成一圈,第一个孩子开始向他身边的一个孩子窃窃私语一个短语或者一个句子。以此类推,直至最后一个孩子。接着,最后一个听到传话的孩子大声说出他听到了什么。如果把这句话与第一个孩子说的做对比,往往会让人啼笑皆非。当然,有时是因为有人故意捣乱——比如说某个孩子把动词都改成了放屁(fart)。但是,通常情况下,就算没有故意捣乱,这句话还是会变了样。原因仅仅是小声耳语不可靠。信息科学家们称其为噪声信道(noisy channel)。除非有一整套错误检查机制,否则信息在人与人的传递过程中有可能会失真。
我们可以开展实际测算和定量研究,旧文本就是一个很典型的例子。让人惊讶的是,理解这些手稿中的错误实际上与理解遗传学存在异曲同工之处。这听起来可能有点奇怪。中世纪时期或更早版本的手稿与遗传能有什么相似之处呢?从表面上来看,两者一点儿也不像:一个是人文的独特分支,一个是实验自然科学。然而,尽管这两个领域的研究共性非常少,但是其实两者都有很强的对称性。主要原因要归结为突变。
每个研究古文字学的学者对抄写员誊写时犯的错误都再熟悉不过了。这些有助于我们分辨文档出处的错误类型,其实与由聚合酶(催化DNA双链复制的蛋白质)在遗传过程中引起的错误类型相差无几。
DNA是编码蛋白质和其他东西的信息链。DNA复制其实比徒手誊写文本具备更多的优势。DNA的语言由四个字母(或者叫碱基)构成,两两互补配对:A总是与T配对,G总是与C配对。DNA复制的时候,两条螺旋双链解开,每一条母螺旋链上的字母就可以很容易地与它们的互补字母配对。然后就形成了两条新的子螺旋链,每条子链与其母链盘绕成双螺旋结构,从而各自形成一条封闭双链——互补的字母两两正确配对,从而避免了错误的发生。
然而,DNA复制有时也会出错。负责DNA链复制的化学机械组偶尔会犯错。这就是造成突变的原因:甚至是一段DNA被宇宙射线击中造成的不正确的复制。不论如何,DNA序列中引入了某些错误。例如,A变成了G,或者是更加严重的情况。依照DNA复制机制通常的运作方式,突变可以分为几类,如重复复制了一段DNA,或者少复制了一个字母。这些错误大多数不会导致任何问题,但在某些情况下,DNA一个字母的改变就有可能铸成大错,引起诸如镰状细胞性贫血这样的严重疾病。
复制文本也会出现这样系统的错误。无论是漏了一个词语还是重复抄写了一个词语,抄写员誊写时疏失犯错总是有规律的。许多错误可以像基因突变一样分门别类。尽管酶和抄写员大相径庭,但DNA复制和古代手稿复制出错,它们可都错得很有规律,而且往往错得很像。
希腊语中管一种抄写错误叫homeoteleuton。指的是当两个完全相同的词被前后隔开时,抄写员无意地跳过第一个词和两词中间的部分,直接到了第二个词。例如,《创世记》的故事结尾有如下一节文字:“到第七日,神已经完毕了一切造物的工,就在第七日安歇了他一切造物的工。”请注意,“一切造物的工”前后出现了两次。如果抄写员抄成“到第七日,神已经完毕了一切造物的工”,然后进入了下一节,这就是homeoteleuton。
在遗传学上,这种错误叫作缺失突变。AATTCGATATACGA被错误地复制成AATTCGA,这明显跳过了中间部分。
遗传和古文字学的复制过程中也都可能发生插入突变。遗传学上叫基因插入,手稿叫误写。逆转也有:手稿叫调换,遗传学上叫染色体转换。而遗传学上的点突变(DNA复制时一个碱基对被另一个错误碱基对所替换)在誊写稿子时也可能会出现。这两种情况都是因为相似才出了错。在DNA中,C和T化学性质非常相似,很容易混淆。在古希腊语里,λ与Δ看起来很像,更有可能搞错。这样的情况不胜枚举。
把这些相似之处罗列出来很有趣,同样地,它们也可以为我们所用。对每一种类型的错误来说,发生的频率不同,但是都可以预测,因此我们可以用它们来判断文本或序列的年龄。例如:如果基因序列中频繁出现一种罕见的突变,那么就可以推测这个序列年岁不轻,因为要累积这些错误需要很长一段时间。此外,错误还可以用来推断不同版本之间文本或序列的关系。如果两个文本之间相差无几,那么我们就可以推断:与差异巨大的文本相比,这两个文本更加密切相关。
推而广之,DNA序列的突变差异有助于我们了解人类的进化史,甚至是了解某一个物种。因此,手稿的变体也是这样。举一个众所周知的例子,就是定量研究杰弗里·乔叟(Geoffrey Chaucer)所著《坎特伯雷故事集》(The Canterbury Tales)中不同遗留版本之间的差异18。进行了一系列遗传学分析之后,研究人员更好地理解了最古老的版本中的内容,也就是乔叟自己的手抄副本。
他们用乔叟作品里知名度最高、最妙趣横生的系列之一《巴斯妇的故事》(The Wife of Bath’s Prologue)来追踪较之原始版本而发生的变化。一个由生物化学家、信息科学家和人文学者组成的研究团队通过现成的遗传进化领域的计算机程序,对58个不同的书作版本,也就是850行文字进行了研究,最终他们推断出了乔叟的原始版本最可能的模样。他们得出结论,乔叟的原始版本其实是未完成版,里面附有一些他想添加或者删除的内容。
对生物学方法解释文本的传播和改变有了一个大体认识之后,现在我们最想了解的问题——信息,特别是错误信息,究竟是如何传播的——也有了答案。
文本的突变从古至今皆存在,在当今的科学世界里,当事实本身被引入的时候,我们看得尤其清楚。随着时间的推移,参考文献也会发生变异。
科学家在自己的研究中引用一篇有名的论文时,常常不会追根究底地亲自读一遍。有时,科学家们只是看了看其他论文的参考文献书目,就把这个参考文献列在了自己的文章里。不幸的是,这个懒办法太常见了,如果一个科学家引用得不正确,那么一时之间,引用就有了变异隐患。如果其他科学家一个个也只看参考文献而不管原始文本,那么错误就会蔓延开来,不断扩散。正如我们可以了解古老的手稿如何传播错误,研究这些突变可以让我们了解被引用的文章有怎样的历史。
美国加州大学洛杉矶分校的两位电气工程教授米哈伊尔·西姆金(Mikhail Simkin)和乌瓦尼·罗伊乔杜里(Vwani Roychowdhury)对科学文献里此类事实的歪曲频率进行了研究19。基于“科学家信手拈来几篇最近读过的论文”这一假设,他们构建出数学模型,然后发表了一系列的论文来探讨可能的发生机制。假设懒惰无疑是对的,但似乎类似的原因也可能是真理。
西姆金和罗伊乔杜里最后用简洁明了的数字总结道,只有约20%的科学家在引用文章时亲自阅读过。这意味着,4/5的科学家在引用出版物来支撑自身论点的时候,从来没有花时间去核查过文献的真实性。通过研究这些突变,我们可以反向追踪错误,并且深入表象看到科学家之间知识传播的真相。
再就谬误传播举一个轻松的例子。在20世纪90年代末期,如果你有电子邮箱的话,你可能收到过下面这样的邮件:
写给每一个认为每年税收应拨1.12美元给美国国家公共电台(NPR)/美国公共电视网(PBS)的人。……接下来是请愿书。如果你签了名,请转发给其他人。如果你没有签名,请不要删除邮件——发送给下面这个邮箱地址:XXXX @ XXXX.EDU.PBS,NPR等艺术门类正面临着大幅的资金削减。
如果你还没看明白,那么我告诉你,这是一封连锁信,也就是说收信人必须转发给他人。这封信还不算阴险,有些阴险的邮件公然戏弄,诸如承诺转发就得到好运,忽略就招来厄运(或死亡)。虽然邮件满口胡言,但是类似的邮件从未消停过。
再说一次,这些终将消失的信件是如何传送的,搞懂了这一点,认识错误的传播就容易了。这正是两位计算机学家戴维·立本-诺埃尔(David Liben-Nowell)和乔恩·克莱因伯格(Jon Kleinberg)试图回答的问题。
立本–诺埃尔和克莱因伯格编制了大量不同版本的连锁信,以及一封旨在组织反对伊拉克战争的请愿书(所有这些信件都是假的,都是骗局)。在一个网站上,他们请志愿者搜索自己的电子邮件存档,收集各种版本的连锁信。他们的数据库中,风格各异的文本突变特点一目了然。他们在论文20中写道:
有些收信人对他们邮件里的名字进行了重新排序,你会发现,这与生物界因序列变异造成的染色体重排极为相似。我们观察点突变的例子(某些请愿书中更换了政治人物的名字)、插入(缺失)突变(请愿书中位于列表中间的1~5个名字时有时无)、重复突变(某些请愿书中重复的2~20个名字有时在列表中紧紧相邻,有时出现在数百个名字以后)、重排突变(在一封请愿书中,有两对的2~3个名字相对于含有它们的其他邮件发生了位置交换)、杂交突变(两封请愿书中最后的名字根据相同前缀混在了第三封邮件里)。
但是,正如这些突变和错误有助于理解知识的传播,这些信件的其他部分有助于理解信息的分支和传播。从发件人可以看出,谣言是如何在人群中传播的。信件越被转发,积累的发件人就越多,于是研究人员就能够跟踪其转发情况,一探究竟是谁把信转发给了谁。
他们的发现与我们对社交关系网的习惯性认识并不一致。虽然我们都处在高度聚合的社会圈子,这个圈子里的每一个人都认识一小撮活跃的人(还是六度人脉所说的),但是这些连锁信并没有像流行病一样飞速蔓延,相反非常平淡无奇,它们只是连续一次转发给了一两个人,而不是一转发就成百上千。因此,尽管转发了那么长时间,它们也只是引起了一小撮人群的骚动,并没有造成任何快速而大规模的灾难。
这可能是一件好事。虽然一个事实或者一个错误消息(这个更加重要)——无论是菠菜中的含铁量还是长颈恐龙的学名——可能具有深入人心的能力,但是这并不意味着它一定会广为传播。但是危害也会有,错误的消息可能一直都不会消散,它可以从一个人那儿传到另一个人那儿,持续的时间远远超过我们的想象,即便它只影响了人群中的很小一部分人。
令人高兴的是,通常可信的消息和新闻比假消息和假新闻的传播速度更快21、更为广泛。但是无论错误传播的速度是快是慢,斩草除根都是一个非常困难的过程,因为在日常生活中我们很难跟踪到错误的源头,也很难让每一个人都认清自己的每一个错误。
即便有了现代技术,事实也不会在一瞬间扩散开来。它们通过社会关系网以一种具有数学规律、可预测的方式传播。在这个过程中,事实可能会发生变异,变成谣言,又再次变异,变得真实可信。错误可以长久地传播,它超乎我们的想象。很快,一个领域就会鱼龙混杂,既有知识,也有不消停的谬误,因此人们很难分辨真真假假。
幸运的是,我们还有一个简单易行的补救方法:那就是在传播信息之前,先进行批判性地思考,检验它的真实性。错误传播的根源通常在于不知道消息从何而来、消息是否接受过检验。我们往往不加以怀疑。
现代实证科学知识萌芽于16、17世纪,这一时期被人们称为科学革命,它见证了许许多多的进步,如牛顿的万有引力理论、波义耳的气体定律、胡克的细胞构成说以及英国皇家学会(Royal Society)的诞生(这个组织至今尚存)。这个时期的科学精神推动了大量新知识的产生,反驳了就算没有几千年也已经存在了几个世纪的观点。科学革命使得当今知识的瞬息万变成为可能。
但是这一努力最可圈可点的还是试图消除错误,并提出一种传播正确知识的新方法。许多英国皇家学会早年发表的论文都致力于识别错误,根除误解,以及检验那些听起来好得出奇的故事的真实性。例如,1753年英国皇家学会的《哲学汇刊》(Philosophical Transactions)上发表了一篇长标题论文《对西班牙西印度金矿发现的一种白色金属物质的试验性检测》(Experimental Examination of a White Metallic Substance Said to Be Found in the Gold Mines of the Spanish West-Indies, and There Known by the Appellations of Platina, Platina di Pinto, Juan Blanca)。无疑,一些科研学者听说过这些金矿里挖出来的神秘白色金属,了解它的属性(结果是铂金),而且觉得检测它十分重要。
凡是听到的消息,他们都坚持不懈地试图检验并消除其中的错误。重要的是,他们不会藏匿这个新的知识。相反,他们会进行印刷出版,通过欧洲自然哲学家的松散关系网开展广泛的传播。
一个人的知识局限于他自己可知的东西,依赖于传播到自己这里的信息。正如我们所知,这种传播依赖于社交关系网,有时由于人性的弱点,传着传着信息就失真了。但是只要我们坚持科学革命精神,不轻信,不谣传,我们就不会被错误淹没。
从古登堡时代的美因茨发展到当今这个社会,技术取得了巨大的进步,我们传播知识的能力也不可同日而语,但即便如此,有时事实的传播范围还是不尽如人意。隐藏的事实就是一个有趣的例子。
[9]曲线下的面积即曲线下积分,等同将被积函数近似为直线函数,被积的部分近似为梯形。——译者注[10]恐龙一词在希腊语里是“恐怖蜥蜴”的意思。——译者注
第6章 隐藏的事实
我的父亲哈维·阿贝斯曼(Harvey Arbesman)是一位皮肤科医生,也是一位流行病学家。他一半时间给病人看病、治疗皮肤癌,一半时间做研究。作为一名研究人员,他喜欢意想不到的假设和反直觉理念。所以,他发表了许多诸如恶性黑色素瘤是否与越来越多地使用抗菌肥皂1有关、吃乳制品是否与产生痤疮有关2等主题的文章。他是个迎难而上的人。这种研究风格让他进入了创新中心(InnoCentive)公司。
阿尔菲厄斯·宾厄姆(Alpheus Bingham)刚开始思考专家以及他们解决问题的方式时,他在礼来制药公司(Eli Lilly)担任研究和发展战略副总裁。他发现,虽然一个专家解决一个棘手的问题可能要花20%的时间,但是这并不意味着把这个任务交给5个专家就会有结果。搞不好5个专家最后都败下阵来。
但是如果是来自更广领域的专家,又会怎样呢?宾厄姆认为,那些想要孤军奋战来解决技术问题,但获得成功的概率又很小的人们很可能有一条“专业知识的长尾”(这是他的原话)。按照这样的逻辑,只要你的群体足够大,问题迎刃而解的机会就非常大。道理听起来说得通,但是在实际工作中真的可行吗?
于是宾厄姆在礼来公司的支持下创建了一个独立的公司——创新中心公司,其目的就是想一探究竟。创新中心公司的角色是组织或企业之间的信息交换中心,他们有问题要解决,又有解决问题的人,这些人来自生活中的各个领域,他们对解决问题兴趣盎然,聚在一起又比专家更为出色。
宾厄姆的直觉果真敏锐:创新中心公司成功了。它的成功是因为它听取了来自不同领域的见解,借鉴了来自不同领域的解决方案。通常来说,解决问题的人所具有的技术学科背景与待解决问题的所属领域接近,但是又不完全相同。正是因为这个差异的存在,信息的输入和输出才成为可能。一个领域里众所周知的事实或解决方案可能是另一个领域的蓝海。因而,在一个领域算不上专家的人能够把他们那个领域的知识引入这个领域。在创新中心公司,问题的解决往往是通过事实的重组——凑在一起的想法迸发出了新点子。
例如,罗什(Roche)提出了一个困扰他们15年的问题3之后,他的团队仅用了60天就把公司已经试过的所有解决方案总结了出来。不但如此,他们提出的诸多建议里,还有一个切实可行的解决方案,这是公司以前没有想到的。美国航空航天局(NASA)与创新中心公司合作4之后,很快就解决了30年来一直困扰他们的问题!与其固守在同一领域25年,你不妨向一个更大的群体提出疑问,然后从另一个渠道获得意想不到的答案。更重要的是,很有可能是一个意想不到的领域。
所以,我的父亲想看看创新中心公司有没有什么有趣的问题他可以设法解决。这家公司最初由工程师、化学家和其他技术上志同道合的人组成,后来它迅速扩大,研究领域也更加广泛,涵盖了生命科学,所以我的父亲看到创新中心的网站感到非常亲切。
在翻看创新中心公司的电子邮件时,我的父亲被其中一个问题激起了兴趣。Prize4Life基金会,一个致力于治疗肌萎缩侧索硬化症(amyotrophic lateral sclerosis,下文简称ALS,也被称为卢伽雷氏病)的非营利组织,正在悬赏助力于最终治愈该病的人。
完全治愈ALS是很困难的。最终的治愈方案本质上是不可知的,因此既然不能一劳永逸,Prize4Life索性把这项终极目标分解成了多个小的任务。首要问题是他们要研发一种叫“生物标志物”的东西,用于诊断这种疾病的发展进程。即便是无法治愈的疾病,也肯定有办法测出个体的患病历程。例如,在艾滋病研究中,生物标志物就是细胞因子(免疫系统中发现的小分子)的水平。然而,ALS还没有任何已知的生物标志物,不论是基于化学品还是病人的体征表象。判断病人处在此病的具体哪个阶段只能靠观察病人当前的行为能力,这与病人尚能存活的时间息息相关。
Prize4Life为创新中心公司找到非侵入性的生物标志物的挑战者准备了15 000美元的奖金。该组织还有一项挑战,那就是如果生物标志物在患者测试中确实奏效,将获得100万美元奖赏。
我的父亲并不是一位神经学家,他在神经退行性疾病领域并不专业。不过,他在揭秘公共知识方面可是专家。
在20世纪80年代中期,一位名叫唐·斯旺森(Don Swanson)的图书馆学教授意识到,我们自视甚高的知识组织能力正变得越来越弱。虽然相比于林奈(Linnaeus)和他的生物分类学时代,我们确实取得了长足进步,大量的信息已经数字化,因而今天困扰我们的问题变成了信息的筛选。
不要忘了那还是20世纪80年代中期。第一个图形浏览器还是10年之后才出现的。但是斯旺森很有先见之明,他知道,信息筛选绝不是小菜一碟,哪怕我们对所有的获取信息都具有掌控力,也仍然有很多的知识会被我们忽略。
虽然技术知识不断丰富(如第4章所述),但是有时其他领域的知识会发生新旧交替,比如科学事实被推翻。有时候我们的知识会发生大倒退,比如亚历山大图书馆被摧毁。同样地,也有一些知识往往就潜藏在显而易见之处,尚未被人们发现和运用。斯旺森称其为“隐藏的公共知识”,还记得第5章里讲过的没有广为流传的知识吗,隐藏的公共知识就是其中极为特殊的一种。
知识一直存在却尚未被发现,这到底是什么意思呢?如果是结果导向,那这个问题并没有什么好研究的——这一类知识的具体实例我将在后文中继续讨论。但是斯旺森要讨论的是那些价值被削弱了的研究,因为这些研究成果不能够与其他研究成果相结合。试想一下,在一个领域的科学文献中,有一篇论文说A和B有某种联系。一本少有人阅读的杂志(或者是背景完全不同的人才会读的杂志)里又说有研究表明B和C有某种联系。但是由于没有人会同时阅读这两篇论文,所以结果不言自明——A和C的联系将永远不为人知,像一个未知事实一样一直隐藏在文献里。
难道真的会这样吗?斯旺森认为,这种情况不但存在,而且比比皆是。他结合了一项新的发现对此进行论述5:斯旺森把两项完全不相干的研究成果联系在了一起,一项研究表明,食用鱼肝油能够促进血液循环,另一项研究表明,血液循环不畅与雷诺综合征有关。在此之前,除了一些零星的报告,一直没有人想到把这两个领域结合起来,更没有人意识到存在一种用鱼肝油治疗雷诺综合征的机制。虽然不是生物学家,斯旺森还是在一本医学期刊上发表了自己的研究成果。
在此基础上,斯旺森不断6提出梳理新兴数字化文献的方法。他加大了对MEDLINE的使用,MEDLINE是一个由国家医学图书馆运营的在线数据库,位于美国国立卫生研究院。有了MEDLINE,斯旺森能够快速搜索医学关键词,然后把孤立的研究成果联系起来。20世纪80年代末期,这样的数据库还处于起步阶段,但是斯旺森发现了它们的潜力。
1996年,也就是他发表论文整整10年之后,斯旺森与合作者尼尔·史默海瑟(Neil Smalheiser)又试图通过计算机资源来重新审视隐藏的公共知识7,想看看它仅仅是个例,还是已经成为一个具有广阔应用前景的普遍现象。在这项跟进研究中,他们突出了6个例子,这些例子揭示出诸如镁缺乏与偏头痛、睡眠习惯与磷脂酶(一种酶)等有趣的联系。尽管强大的数字化信息能够揭示一些这样的联系,但是这还仅仅是冰山一角。
我的父亲曾经学习过信息科学,也深谙隐藏的公共知识这一理论。于是,他这位没有任何神经学背景,但重视隐藏的公共知识的皮肤科医生做了这么一件事:他查阅神经学文献,想探索ALS与皮肤之间不为人知的关系。梳理了很多篇论文之后,他发现了一本著于1880年的书,里面描述了第一例ALS。那位作者撰文指出,虽然患上这种新近发现的病的病人卧床不起,动弹不得,但是他们的身上没有褥疮。
于是这本旧书又把我的父亲引向了用ALS患者的活组织切片来检查皮肤结构组织的报告。神经科医生在报告里说,ALS患者皮肤的伸展性(弹性)减弱造成了某些特定的化学差异。这些科学家已经发现,尽管ALS是一种神经系统疾病,但是它可能会影响包括皮肤在内的其他身体部位。我的父亲意识到,这是一条关键线索。
我的父亲知道,在皮肤科领域,有许多皮肤疾病会减弱皮肤的弹性。而ALS与这些疾病不同的是,尚无成熟的定量测量方法可以反映ALS引起的皮肤弹性变化。于是,他把这两个没有交集的领域结合在一起,并提出皮肤弹性测量技术可以用于非侵入式的监测ALS患者的生化改变。完成这篇文章后,我的父亲把它提交给了创新中心公司。
结果他的研究携同其他4个假设胜出了。
奖金到手后,我的父亲找到了哥伦比亚大学皮肤病与神经病科的研究人员,建议他们展开合作,检验一下他的假设。于是他们对ALS患者进行了初步试验,并且发现我父亲所说的隐藏的公共知识是正确的:随着病情加重,患者身上会发生一些可以量化的改变。
虽然我的父亲没有笑到最后(一个哈佛团队最终获胜),但是他和他的团队所做出的贡献也为他们赢得了金钱奖励。此外,一些神经学家目前正在探索ALS和皮肤之间的关系。我的父亲用亲身经历告诉我,联系在一起的隐藏知识是多么威力无穷。
隐藏的知识有很多种形式。最基本层面的隐藏知识所包含的信息是未知的,要么只为少数人所知,实际上有待显露。而其他时候,隐藏的知识所包含的事实一部分是公共知识,而一些知识需要与其他信息片断结合才能产生新的事实。知识可以隐藏的方式多种多样,而唯有当这些知识被全面认识和利用的时候,新的事实才能创建。
不过,隐藏的知识——以及事实的挖掘——并不是阅读大量的论文、抱最大的希望就成了。新的事实如何为人所知,这是一门科学。
创新中心公司教给我们一条关于隐藏知识的基本规律:专业知识的长尾——大量普通人比专家更有希望解决问题8。创新中心公司有待解决的问题正是那些专家解决不了的问题。甚至在计算机和大型科学数据库出现以前就是这么回事。在人类历史上,不论在什么时候,群策群力揭示隐藏知识都不失为一个好主意。
创新奖这一概念背后就是类似的思路。英国政府曾经悬赏公海经度的准确测量方案——1714年公海经度的概念被提出,1773年奖金授予约翰·哈里森(John Harrison)——但是这肯定不是头一回。此前,其他政府也为经度测量提供过悬赏方案:荷兰是在1627年,西班牙更早,是在1567年。他们希望通过扩大参与人数让解决方案早日出现——也许靠的是集思广益。
1771年,法国科学院有奖征集一种蔬菜,这种蔬菜在饥荒时能提供均衡营养,避免营养不良。两年之后,安托万·帕尔芒捷(Antoine Parmentier)赢得了该奖项,他提出的建议是马铃薯。现在我们听起来一定觉得愚蠢至极,马铃薯营养丰富还用他说吗?但是在那时,法国人并不知道马铃薯,因为马铃薯原产自南美洲。而那些知道马铃薯的人还以为是它导致了麻风病的暴发。帕尔芒捷对淀粉的研究以及他开拓知识蓝海的意愿,最终让欧洲人明白了一个事实,那就是马铃薯营养丰富,而且不会致命——尽管世界其他地区的人们早就知道了。
不过,虽然在奖项的激励下,原本隐藏着的创新和想法浮出水面,知识传播的速度也大大加快,但不幸的是,在知识的运作过程中隐藏的事实还是太多了。
在1999年的时候,阿尔伯特–莱兹洛·巴拉贝西(Albert-László Barabási)和雷卡·阿尔伯特(Réka Albert)合著了一篇著名论文,这篇文章发表在全球知名科学期刊《科学》(Science)上,讲的是一个被称为偏好依附(preferential)的模型。该模型的目的是创建一种特定的关系网模式——又名青睐度长尾——原理是富者愈富,也就是说,人脉广的人所拥有的人脉会越来越广。例如,在Twitter[12]上,少数人的追随者以百万计,而大多数用户的追随者为数不多。这篇论文假定,新用户往往会先看看关系网里的整体情况,而之后他们更有可能联系最受欢迎的人,如此一来,你就会明白为什么我们在Twitter或其他地方所看到的关系网是这样一番景象。他们通过分析各种各样的数据集,又运用了数学方法,最终得出了这个严谨的结论。
但是很遗憾,最先发现这个模型的不是他们,而是德里克·普赖斯。这位科学计量学之父早在20世纪70年代就发表过一篇文章,表示通过类似的方式就能让一篇科学论文获得更多次的引用。但是巴拉贝西和阿尔伯特不知道普赖斯做过这么一件事。
普赖斯也不是做这件事的第一人。赫伯特·西蒙(Herbert Simon)是一位著名的经济学家,在20世纪50年代就已经有了这个想法。碰巧乌迪内· 尤乐(Udny Yule)在几十年前也发表过相同的观点。
实际上,偏好依附这个概念有许多别称。在社会学中,由罗伯特·默顿所创的叫马太效应(Matthew effect);当涉及城市和公司的成长时,叫吉布莱特定律(Gibrat’s Law)。
让我们说点儿更普遍的。米哈伊尔·西姆金和乌瓦尼·罗伊乔杜里,就是探索了科学引文中的错误的那两位科学家9,他们还研究了一些被广泛用于解释概率分布的物理模型,不仅包括连锁反应,还包括收入分配的模型。他们的分析长达35页,详细探讨了这些模型为什么会被一次次再造,最终,他们在一个大的表格中总结了这些连续的再造。例如,他们发现,分支过程最先发现于19世纪40年代中期,在19世纪70年代又被重新发现,随后又在1922年、1930年、1938年、1941年和 1944年被一次次发现。保罗·厄多(Paul Erd?s)和阿尔弗雷德·莱利(Alfréd Rényi)于1960年写出的厄多–莱利随机算法,是由化学家及诺贝尔经济学奖得主保罗·弗洛里(Paul Flory)在1941年首次验算的。正如斯蒂格勒的得名由来定律(Stigler’s Law of Eponymy)所说:“没有一项科学定律是以其发现者的名字来命名的。”自然,斯蒂芬·斯蒂格勒(Stephen Stigler)的定律应该归功于罗伯特·默顿。
特别是在战争时期,这样的极端例子有很多。著名的物理学家理查德·费曼(Richard Feynman)与另一位物理学家朝永振一郎(Sin- Itiro Tomonaga)同时被授予诺贝尔奖。这是因为在“二战”期间,朝永振一郎在日本、费曼在西方,两人天各一方,但是他们各自的独立研究却得出了相同的结果。
类似的情况在冷战的几十年间尤为显著。在20世纪的后半期,西方科学家与苏联科学家的研究经常重复。在计算机科学领域,一些与棘手的数学问题有关的观念10也是在美国和苏联同时出现的。此外,东方和西方都自主研发出了前体激光。从广义上说,知识对大半个世界成功隐身,而重复是自然而然的结果。
我们知道的重复发现太多了,一点也不稀奇,互不知晓的情况也不只战争时期(或冷战时期)才有,我们似乎也见怪不怪。这被人们称为多次独立的发现,它们中的一些已经发生过5次甚至5次以上,这让创新成为拦也拦不住的事。同步创新的经典例子有:电话的发明,两个人在同一天申请专利;氦的发现;甚至还有自然选择学说(the theory of natural selection),达尔文和阿尔弗雷德·罗素·华莱士(Alfred Russel Wallace)都提出来了。
在上述例子中(尽管并非所有情况都如此),同步创新之间或多或少都错开了一些时间:一方取得了一项新发现,一方却浑然不知,结果有时在几年后,后知后觉的一方才取得这项发现。如果知识广为传播,那么这样的事情根本就不会发生。但是,也可能有其他原因使得知识隐藏起来。在科学领域就有这样的例子,那就是知识太超前,所以我们看不见。
网络上有一个怪圈叫作戈德温法则(Godwin’s law)。它说的是如果在线辩论不断激化,那么参与者把对方说成纳粹或希特勒的概率趋近于1。按照这种说法,要是人们讨论的是莎士比亚,那么也许争辩到最后,人们说他是冒牌剧作家的概率会非常大。
我无意讨论威廉·莎士比亚是不是真的创作了那些著名戏剧。然而,这场讨论的导火索——把莎士比亚的出身和教育水平与他的文学作品混为一谈——并非文学史上才有。事实上,包括数学和科学领域在内的所有领域都有它们的“莎士比亚”。凭借他们的出身,我们觉得“莎士比亚”们似乎不大可能取得那样的成就。而他们的成就让我们明白了知识如何向前发展。其中一位“莎士比亚”就是乔治·格林(George Green)。
乔治·格林是19世纪的一位磨坊主,生活在英国的诺丁汉镇。1801年,也就是他8岁的时候,他上过一年学,然后他去了他父亲的磨粉厂和面包房上班。直到他短暂的一生快结束时(他去世时47岁),他仍然默默无闻。但是,这位与谷物和烘焙食品打了一辈子交道的无名小卒,竟然在数学和物理的方方面面颇有建树。他最有名的两项贡献被人们叫作格林定理和格林函数,后者的复杂程度足以让许多数学家和物理学家抓耳挠腮。
他的第一本书《关于数学分析应用于电磁学理论的一篇论文》(An Essay on the Application of Mathematical Analysis to the Theories of Electricity and Magnetism)引出了上述两个概念,并于1828年出版。坦率地说,没人知道1801年到1828年间究竟发生了什么事,又是什么促使格林为最终用于量子力学的数学奠定了基础。当时在诺丁汉,倒是还有一个人也接受了数学训练,虽然我们不知道格林和这个人交流过没有,但是他们俩确实住得很近。坦率地说,似乎也只有这个解释说得通。且不管格林是如何掌握高等数学知识的,爱因斯坦曾经表示,格林的贡献超前于他的时代数十年。正是因为他那一套太过先进,而且与主流思想相距甚远,所以一直到1841年格林去世时,他的理论尚不为人知。
格林有如此遭遇,但这位数学物理领域的“莎士比亚”并不是个例。人们意识不到知识,或者知识不能融入主流,这样的例子太多了,要么是因为提出这些新知识的人太超前于他们的时代,要么就是他们的出身和背景让人们难以慧眼识人才。例如,公认的现代遗传学之父格雷戈尔·孟德尔(Gregor Mendel)去世时默默无闻。直到他去世多年以后,又有科学家要做类似的实验时,才偶然发现了这位奥古斯丁牧师的研究成果。然而,他为基因概念的确立和离散性状遗传的数理研究奠定了基础。
还有查尔斯·巴贝奇(Charles Babbage),他是可编程计算机原理的创造者,但是很不幸,他生活在工业革命时期,那时计算机的造价过于昂贵,所以他无法实现自己的发明。他的“差分机2号”(Difference Engine No. 2)的某些构造其实与现代计算机的内存和处理器完全一样。
所以说,事实可以隐匿很长一段时间,不管是因为它们太过先进,还是因为它们来自其他学科。但是,有没有一种方法可以测算这个时间呢?换句话说,能否知道知识每隔多久会飞跃一次呢?
最近,《内科医学年鉴》(Annals of Internal Medicine)对此进行了一项严谨的定量研究。美国约翰霍普金斯大学的卡伦·罗宾逊(Karen Robinson)和史蒂文·古德曼(Steven Goodman)想要研究一下,科学家们在进行临床试验之前要花多长时间才能发觉先前已有的研究11。如果科学是随着信息的积累一步步发展的,那么考虑一切先前的发现就是顺理成章的事情。但是,科学家真的是这样做的吗?我说了这么多,答案也显而易见,当然不是。那么,我们到底忽略了多少前人的发现呢(或者根本一无所知)?
科学家在一个特定领域进行临床试验,而后发表成果时引用相关文献的情况如何,这就是罗宾逊和古德曼要研究的内容。例如,如果开展了一项与心脏病治疗相关的临床试验,那么罗宾逊和古德曼就会看看它引用了多少该领域内以往的试验。虽然临床试验无须引用先前进行的每一个试验,但是给出一个相关文献概述还是有必要的。但是,如何确定哪些文件相关,哪些文件不相关呢?是否会被指责为主观臆断呢?是否具备特定领域所需的各种专业知识呢?罗宾逊和古德曼用一个妙招规避了上述可能存在的问题:看荟萃分析[13](meta-analyses)。
荟萃分析是综合分析单项研究成果从而获得更大发现的一种研究方法。荟萃分析对以往的研究成果进行统计学的合并,以找寻它们的共性或者更精确的结论。荟萃分析与第3章中提到的不同元素的热传导分析很相似,后者是从众多文章的结论中更好地了解元素的导热情况。
罗宾逊和古德曼假设荟萃分析汇总了所有的相关试验,然后他们对新的研究逐一进行荟萃分析,试图搞清楚每一个新的研究提到了多少荟萃分析中的研究。
结果在意料之中。科学家发表论文时对相关试验的引用率低于25%。一个领域的论文越多,引用以往论文的新研究占总研究的比例就越小。令人震惊的是,无论之前该领域做过的试验有多少,一般情况下,有幸被新研究所引用的都不足两个。
除了相关研究的引用比例低以外,他们还发现了一种系统性偏差:越新的研究越有可能被提及。鉴于我们在第3章中讲过引用的衰减和过时,这一点应该不难理解。科学家们还可能会有目的性地选择一些研究来引用。但是对论文整个的时效性、相关性和必要性而言,这其实是不利的。
试想一下,如果我们把一个领域所有的知识汇总在一起,如果科学家们真的阅读了所有与他们的研究成果相关的分析,那么事实会发生什么改变呢?会和现在的情况有什么差别呢?
事实证明,会截然不同。
1992年,来自哈佛大学附属医院和学校的一个研究小组12进行了一项新型的分析。约瑟夫·刘(Joseph Lau)和他的同事们查阅了之前所有与心脏病发作相关的随机临床试验文献。具体说来,这些研究人员对用一种叫作链激酶(streptokinase)的药物治疗心脏病的相关试验进行了逐一研究。梳理文献后,他们发现,从1959年到1988年,一共有33个临床试验运用了这种治疗方法并且检验了其有效性。
为什么到1988年这些试验就停止了呢?这是因为1988年公布了一项重大研究成果,并最终证明静脉注射链激酶可以治疗心脏病。但是刘和他的同事们又想出一则妙计。
刘将这些试验按时间顺序排列并逐一检查,然后有了一些有趣的发现。想象一下,你刚刚完成了一种药物的临床试验。而你不仅仅对自己的试验结果进行了分析,你还把它与所有前人的研究数据结合了起来,于是数据集更大、更丰富。刘和他的同事们发现,如果研究人员能把分散的事实结合起来,那么他早在1973年就应该得到一个统计上的显著结论了,而非在1988年那项重大研究成果发表之后才知道静脉注射链激酶的效用。
这种类型的分析被称为累积荟萃分析。刘和他的同事们意识到,与其把荟萃分析视为单纯的聚合过程,不如把它视为一个棘轮,因为每一项研究都让我们离科学真相更近一步。科学最终应该是这样的:知识一点点积累,一直向前发展,至少尽我们所能扫除一切谬误。刘和他的同事们让我们明白,认真对待知识累积,就是要切实结合手头上所有已知的事实,再看看有什么新的事实可以学习。
唐·斯旺森将科学领域本应重叠但没有重叠的论文结合起来,而刘和他的同事们综合与科学领域非常相似的分散领域,进行着有史以来最为细致的研究。如果使用累积荟萃分析,隐藏的知识在15年以前就该浮出水面,提高无数人的健康水平。
现代技术已开始辅助累积荟萃分析的发展,现在我们甚至可以利用计算机技术对斯旺森的方法进行大规模运用。
现在我们还力有不逮,无法在人类知识导入计算机的一个星期后就取得斐然成就,堪比科学万神殿中的爱因斯坦或牛顿还只是一个美好愿望。但是,计算方法是有帮助的。与人类协力——人类仍然需要去粗取精——这些程序可以把早该出现交集的科学领域综合起来。在这些自动化技术的帮助下,不同领域交织在一起,于是互联互通变得清晰起来。
2010年秋天,一个由荷兰科学家组成的团队发表了“CoPub发现”(Copub Discovery)这一项目研究成果。他们之前创建了一个基于文章共有词的庞大数据库13。例如,如果两篇论文均含p53基因和肿瘤这两个关键词,那么相对于不含这两个关键词的论文来说,这两篇论文的联系更为紧密。“CoPub发现”项目14创建了一个新的程序,这个程序可以挖掘出数据库中基因和疾病之间的未知联系。
从本质上讲,“CoPub发现”项目就是把唐·斯旺森用于检测鱼肝油和雷诺综合征之间关系的方法自动化了,而且更具规模。“CoPub发现”项目可以检测数以千计的基因和数以千计的疾病之间的关系、基因通道,甚至不同药物的有效性。这自然而然地带来了更多的发现。此外,“CoPub发现”项目也有一套严谨的检查系统,专门筛选误报情况,以防程序无中生有产生一些关联。
“CoPub发现”项目成功了!它找到了基因和疾病之间众多令人兴奋的新联系,也是文献中前所未有的新联系。
例如,有一种疾病叫作格雷夫斯病(Graves’disease),通常会导致甲状腺功能亢进症,也就是说甲状腺产生了过多的激素。该病患者会怕热、眼睛突出,看起来像暴眼人。在对大型数据库的自动研究中,“CoPub发现”项目发现了一些可能与格雷夫斯病有关但无人提及的基因,也就是与细胞程序化死亡相关的一大簇基因。
细胞程序化死亡其实没有听起来那么可怕。我们的身体要想正常工作,往往需要个体细胞死亡,而在我们的细胞里就有一套量身设计的基因。例如,在胚胎发育过程中,我们最初是有手蹼的。但是在出生之前,手蹼细胞会接收到死亡信号,于是我们的手蹼消失了。只有在信号出现错误或这些基因不能正常工作的情况下,我们的手和脚才会有蹼。
“CoPub发现”项目通过计算推测,如果这些细胞程序化死亡的基因不正常工作,那么可能将引发一系列问题,最终导致格雷夫斯病。“CoPub发现”项目还发现了一些药物和疾病之间的关系,并确定了一些目前所使用的药物的未知作用。例如,一种用于治疗某种疾病的药物可能会拥有人们未知的用处。“CoPub发现”项目和隐藏的公共知识这一组概念正好让我们看到了这样的药物还可能有什么其他效果。
“CoPub发现”项目的研究人员成绩斐然。他们不但给出了工具,提出了众多计算生成的假说(这本身就很了不起了),他们还在实验室里实际检测了一些发现,想看看这些新发现的知识是真是假。比如,“CoPub发现”项目预测15,有两种药物——dephostatin和丹宁卡(damnacanthal)——可以用来减缓一组细胞的复制和扩散。他们发现这些药物确实有用——剂量越大,细胞的生长就越大程度地被抑制。这个概念被人们称为药物再利用,也就是说,隐藏的公共知识证明了一种药物可以脱离它原本的用途,来治疗一些截然不同的病症。药物再利用中最有名的例子要数伟哥(Viagra),它本来是用于治疗高血压的。伟哥治疗高血压确实有效,然而许多临床试验的参与者报告说出现了有趣的副作用,所以临床试验结束之后,一些参与者保留了伟哥药丸。
计算发现把一条条知识结合起来然后形成新的结论,这样的例子还有很多。从用于在专利里寻找隐藏模式的软件16,到致力于药物再利用的众多计算机系统17,这样的方法越来越多。数学领域甚至有一整套自动证明定理。只需各种数学界众所周知的公理和定理以及一组逻辑推理规则,计算机就能自如地综合并且证明新的公理和定理。
有了足够强大的计算能力,这些系统就能够化腐朽为神奇。当然,大部分的输出结果平淡无奇,但它们也可以输出新鲜有趣18且可证为真的数学语言。自动数学家程序是最早的例子之一,是道格·莱纳特(Doug Lenat)于20世纪70年代编写的。这个程序构建了一些规律和等式,莱纳特甚至声称,自动数学家程序重新发现了在抽象数字理论中被称为哥德巴赫猜想(Goldbach’s Conjecture)的问题(不过很遗憾,程序没有解决这个问题)。哥德巴赫猜想说的一个精妙假设:任一大于2的整数都可写成两个质数之和。举例来说,8=5+3,18=7+11。这一类程序为其他自动化证明系统奠定了基础,如第2章中我们简要提过的TheoryMine,那个不花啥大钱、用你或朋友的名字命名可证的新数学定理的网站19。
TheoryMine是由爱丁堡大学(University of Edinburgh)信息学院的一些研究人员创立的。有些人可能为用自己名字命名的东西兴奋不已,但却忽视了细节,而TheoryMine给你的不只是定理,还有定理推导的全过程。所有的定理都与函数有关,而且大多数的人对其并不了解。然而,现在普罗大众都能接触到发现一则隐藏的公共知识背后的机制,这真不错。
除了自动的发现,现在甚至还出现了自动科学家,一种能够检测数据规律和创造更抽象的发现的软件。美国康奈尔大学(Cornell University)的一位研究生迈克·施密特(Mike Schmidt,现为Nutonian公司总裁)和康奈尔大学的教授豪德·利普森(Hod Lipson)一起编写了一个名为尤里卡(Eureqa)的计算机程序。 它与我之前提到的其他项目有点儿不同:输入大量的数据之后,它可以在无意义的混乱事实中挖掘意义。
尤里卡程序采集数量庞大的数据点。比方说,你正在学习桥梁构造,并试图理解为什么它会摇晃。或者是一个生态系统里捕食者和猎物数量的相对变化情况。你把收集到的所有数据输入尤里卡——例如,每一天有多少捕食者,有多少猎物——尤里卡程序就会为你探寻其中的意义。
尤里卡程序使用的是一种叫作进化编程的简单技术;这项技术因为自身的计算能力而显得非常强大。尤里卡程序随机生成种类繁多的方程,它们可以解释数据变化之间的关系。例如,它会根据你系统里输入的数据创建一个数学公式,并展示公式是如何产生的。当然,如果给定的是一个随机方程,那么它绝对不会显示出任何公式。不但不会解释数据,还会出现乱码。
但是,随机生成的东西也无须令人满意。相反,可以演变出一大堆随机方程。正如生物进化有所进展(形成一个与环境非常适应的有机体),数字化有机体也是一样。在这种情况下,方程可以重写、变异、稍微调整公式等等。这些都是为了解释数据集。方程与数据越吻合,越有可能重写。
一遍遍重复之后,就得到了一大堆又好又合适的方程,这些公式和最初的比起来已经面目全非,它们是随机产生的。尤里卡程序甚至可以推出一些方程式,这些方程式衍生出的发现与能源保护(热力学的基础之一)观点的复杂程度不相上下。
我们手边已有的知识越多,能提供给这些自动化研究程序的原始资料就越多,如此一来,这些程序反馈回来的数据和新的事实就越多。
因此,我们要想确保这些自动化出现程序有最大量的数据可用,就要搞清楚知识如何代代相传。问题是,大部分知识真的保留下来了吗?还是说,我们用以探寻隐藏事实的原始资料会不会只是我们真知灼见中残存的部分?
中世纪可能不同于我们中的一些人学到的黑暗时代(Dark Ages),是一个科学和创新的时代。欧洲人推动了医疗技术的发展,在风能和火药等领域都取得了长足进步。
但是,这也是一个保存的时代。古代甚至是中世纪早期的文本能不能留存到今天可真说不准。在前面的章节我们也说过,在印刷机出现之前,手稿上的信息必须通过手工来复制才能传播。
我的书架上有一本书,书名是《失落的书》(The Book of Lost Books)。一些著作的书名或者片段为我们所知,但是完整文本已经遗失,作者斯图尔特·凯利(Stuart Kelly)就此发起了讨论。诸如此类的引用有着悠久的历史,甚至可以追溯到《上主战记》(The Book of the Wars of the Lord),《圣经》在民书记(Numbers)21:14-15中提及了那本丢失的书卷(在引用关于远古部落的边界坐标的时候)。
《失落的书》按遗失的书的作者名排列,这些遗失的书均出自名家之手,说出来会吓你一跳:亚历山大·蒲柏(Alexander Pope)、莱布尼兹、莎士比亚、查尔斯·狄更斯(Charles Dickens)、爱德华·吉本(Edward Gibbon)、弗兰茨·卡夫卡(Franz Kafka)等等。当然,书里还有许多古代和中世纪的作家。奥维德(Ovid)、米南德(Menander)、波斯诗人阿曼德·阿德–达奇奇(Ahmad ad-Daqiqi)、吟游诗人威德西斯(Widsith the Wide-Traveled)……我们所熟知的许多作家的作品没有被保存下来。再有就是尊者比德(Venerable Bede)。
尊者比德是7世纪末期至8世纪初期的一位基督徒学者,也是一位英格兰僧侣。在天主教会眼里,他是一个圣人——1899年他被授予神学家,这个称号代表他在神学和教义思想方面的威望,在他去世几十年后被封为尊者、圣徒——同时他也是历史学家和科学家。事实上,他因著作《英国教会和人民历史》(History of the English Church and People)而被人们尊称为英国历史之父。他还著有数学方面的书籍,如讨论徒手快速进行数学计算的De temporum ratione。
但是比德更多的研究成果已经不复存在。比德写过许多英语诗歌,几乎都遗失了。但是,比德多数重要的学术著作都流传千古。知识要想被发现,要想用新的方式重组从而挖掘新的事实,那首先要保护好。相对于尊者比德流传下来的每一本书,又有多少书我们不知所踪呢?有多少知识注定要永远隐藏呢?
康奈尔大学的一位地球和大气科学教授20约翰·西斯纳(John Cisne)试图解答这些问题。他借鉴了尊者比德的成果,采用了我在第5章中提到的技术:把生物学引入手稿世界。我检验的是突变和进化,而西斯纳想研究的是中世纪的手稿在复制过程中失传的可能性。于是,他用人口和人口模型来分析比德的作品如何传播。
生物有机体会繁殖和死亡,手稿也是如此,类比来说:它们被复制就是“繁殖”,被遗失或损坏就是“死亡”。这里的“繁殖”遵循逻辑曲线,就像培养皿里的细菌。书籍不能无限制地增长,所以逻辑曲线比单纯的指数曲线更加实用。逻辑增长受限于一定的承载力——书册副本的最大数量。
西斯纳用人口生物学简化了这种情形,而且他能够根据每一个世纪保存下来的尊者比德的技术书籍的数量构建一个数学模型。由此,西斯纳计算出,中世纪的文本获得传承的概率比遭到摧毁的概率大了15~30倍。
此外,他还计算出这些书的半衰期:半数的副本被毁掉前所存在的时间。他发现,半衰期介于4~9个世纪之间,这么长的一段时间,真是令人惊讶。西斯纳可以得出这样的结论:中世纪早期,甚至古代的大多数文本其实都幸免于难。
诚然我们损失惨重;时间摧毁了很多知识。但是要说隐藏的公共知识的话,很多事实并没有消亡在历史长河中,这个消息着实令人振奋;它们确实可以重见天日。
所以我们现在知道,事实很少会遗失。而只要知识保存下来,我们就具备发掘隐藏知识的原始资料。从本章前面部分——孟德尔遗传学也好,临床试验的正确引入也罢——我们看到,大多数的知识隐藏仍然不能避免,但是在现代技术的帮助下,今天的我们可以通过计算来综合和重组分散的知识,从而创建新的事实。
准确地说,隐藏的公共知识及其挖掘已不再是中世纪学者、信息科学家乃至机器人数学家的专属了。与隐藏的公共知识相关的工具已经创造出来,我们每一个人都唾手可得,从某种意义上说,知识发现迎来了复兴时代;光天化日之下,事实的传播和搭配有了崭新的方式。专为一般科学家设计的Mendeley就是这样一个工具。
要发表一篇科学论文,最烦人、最繁琐的就是各种细节——尤其是论文格式。每一种期刊对字体段落、论文内容的组织架构都有不同的要求,最令人抓狂的是他们对参考文献的格式喜好不一。你写论文的时候,要根据你投的那家杂志社的具体要求,特别细致地把参考文献格式一一改过。但是如果科学家的论文遭到拒绝,不幸就会降临,他们不得不重新修改格式,以期在另一本杂志上发表。你一定不要少见多怪,多次提交这种重复劳动对科学家来说可是一种常态。
于是,许多帮助我们处理细节问题的计算机工具走进了我们的视野。其中最流行的要数EndNote,这是一个既允许手工输入,又能够轻松导入科学数据库中参考文献的计算机程序。从此,为一本杂志创建参考文献目录就变得像选择下拉菜单一样简单。想投给《自然》吗?一点儿也不难:被《自然》拒了,选择想转投给《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)?也不难,点击两下鼠标就成了。
但是最近出现了一种新的在线工具Mendeley。它的功能多而奇妙,不但简化了参考文献的导入,而且可以在线同步一个人的参考书目,最重要的是它带了一个社交网络。科学家不用再闭门造车引用文献,朋友引用了什么文献,他们能一目了然;从某种意义上说,Mendeley就是科学家之间的社交网络。
后来Mendeley越来越火,迈入蓬勃发展的社交型网站的行列,它为我们还没有意识到的知识分享提供了平台。
但是,它还有一大亮点:它把科学家正在寻找的相关文献送到了他们面前。通过自动关联论文主题,Mendeley使得隐藏的公共知识浮出水面。现在科学家们可以找到一篇对网络科学见解颇深的心理学论文,也可以找到一篇关于X射线晶体的数学论文。如此一来就助力了新事实的创建。
这些功能甚至也走进了普通用户的生活。在简易、可搜索的地方,各种各样的计算机工具都能收集信息片段——报价、参考文献、图片、文章、网页等等。有些使用云存储,有些把信息存储在桌面上,有些甚至允许与他人进行信息共享。
然而,有一个程序独树一帜:DEVONthink。它使用了一种叫语义和相关数据的处理的技术。使用其他程序的话,你需要输入搜索关键词或词组。如果某条目包含此信息,那么它就显示出来;否则程序就无法搜索出来。而DEVONthink更加智能。它特殊的计算技术能分析整个文本,并且找出字与字之间的联系。因此,如果你搜索“家”这个关键词,又刚好有一个参考文献在讲“家”的美好本质,那么DEVON会认为两者之间可能存在关系。它也可以分辨哪些信息与哪些信息类似,从而为我们架起原本不知道的认知桥梁。我们的脑子里不可能同时容纳成千上万条信息,但是计算机可以,它们还可以告诉我们信息之间有什么联系,从而成为新的事实和知识产生的温床。
史蒂文·约翰逊(Steven Johnson)是一位作家,他的书在很大程度上依赖于不同观点的综合,他就经常使用DEVONthink,他说这个程序对他的帮助很大。在一篇称赞这个工具强大威力的文章中,他举了一个例子:
它创建的联系非常丰富21。我手头有一个项目,涉及伦敦下水道的历史。有一天,我搜索了几次“污水”这个词。软件知道“废物”和“污水”这两个词经常一起使用,所以它把我引向了一篇阐述脊椎动物的骨骼进化的文献:细胞新陈代谢产生废物,骨骼通过再利用废物里面的钙来进化。
这虽然看似是一个错误的结果,但它把我带入了一个恒久而丰产的领域,那就是探索对复杂得多的系统——无论是城市还是生物体——制造出来的废物的高效利用。
新的事实就在我们的身边。而且由于现代技术有算法的特性,我们现在更有可能发现它们。
现在,挖掘隐藏的知识绝非遥不可及,甚至不再有专家壁垒;对于人们来说,探索事实不但具有可能性,而且十分容易。知识不会再丢失或遭到破坏,似乎我们曾经杞人忧天了。现在事实普遍数字化,将事实加以综合就可变成新的事实。我们正处在揭示隐藏的知识的黄金时代。
当这种情况发生时,我们的知识或许会发生突然的剧变。这些变化(即我们的知识突然从根本上被彻底颠覆)也具有定量的规律性,而这将是下一章的主题。
[12]推特网,美国一个社交网络及微博服务的网站。——译者注[13]又称元分析。——译者注
第7章 知识相变
在1750年,英国天文学家托马斯·赖特(Thomas Wright)1出版了一本名为《宇宙原始理论或新假说》(An Original Theory or New Hypothesis of the Universe)的书,书里有一张星图。在星图中,恒星们并不孤单,除了恒星以外,每颗恒星的周围都有一个小小的云状轨道,它们是一个个完整的星系。赖特的意思很明显:我们的太阳没什么特别的,只要是行星,它都会围绕着一颗恒星运转,太阳系外的行星与太阳系的行星并无二致。
在那个时候,这个观点不过是一个有点亵渎神明的假想,纯属基于哥白尼“日心说”的逻辑演绎。
把时间拉近一些,1980年,在纪录片《宇宙》(Cosmos)中,卡尔·萨根(Carl Sagan)给学生绘声绘色地讲授着关于太阳系的知识,并且分发给每一个学生不同行星及其卫星的照片。然后,他开始半开玩笑地说起那些更带有投机色彩但是也同样令人兴奋的想法。他向孩子们解释了探测外太阳系行星的基础,并告诉他们,人类在有生之年将发现许多这样的行星。他还预计,终有一天,我们将找到其他的类地行星,也会找到与太阳系中其他行星类似的行星。
几个世纪以来,我们一直都怀揣着这样的渴望,想了解是否还有别的世界会像地球那样绕着其他恒星公转。这会帮助我们认识人类在宇宙中所处的地位,并且鲜活地展示我们赖以生存的星系的本真细节。在一些人看来,这些发现让我们的地球家园流于普通(一些人对此忧心忡忡),而另一些人确信,太阳系外的行星可以为我们提供一种自我审视的方式,这一点必会抵消之前我们的不良情绪。
当萨根对那些小学生讲话时,他是正确的。1995年,米歇尔·梅伊尔(Michel Mayor)和迪迪埃·奎洛兹(Didier Queloz)的团队宣布,与太阳极为相像的51 Pegasi恒星所在的行星系统中,他们发现了一颗行星。这一发现证实了萨根的预测。
自1995年以来,人们通过各种方法检测了成千上万个这样的系外行星。这些行星特点各异,其中有许多行星的体积远远大过木星,并且它们的运行轨道比水星还近。但是,首次发现总是具有里程碑意义。除了可能在书本中占据更高的历史地位,51 Pegasi还迅速地改变了我们的知识。仅仅是《自然》杂志上的一篇论文,就让人类对宇宙的认识产生了翻天覆地的变化。原本我们不知道有行星在围绕类日恒星转动,后来我们知晓了它们的存在。简言之,在那次发现之前,一切都只是推测,而在那之后,人们便只需不断地探寻更多的例子:更多的太阳系外行星。
当事实改变时,我们经常可以预期变化发生的速度。人口的增长遵循一定的规律,医学知识以一种常规的方式积累,新的技术也让我们的效率越来越高——但这一切都是很好理解的,并且是有规律的。
但是,也有一些事实的变化不合乎此逻辑。DNA的结构、冥王星是否是一颗行星、飞机的发明——这些消息都是在弹指一挥间出现。在技术世界里,iPhone出现得太过突然,以至于竞争对手公司的高管还以为苹果声称的产品特点大部分不属实,马克·安德森(Marc Andreessen)认为,这部手机似乎来自于未来,因为它超前于当今时代,令人难以置信。昨天我们还对世界的运作有一定的了解,隔日,人类所处的真实环境已经发生了根本性的改变。
但是真的可以解读这些改变吗?你一定想不到,知识的快速变化其实有规律可循。我们可以找到其中的规律,有时甚至可以在变化之前就做出预测。
这种知识的快速变化(我们从一种认知状态转变到另一种认知状态)在广义上来说属于科学领域的相变(phase transitions)。这个术语在物理学中用得很多,我们在日常生活中也见得很多。水结冰、干冰变成二氧化碳(这个过程叫作升华)、黄金熔化——所有这些过程都是物质的相变。正因为它们无处不在,所以变化发生的时候,我们常常不以为然。但是尽管如此,相变对物理学家们来说还是极具吸引力的,而原因很简单也很耐人寻味:它们都是由小的改变引发大的差异。
一般而言,我们稍稍改变一个基本参数(如温度),那么研究对象的整体特性也会稍稍改变。把一杯水微微加热,它就会升温。或者把金属放到炉子中,摸起来就会有热度。
但是,当基本参数的微小变化达到一个神奇的临界点时,系统就会发生快速而大范围的变化。再微微加热那杯水,突然之间,它再也不是一杯温暖的液体——它变成了气体:水蒸气。
虽然没什么稀奇的,但是在微观层面正在发生一些复杂的变化,才最终导致了汽化。
水的沸点使得温度上一个小的改变引发了整体分子结构的巨大变化,这到底是怎么回事呢?再举一个生僻一点的例子:为什么把磁铁加热到一定程度之后,它会失去磁性呢(更诡异的是,冷却之后它还是消磁的)?引用凝聚态物理学(专门研究这种现象的物理学分支)的专业说法:是什么原因导致了级联现象,并且导致了相变的发生呢?
那么事实会不会也这样呢?在事实的世界里,是否存在同样类型的快速级联现象——某些较小规模的变化引发我们世界观的大规模的变化?
从一个简易数学模型中,我们就能找到这些问题的答案,这是一个研究磁铁工作原理的模型,由物理学家恩斯特·伊辛(Ernst Ising)提出。
研究物理系统的数学模型有成千上万种。一些模型试图模拟我们身边的复杂问题,最有名的当属天气模型。我们想了解的不仅仅是天气如何变化;我们还想知道,明天有多大可能会下雨。因此,我们输入全国各地的温度、风速、不同时点气压的测量值等等。随后,这些数据经过复杂的公式计算和功能强大的计算机模拟,最后,未来的天气在我们创建的计算世界里一览无余。
但是,我们无法从这些强大的模型中推导出万用法则。我们写不出一个简单的方程来说明全国平均气温与降雨之间有怎样的关系,因为该模型过于复杂。如果我们要理解类似的系统,进而去解释一些现象,那么我们需要创建一些简化的模型。这些模型不主张完全真实。相反,它们走向了另一个极端,它们主张:我们可以创建一个非常基础的模型,即使在现实生活中所有的复杂性都剥离之后,这个模型仍然具有纷繁复杂的世界的一些特点。那么,如果我们能掌握世界的这些特点,也许就可以追根溯源。在这个例子中,我们的问题是有没有这样一种简化模型用来反映相变的过程。这正是伊辛在做的事情。
伊辛模型的工作原理是怎样的呢?试想一下,我们把一副一面黑、一面白的扑克牌平铺在网格里。当纸牌颜色完全统一的时候,我们认为系统处于一种状态,就像固态。完全一致,易于理解。然而,如果纸牌随机翻转,并且没有明显的颜色分区,那么我们认为这种混乱的状态是气态。
这个系统是如何变化的呢?我们选一张纸牌,然后翻转它。如果我们从黑色一面朝上的纸牌开始翻转,那么不一会儿就有了很多白色朝上的纸牌,颜色就像变成随机排列的,并且符合我所描述的气态。
到目前为止,我对这个系统已经解释了很多,似乎我们只是在随机翻转纸牌。我们稍加考虑便可明白,随机翻转纸牌并不会导致总体的改变。如果任意一部分网格内的黑白纸牌颜色被随机地改变,那么图片的细节就会有所改变:哪部分纸牌黑色朝上,哪部分纸牌白色朝上。但是,如果把图片缩小,那么我们得到的仍然是大致相同的图片。
但是,这正是这个模型有趣的地方。我们翻转一张纸牌的时候,可能与其邻近的纸牌变成相同的颜色,那么结果就会完全不同。在伊辛模型里,纸牌是黑是白要取决于两个因素:系统的“温度”和邻近纸牌的颜色。
我们称之为温度的这个参数,与邻近纸牌颜色变化时一张纸牌翻转的概率有关。温度高的时候,许多纸牌都会发生翻转,但是这仅仅是因为很热,高温使得什么都很不安定。但是,随着系统冷却下来,一切都抱起团来,因为现在一张纸牌翻转会影响它周边的纸牌。所以一整片的纸牌就可以迅速地改变颜色。
当温度降到足够低时,网格里的纸牌会瞬间呈现同一种颜色,无论是白色还是黑色。现在,我们进入了一个完全不同的状态,我们可以称之为固态,因为它是一种固定的颜色。
伊辛认识到:我们可以用数学方法计算出一个温度值,它正好代表了从颜色统一阶段到颜色完全随机阶段的转变。
伊辛模型被数以千计的文章所引用,这些文章涉及的领域从生物学到社会科学,该模型是一种数学抽象,用于解释各种各样的相变,许多相变超出了物理学范畴。人们常常用相变来解释各种各样的快速变化,不管是用来探索生态系统崩溃和气候突变的生态模型,还是潮流和时尚如何传播的临界点。
但是事实呢?这些五花八门的模型是否有助于我们理解知识的演变呢?
知识和抽象的磁场模型其实有很多相似之处。我们的知识潜移默化地改变着,在这个过程中,我们研究的其他领域可以有跨越式的大发展。在伊辛模型中,我们缓慢而持续地改变一些东西,然后这种变化使得另一处发生了骤变:例如,系统的状态从气态变成了固态。在事实的世界里,也有可能发生这样的事情:一个突如其来的知识跨越可能得益于其他一些处于变化之中、缓慢积累的事实。但是,这听起来还是很抽象,现实生活中它究竟是怎样的呢?
在人类历史上有一个突然被推翻的事实,它是通过一个足迹来完成的:有史以来,从未有人踏足过月球表面。几千年来人们都没有将它提上日程。从未有人在月球上迈出哪怕是一小步。1969年7月20日,美国东部时间晚上10点56分,这一切都因一小步而彻底改变了。
但是,这一相变是否可以从一些背后的规律变化之中预知呢?答案是:可以。在过去的数十年间,出现了很多可量化的模式,因此我们可以预测人类在太阳系所处的位置这一相变。
在阿波罗11号飞船之前,多个无人和载人的阿波罗任务已经启动了。其实阿波罗10号与月球表面仅有咫尺距离——它离开了地球的轨道,绕着月球盘旋,而且最后成功返航。它甚至飞到了距离月球表面15公里的地方。尽管在我们眼里,登月似乎是一次突然的转变,但是突变之下隐藏着渐变,它可以解释质的飞跃。
其实能解释这一相变的不仅仅是登月前的几项任务;几百年来的数据同样可以解释这种平稳的进步。1953年2,科学研究办公室的空军科学家简绘了一张曲线图,展示了几个世纪以来每一个时间节点上速度最快的人造运输工具。他们的发现令人难以置信:他们把指数曲线向外延伸,如果照这个趋势继续升高,那么摆脱地球引力束缚所需的速度在4年内就可以达到!远在苏联斯普特尼克号(Sputnik)发射之前,就有一条曲线预示了人造卫星的存在,而且它的预测十分准确(斯普特尼克号人造卫星于1957年10月4日进入轨道)。
除此以外,空军科学家们还意识到,按照曲线图的预测,此后无须几年我们就可以达到在月球上着陆所需的速度。后来登月如期进行,并且获得了成功。星际飞船也在计划之内,虽然目前为止我们还未成功,但是美国航空航天局最近宣布了一项计划,他们已经开始考虑制造一艘能抵达恒星的飞船。
这意味着,登月这一事实相变早就是可行的——依靠科技所能达到的最高移动时速的稳步提升。
这一类的相变在事实世界里很常见。正如前文所说,近一百年来,冥王星都是一颗行星,但是突然之间,它不是行星了。曾经,人们认定吸烟有利于身体健康。医生甚至还支持几个牌子的香烟。而到了20世纪50年代,吸烟致癌已经是再清楚不过的常识。
然而,这些都可以用更为稳定的、不那么显而易见的变化来解释。在太阳系边缘探测到的星体越来越大,这意味着,人们迟早会重新界定冥王星的身份。医学研究步步深入,这意味着,我们知道吸烟危害健康只是时间问题。
与此相反,人类所知的哺乳动物的数目是一个缓慢而稳定的知识发展过程。没有一个发现会很大程度上改变我们对物种数量的认识。若我们知道成千上万种哺乳动物,便没有任何一个额外的发现能推翻这一事实。
不过有时候,这两种类型的知识变化之间的界限没有那么清楚。例如,寻找第一颗太阳系外行星是一个相变,而从第400颗已知的太阳系外行星到第401颗却是一个更微妙、更稳定的发展过程。在这种情况下(其他类似的情形也一样),知识是缓慢积累的,它们通常遵循我们在第2章中讨论过的规律。
但是,理解这些稳步的发展是理解知识快速变化的关键。我们从不同规模来看待万事万物时,这些稳步的发展就是它们背后缓慢的温度变化,这些稳步的发展导致了我们看到的知识相变。当然,要找出背后正确的变化并衡量它3也不是那么容易,我们需要付出一点匠心。但是,这样做有助于解释我们身边许多知识的快速变化。
自从1995年第一颗太阳系外行星被发现以来(如卡尔·萨根在《宇宙》中预测的那样),就人类在宇宙中的位置而言,我们一直在等待另一次大规模的观念革新。我们一直在寻找一个和地球非常相似的行星,至少是一个可能适宜生物生存的行星。这个领域的一位先驱者曾告诉我,这是许多研究太阳系外行星的天文学家的终极目标。当然,他们还有许多别的研究主题,如研究我们的恒星附近有哪些行星,并探究它们的大小、类型及真实分布。但最重要的目标一直都是找到一个真正的类地星球。
发现一个确有生物存在的星球将成为人类历史上一个巨大的里程碑,这也将成为左右我们世界视角的巨大相变。
但就像登月一样,这样的发现总是不积跬步无以至千里。虽然我们相当确定,生物在一个陌生宇宙空间的存活能力超乎我们的想象,但是最佳研究策略一定是先从类地行星入手。又因为无法检测这些行星的大气组成,不知道是否具有生物存活的必要条件(如氧气),所以我们避难择易,测量质量和温度。如果地表温度允许液态水存在,且这个星球的大小与地球差不多(这意味着我们这样的生物体有在那里进化的可能性),那么这个星球被认为可能适宜生物生存,至少它通过了第一关筛选。
因此,检测我们的太阳系外第一颗星球有没有生物生存,这可能是一个令人震惊的、不连续的知识跨越4,但是这是可以预测的吗?2010年夏天,格雷戈里·劳克林(Gregory Laughlin)和我把此作为研究课题,他是美国加州大学圣克鲁斯分校的一位天文学家,也是太阳系外行星领域的专家,他已经发现了不少行星,他开通的博客是业界最早的。
格雷戈里和我知道,发现一个与地球大致相同的行星已露端倪。美国航空航天局的开普勒任务(Kepler mission)已经进行一年多了,事实上,在2010年6月中旬,他们就发布了一个系外候选行星名单,而直到次年2月才透露了最有希望的候选行星。我们知道,我们面前是一扇特别的时间之窗,对发现本身以及对做出预测来说都是这样。
我们创建了一个简单的指标来衡量宜居度5。从0到1,给每个先前发现的星球打分,0代表不适合居住,1代表和地球非常接近,至少在质量和温度上很相似。大多数行星的得分都是0,或者几乎为0,因为大多数行星的气候要么严寒,要么酷热(有时在一年里既有严寒又有酷热)。但是,从逐年宜居度的最高值来看,我们发现了一个清晰的上升趋势:通过锁定每年发现的最类似于地球的行星,并把它们的宜居度绘制成图,我们发现,曲线逐年稳步上扬。事实上,这种上升趋势与我们熟识的逻辑曲线是一致的。就像科学产量大体上符合指数和逻辑曲线,朝着潜在类地行星的发现迈进也符合这些无所不在的函数。
因此,我们根据它的数学形状进行预测,把这些曲线不断延伸到未来,这些值终将达到宜居点。从本质上讲,已发现行星的属性和它们的宜居度就是系统背后的温度。随着时间的推移,已发现行星的宜居度的最高值稳步增长。当达到一个非常高的宜居值时,我们的知识就会产生飞跃:从一个潜在的类地行星也不知道,到终于知道了一个。太阳系外行星的发现数据让我们看到了微观行为,这就是知识微小而根本的变化。而且,检查发现类地行星这一消息的过程,也正是度量知识相变是否已经发生的过程。
这样运行分析一万次后(为了确保我们的计算是强有力的),我们发现,有2/3的可能性我们将在2013年年底发现一颗类地行星。更令人兴奋的是,到2011年上半年,这一可能性已达到50%!
我们的论文被认可后不久,2010年9月1日,我们进行了线上发表。4个星期后,也就是2010年9月29日,来自加州大学圣克鲁斯分校和卡内基科学研究所的一个团队宣布,他们发现了首个真正意义上的类地行星——一个可以维持生物生存的星球,并将其命名为Gliese 581g。
这个星球具有一些奇怪的特性:例如,它的一面始终对着它的恒星,而另一面总是朝向夜空。因此,只有相接的昏暗地带的温度才有可能适合生物生存。这也很困难;那里的温度也就比莫斯科的冬天高一点儿。除了接受到的日照强度不如地球(很像超人的家园氪星接受到的日照强度),这个星球最有趣的一点是:它可能压根儿就不存在。
其实人们还在争论它的特性是否属实,抑或只是一些令人兴奋的噪音。另一个团队检查了数据子集后说,他们没有发现任何证据可以证明Gliese 581g的存在。也就暗示我们,还需要进一步的、大量的数据检测工作才能确定它是否存在。然而,在那之后又发现了一个疑似类地行星,叫开普勒22b6,它绕着距离我们约600光年的恒星转动。
我曾经听一个研究太阳系外行星的天文学家说过,人生最大的幸事莫过于在发现目标星球之后摇身一变成为一位生物学家。现在看来,我们似乎已经跨过了一道科学知识的门槛。从一度闪烁着类地行星迹象的数据和推论里,我们似乎又看见了获取新认知的曙光。并且,这种相变之所以发生,是因为它背后的宜居度在发生规律性变化,而后者是根据行星质量和温度的研究发现推导出来的。
不过有的时候,要探讨潜在的改变、判断相变何时发生,并不是一件容易的事情。即便如此,仍然有一些关于知识是如何迅速变化的数学规律,至少能明晰总体的知识变化。数学概念的证明就是其中之一。
2010年年底的时候,我曾创建了一个数学模型,想以此看看破解一个悬而未决的数学难题要花多长时间。破解数学难题比行星发现领域的研究要困难得多,因为它不具备缓慢变化的基本特性,也就是说,不存在日积月累到一定程度之后量变引起质变的情况(好比说发现一个类地行星)。通常,破解数学难题似乎只是数学家们前仆后继地证明演算,年复一年而毫无斩获,难题被攻克的希望渺茫。
其实并不是那样的。失败是成功之母,在探索的过程中,我们可能会有意想不到的收获。例如,费玛最后定理(Fermat’s Last Theorem)就是一个世界著名的难题。这个想法是由法国人皮埃尔·德·费玛(Pierre de Fermat)在1637年时提出的,他是一位职业律师,也是一名数学爱好者。费玛写道:假设n是大于2的正整数,则不定方程an+bn=cn没有非零整数解。如果n=2,我们就得到了毕达哥拉斯定理[14],它的证明方法有很多。但是费玛认为,把n变大的话,公式无整数解。费玛并没有给出证明。相反,他在一本书的边缘潦草地写下了这个命题,并且声称他有一个完美的证明过程,可惜这里空白太小,写不下。这也因此成为数学史上最令人抓狂的事件之一。
现在想想,我们会认为可能是他搞错了。但是,他写下那些话之后,人们确实找不出一个大于2的数字使得方程成立。因此,人们认为这个假设是正确的,但是无法证明它。这个深奥的问题自17世纪提出以来就一直困扰着我们,直到1995年,安德鲁·怀尔斯(Andrew Wiles)完成了一个证明,这个证明过程不仅复杂,而且长篇累牍,费玛的空白边缘肯定是写不下。但是更为重要的是,在证明费玛最后定理的过程中,数学家们证明了其他的、较小的猜想。当这个难解之谜最终被破解时,证明过程里已经牵涉了许许多多新的数学内容7。
证明一个著名的世界难题需要多久,我决定要找出预测这个过程的办法,也就是P对NP问题。考虑到困难程度和重要性,克雷数学研究所(Clay Mathematics Institute)重金悬赏100万美元求解决方法。从本质上来说,我们要判断两类数学问题是否相等。P问题很简单,用今天的计算机就能轻松解决,有时甚至一支铅笔加一张纸就够了。对NP问题来说,验证一个答案的正确性是小菜一碟,但是计算出正确答案可谓比登天还难。也就是说,你根本计算不出一些NP问题的答案,但是很气人,如果我给你一个答案,你会立刻知道它是否是NP问题的正解。
例如,找一个数字的质数因子就是一个NP问题。如果给定一个足够大的数字(比如一个400位长的数字),目前我们认为,只有运用地球上所有的计算资源才有可能求得它的质数因子。即便如此,要确定是哪两个质数相乘得到这个400位长的数字,需要的时间比地球的寿命还要长。
但是,如果我告诉你是哪两个质数,那么你只要简单地一相乘,就知道是不是正确答案了。问题在于,在过去的几十年里人们一直想搞明白,既然NP问题的答案可以很快得到验证(就像验证质数因子,其答案是否也可以很快计算出来?[15]到目前为止,还没有人找到解决棘手的NP难题的捷径,而且似乎NP问题与P问题没有交集,让我们感觉P是不等于NP的。但是,我们可能只是遗漏了一些基本要素,或者欠缺了一些数学技巧,本来它们可以简化这些问题,或者隐含着P等于NP的。这么说吧,判断一个很大的数能否被3整除可有点麻烦,除非你知道下面这个巧妙的方法:如果它的每一个数位上的数字之和能被3整除,那么这个数字就能被3整除。
假设NP问题很困难,这其实是现代密码学背后的基本假设。只要P绝不等于NP,密码的强度就会一直很高。而且,如果P不等于NP[16],那么许多别的事情会一直难以解决,不论是在大型机构分配资源和物流,还是管理复杂的投资组合,甚至是填字游戏和扫雷游戏。但是,我们并不知道P与NP是否相等。40多年来,我们一直处于不知道的状态。
我们什么时候才能知道呢?可能永远都不会知道。总有一些问题8始终也不能得到解决,而且已经被证明无解。但是也有许多沉寂了数百年的难题,突然有一天,就被一位数学家画上了已证明的句点。这才是解决这个问题的关键。许许多多著名的难题最终得到解决,我意识到,我可以研究这些过程的时间分布规律,然后把规律应用到P对NP这个悬而未决的难题上。如果P对NP问题无异于其他著名的难题,那么也许我可以根据统计数据推算出它要花上多长时间才能得到解决。
因此,虽然我无法确切地预知一个问题何时能得到解决,但是我可以从总体上观察难题,并且发现其内在规律。这样,我们就开始掌控解决难题时的不确定性。
其实如果真的这样做了,我们就会得到一些非常有趣的分布,叫作重尾分布(heavy-tailed distributions)[17]。也就是说:我们无法期望在某一个时点找到解决办法。一些著名的难题过了几十年才得到解决,而另一些位于分布尾部的难题数百年后仍然扑朔迷离。数据集里甚至还有一个著名的猜想(或未经证实的言论),它在1 500年后才最终被证实。
但是通过这个分布,我们就可以知道解决一半的难题需要多少年,你可以取50%这个点,对应出来就是它可能的解决方案时间表。所以,假设难题都是可以解决的,且P对NP问题的发展趋势与其他难题一致,那么我们要等到2024年9,也就是P对NP问题提出的53年后,才会诞生一个解决方案。
这一年仍然会有很多不确定性。但是,现在我们可以通过概率看出数学知识的变化有多快,至少可看出总体的数学知识变化有多快。假定最终我们知道了P是否等于NP,那么我们可以肯定,知识的这种变化将非常迅速,它的发生并不会有太多预兆。
从伊辛模型到概率,数学可以帮助我们了解身边的事实是如何快速变化的。但是,这些相变是特例还是普遍现象呢?我们身边的知识可以缓慢且持续地变化,也可以极为快速地变化,但到底哪一种更有可能呢?
毫无疑问,知识经常是缓慢变化的,然而很多人都有一种直观的感受,那就是我们周遭的知识更新得越来越快,每天都上演着越来越多的快速相变。这种直觉背后是有科学根据的。要搞懂这一点,我们必须先来了解城市创新。
最近,物理学家们已经开始把自己所研究领域的数学工具应用到研究城市居民与利用能源进行创新的关系上来。例如,路易斯·贝当古(Luís Bettencourt)和来自于圣塔菲研究所(Santa Fe Institute)的同事们10发现,城市的某些特点具有规模效益。例如,一个城市的人口越多,人均占有的加油站数就越少;加油站的数量可能代表了一个城市整体的能源使用情况,而且似乎较大城市的能源利用更为高效。这就类似于较大的机构比小机构高效节能。
然而,要说生产力和创新能力的话,城市符合一种报酬递增的数学关系。例如,大城市每年的人均专利数量更多,并且存在一种很精确的数学关系。我们管这种缩放比例叫超线性(superlinear),因为事物的发展速度比线性速度要快,比直线增长要快。如果城市人口翻倍,那么生产力并不是简单翻倍;它会使生产力和创新能力增加一倍以上。人们发现不管是专利、城市生产总值、科研预算,甚至是艺术家和科研学者这类超级创造性人才,各个领域都存在这种关系。
如果拥有和消耗的资源遵循次线性(sublinear)缩放,并且驱动增长(就像生物11),那么就会形成一个简单的进化系统:从小的开始,快速增长,但最终增长放缓,进入一个成熟期。然而,如果一个系统遵循超线性缩放(就像城市和创新),那么这种数学关系会要求系统越来越快地增长,直到接近无限增长率。
但是无限增长是不会发生的,无论是对生物体还是对城市来说。那么对于城市来说,要想不被这种无限增长击败,它唯有经历被研究人员视为典范创新的过程,主要是重置增长参数。这些创新带来的变化十分广泛,既包括现代化的污水处理系统——大量废物会限制城市的发展,又包括拔地而起的摩天大楼——三维空间的利用使得城市人口密度的增加成为可能。无论是什么变化,这些创新都使得城市避免了因自身发展而变得不堪重负。在过去的日子里,创新重置每隔数百年就会发生一次,而对我们每一个人来说,这些大规模的变化其实是可控的。但现在再也不可能了;一个人的一生竟然要经历多重快速变化,这在历史上还是头一回。
知识改变越来越快,因此带来的社会变革会非常巨大。不只是量变,还有质变。对于中世纪早期一个生活在英国的小村庄里的人来说,除了某些细节,他两年内的生活方式不会有什么差别12。流行时尚可能会发生改变,但在那个人的一生中,他的职业、做饭和做家务的方式是不变的。其实中世纪时期的时尚13,每隔50年才会变一变,这比起19世纪的工业化国家每隔10年变一变已经很慢了。即使你生活在中世纪末期这段少有创新重置的时期(比如引入火药的那个阶段),你也不会觉得很难适应,因为每隔几代人才发生一次创新重置。
人类的历史向来如此。但是随着技术和创新的指数增加趋势,这些变化发生得越来越快。当它变得非常快的时候,我们就要面临一种特殊情况:我们所处的世界似乎置身于一些事实和知识的迅速转变的边缘。任何时候,一个小小的改变都可能会导致一个知识领域的大转变。
当然,处在这种状态的不只有事实的世界,还有许多其他系统也具有类似特点。你可以想象一下,在一个复杂的生态系统中,只要发生一个细微的变化(如去除一个物种,或引入一个病原体),整个系统就可能遭到破坏。或者一次聚会,一个人突然离开会导致曲终人散。或者想得更简单一点,若有一堆沙子,每次加几粒,沙堆会慢慢变大。但是随着沙子加得越来越多,最终,只需几粒沙子就会触发沙堆的迅速变化——塌落。为什么会这样呢?几颗沙粒使得系统到了迅速转变的边缘,这又是为何呢?
伯·巴克(Per Bak)、汤超(Chao Tang)、库尔特·维森弗特(Kurt Wiesenfeld)这三位物理学家对此展开了深入的研究。1987年,他们发布了一个简单的数学模型,旨在解释为什么小变化的积累可以导致一个系统巨大的变化。
这个模型像伊辛模型一样利用了网格。他们把每个可以加入一粒沙子的位置看成一个点。而且,按照模型预设好的数学规则,如果某个地方沙堆过高,模型会有相应反应。如果沙堆的高度超过一个指定值,那么沙粒就开始向相邻的点移动,类似于水呈锥形下落。当这个模拟沙堆高度达到了所谓的临界状态,它就会与之前所描述的完全一样:沙粒一颗颗落下,你根本不知道接下来会发生什么。沙堆有可能只是微微动一下,也有可能就彻底塌落了。有点像积木或三眼仔游戏(Ker Plunk)[18],但从数学的角度来说,这个系统会一直在未知的边缘徘徊。
结果我们发现,这样一个总是濒临塌落边缘的系统,却正是现实世界里典型的真实系统,甚至知识世界也是这样一个系统。说得可能有点隐晦,我们的世界就是这样渐进变化的。
我们生活在一个神奇的时代,知识的快速变化就在我们周边新鲜上演。每一天我们阅读新闻,可能读到颠覆已知的旧世界的事实。从冥王星不再是一颗行星到人类在月球上行走,仅从外太空的例子来看,变化已经是现代世界的一种常态。
但事实证明,这些迅速的知识相变并非无法预知,也不是偶然事件。概率有助于我们认识事物的总体变化,而我们还有另一个办法,那就是通过收集缓慢而有规律的内在变化来预测这些迅速的变化。
正如我们所见的其他事物,事实的快速变化是有内在规律的。这个规律是可测算的、可预知的。
但是测量本身呢?我们已经探讨了一个又一个的事实,但是只有可量化的事实才能真实存在。下一章我们就要讲讲,测算是如何影响我们已有的知识的。
[14]毕达哥拉斯定理(Pythagorean Theorem)即勾股定理。在一个直角三角形中,斜边的平方等于两直角边的平方之和,即X2+Y2=Z2。——译者注[15]即P=NP吗?——译者注[16]P表示“容易”,那么“NP”就表示“困难”。 ——译者注[17]重尾分布是一种概率分布模型,它的尾部比指数分布还要厚。通常情况下,右边的尾部比较受重视。重尾分布又有两种:长尾分布(long-tailed distributions)和次指数分布(subexponential distributions)。——译者注[18]一款动作冒险的红白机游戏。——译者注
第8章 珠穆朗玛峰与错误的发现
在1800年,大英帝国进行了一次不列颠大三角测量(Great Trigonometrical Survey),又称印度测量(Survey of India)。英国人接管了印度半岛以后,需要一张准确而详尽的地图。如果连一个半岛是什么样子都不知道,那又怎么能统治好它呢?因此,身为印度测绘局局长的威廉·莱姆顿上校(Colonel William Lambton)便开始了这项庞大的工程——确定这个殖民地各个地方的精确坐标。
1808年,测量从印度的最南端开始。莱姆顿采用了三角测量技术。有了三角、链条、金属杆、纪念碑、经纬仪(一种光学测量设备),再加上恒星观测报告,人们就可以大致测量出几乎任何东西的距离和坐标。尽管这些花样繁多的器材可能会让人觉得这像巫术,但这其实是土地勘测的一个行之有效的方法。
在几十年的过程中,大英帝国逐渐了解了印度的情况。这个庞大的项目历经了几代人,相当于建造一座科学的金字塔。莱姆顿去世后,这个项目便由一位名叫乔治·埃弗里斯特(George Everest)的科学家负责,他可是一把好手。之后在1843年,又由安德鲁·史考特·沃(Andrew Scott Waugh)负责。沃负责该项目期间,印度大弧测量(Great Arc of India,这项庞大工程的另一个名字)的先进技术终于登顶了喜马拉雅山脉。
沃知道,该地区的山是世界上最高的,但他并不知道山的具体高度。测量进行了很多年,然后人们开始了计算工作。负责为一座名叫XV的最高峰计算海拔高度的人,一直不为人知。但是在1856年,沃宣布他们发现了世界最高峰,他用他前任的名字将最高峰命名为珠穆朗玛峰。
我们知道,珠穆朗玛峰被认为是世界最高峰,这一事实似乎从未改变过,但它究竟有多高呢?到1954年时,已有的不同测量数据之间相差了17英尺。但是从那以后,测量数据的差异有了较大幅度的下降。这要归功于测量技术的创新。测量师无须再将多个邻峰顶上的测量站测到的数据进行比较,现在,他们使用全球定位系统(GPS)来缩小差距。
其实,测量精度的提高让我们发现了一个新的事实:山的高度其实每年都略有变化。珠穆朗玛峰的高度似乎受制于两股力量之间的相互作用。一方面,两个大陆板块发生碰撞(亚欧板块和印度板块)会导致一定的隆起,大约每年有一厘米的变动,虽然有些人似乎持有不同的意见。另一方面,其他的力量,如侵蚀和冰川融化,可能会导致山峰高度降低。虽然目前还不清楚每年珠穆朗玛峰的高度改变多少,但是我们现在确信1,它的高度从来都不是一成不变的。我们也知道,珠穆朗玛峰一直以每年约6厘米的速度进行横向移动,所以它的位置也是一个中央事实,是慢慢改变的知识之一。但是,只有测量世界的技术进步了,我们才可以了解到这些事情。
想想世界上最高的树。迄今为止,世界上最高的树木是美国加利福尼亚州的红杉树,大约有400 英尺高。第二高的树种是桉树,它们生长在澳大利亚南部,最高的约有300英尺。
虽然用激光测距可以把任何树的高度精确到几英尺,但不幸的是,要找到世界上最高的那棵树,光有激光技术可不够。相反,必须爬上那棵树,你才能够测出准确的数据。
通过植物学家和测量师的合力测量、搜寻和多次攀爬,在2006年的时候,最高树的世界纪录2经历了从洛克菲勒树(Rockefeller Tree,356英尺)到利比树(Libbey Tree,367.8英尺),再到同温层巨人(Stratosphere Giant,368.6英尺),最后到亥伯龙神(Hyperion,379.1英尺)的让位过程。虽然这些世界纪录保持者可能不会像珠穆朗玛峰那样每年增高一点儿,但是许多树木的高度也处在变化之中。而这个例子讲的是另一种可以预测的变化:生长。但是,只有知道真正的高度之后,我们才能测算它的生长。
事实是什么,它们如何改变,要解答这两个问题,归根结底还是要靠测量。日常生活中许多事实都具有系统的、可量化的规律,同样地,测量本身也遵循数学规律。我们在测量上取得的进步遵循某些已知的规律。在第4章中,我已经介绍过用于描述世界的科学前缀是如何呈指数增长的。虽然大家在讲到技术进步时才会想到前缀——计算机变得更加强大之后,我们不再说兆字节,而开始说十亿字节——但是前缀也可以用于定义我们的测量以及不确定性。现在我们都以十亿分之几厘米而不是十分之几厘米来度量物体,因为我们有了更好的尺子和测量装置。
芝加哥大学社会科学研究大厦刻着开尔文勋爵(Lord Kelvin)的一句话:“脱离测量的知识是贫乏的、欠佳的。”与定性分析相比,这可以视为定量分析的长处,它也有助于我们思考如何进行更加精确的测量。
纽约大学斯特恩商学院的教授思南·阿尔(Sinan Aral)曾说:“推动科学革命3的往往是测量革命。”从错误的染色体数目到物种的错误分类,我们越来越专注于测量周遭的事物,因此,我们的知识不断增加,而且大量的知识被推翻的概率也在增加。开尔文勋爵格言的一个推论:你测量出的数据可能是不正确的。测量几乎影响着我们所知道的一切,所以本章专门探讨测量与事实相互交织的多种方式,我们先从如何逐年改进测量分析、进而加深对世界的认识这一点入手。让我们来看看科学革命,那时许多的思想都与测量有关。
克里斯托弗·雷恩(Christopher Wren)在1666年参与了大火灾后的伦敦的重建工作,并因其建筑杰作而享誉世界,他为现代科学做出了多方面贡献。其中之一就是他针对测量进行的创新。之前我们提过另一位科学革命巨匠约翰·威尔金斯,雷恩正是和他一起参与了“米”这个单位的创造。
在1668年4月英国皇家学会的一次会议上,威尔金斯提出是时候把测量标准化了。他提出的测量标准之一就是长度。他认为,各种长度单位都由基本长度单位派生而来,所以基本长度单位应该定为标准,定义如下:秒摆——从一个最高点摆到另一个最高点的用时(又叫单摆周期)正好是一秒的单摆——的长度。这一定义建立在几十年前伽利略一项发现的基础之上,无论摆锤重量如何,长度相同的钟摆摆动速率相同。此外,无论你在什么高度松开摆锤,它摆到对应最高点所需的时间是相同的。
克里斯托弗·雷恩向威尔金斯提出的这个建议最终得到了采纳。39.25英寸被作为标准确定下来,这一长度与现在的计量单位“米”非常接近。后来,威尔金斯又根据基本长度单位进一步定义了一套常规的长度单位4,如基本长度单位的十分之一是一英尺(foot),而10个基本长度单位相当于一杆(pearch)。他还提出,每条边长都是基本长度单位的立方体容积是一蒲式耳(bushel)。
显而易见,这些派生出来的计量单位后来并没有沿用下来。事实上,我觉得现在很难找到一个还知道杆的含义的人——如果你好奇的话我告诉你,它差不多相当于10米(decameter),这个词似乎很少使用。但是,基本长度单位(法语中写作metre或meter)一直沿用到今天。
但是在18世纪的时候,长度单位的另一种定义方法最终胜出。它不是用时间来计算出一米(威尔金斯认为他的测量方式在整个宇宙都是适用的,因此很难被一个新创造的测量单位所击败),它对米的定义源于子午线的弧长。最后一米的定义变成了:从赤道到北极的子午线弧长的千万分之一。地球不是标准球体,它的表面高低起伏,所以每一点上所受的重力不尽相同,而这会影响到单摆的摆动,所以法国科学学会(French Academy of Sciences)在1791年时选择了基于距离(而非时间)的测量方式。
但这里有一个问题。在1791年的时候,还没有人亲身到过北极,而且,用于测量从赤道到北极的子午线弧长的方法有着很大的差异。与前面的情况所不同的是,不仅地球的特性没有完全被人类了解,而且这些未知的特性很可能会影响到测量本身。长度单位肯定会受到对地球的测量精度的影响,所以测量出的长度是在变化的。因此也产生了一个反馈循环,我们对测量越在行,测量精度就会越高。
米的定义一直在变化。科技进步和先进工艺的涌现使得米的定义不断发展。在这个过程中,米的定义的精确度也在提高,最终它会像其他的定义一样达到非常精确。
虽然知道一米大约是多长有助于我们完成许多任务,比如,切割地毯、测量自己的身高,但是如果是更高端、更精确的任务,比如设计一个电路板,它恐怕就无能为力了。随着技术和科学的发展,世界已然越来越复杂,我们需要更为详尽且更为精确的测量。我倒不特别在意我的身高矮了半厘米,但是换作测量微生物的大小的话,我会更加严谨。
因此,在1889年,人们用铂铱合金制作了一把真的米尺,官方认可它的长度为一米,以避免因依据子午线弧长而造成的模棱两可。之后,所有的米尺都要根据这把严格规定好长度的米原型尺来制作。
但是变数仍然存在,你不能排除米原型尺被损坏的可能。此外,任何气压或温度的轻微变化都可以造成其长度的改变,哪怕只是很轻微的改变。米的定义中包含了对米尺原型所处的气压和环境温度的具体说明,但是要保证这么精确的条件是非常困难的。
于是,一个国际科学家小组用自然米代替实物米进行了定义,他们引入了气体氪的一种同位素,这种原子在真空中会发光,最终他们用光波的波长定义了米。我们目前还在使用这个定义,它其实说的是在理想状态下一段极短却又极为精确的时间内,光在真空中传播的距离。如此一来,光的速度与米的长度5便密不可分地联系在了一起。我们的测量会变得更加精确,但光的速度是不变的;而米的定义是在变化的。
测量的世界里远不止6以上所说的米的长度。如果你想对测量的历史进程追根溯源,我建议你读一读《度量衡百科全书:等量换算及起源》(Units, Weights, and Measures: Their SI Equivalences and Origins),这是一本涉及面很广的资料,由法籍加拿大化学工程师弗朗索瓦·卡达雷利(Fran?ois Cardarelli)编写。里面有史上最全的计量单位换算表,从阿比西尼亚(Abyssinian)的长度单位,到古埃及的重量单位,从古罗马系统的距离单位——比如gradus(行走时的一个步幅)和passus(两个步幅),到亚述–拉丁–波斯(Assyrio-Chaldean-Persian)的测量系统。此书无所不包。
你想用超越光年和秒差距(parsec)(约3.25光年)的单位来描述一下外太空吗?那么你可以考虑一下siriusweit,它相当于5个秒差距。你想知道英制铅条的重量单位fothers是什么,或者芬兰的单位体积kannor是什么吗?这本书都可以告诉你。
书里甚至还有各种独立的单位,如perfect ream指的是516张纸;又比如warp指的是4条鲱鱼,英国的渔夫会这么说,在祈福仪式(kiddush)时年长的男人也会用到这个单位。
除了所有这些有用的和可能不那么有用的信息,这本书里还有一个有趣的表格,它显示了米的每一种定义是如何减少整体测量中的误差的:较之以前的定义,每一个新定义都更加准确。下图是根据表格绘制而成的图形。
这些数据点的单位可不是年。每个重新定义都有一个准确的日期。每一个现有精确定义是在哪一天确立的,我们知道得清清楚楚。此外,米的精确度有规律地提高,误差线性减少:呈指数衰减。科学前缀的指数变化使得术语更加精确,于是我们对测量的定义也呈现出这种规律。
图8 米测量的逐年误差。米的定义的精确度提高,误差呈逐年指数衰减(错误轴是对数性质的)。直线反映了总体下降的趋势。
数据来源: Cardarelli,《度量衡百科全书:等量换算及起源》(施普林格出版社,2004年)。
米的精确度以及定义的变化并不是特例。科学家们一直致力于让宇宙的物理常量成为基本计量单位的基础。除了将米与光年联系在一起,时间的定义也确切可知:一秒是用某种铯原子的振动速度来定义的。
在公制系统里,最后一个经历了定义向物理常量转变的基本单位是千克。长久以来,千克的官方定义为国际千克原器的重量,千克原器是巴黎郊区一个储藏室保险箱里的铂铱合金圆柱体。在过去的几年中,度量学家(专注于测量事业的科学家)一直宣称要替代千克的定义7,如改用一个硅球体的质量(含有一定数量原子或是一定的电磁量)。2011年10月,在巴黎郊外召开了第24届国际度量衡大会,在这次大会上,人们最终决定用一个物理常量作为千克的官方定义。
尽管我们的计量单位已经超乎想象的精确,但是我们通常用不到这么高的精确度。一些误差和不确定性充斥着我们的日常生活。精确度大为提升的今天,我们在测量时依然不尽准确。大多数人测量长度时,使用的还是最基本的尺子。我还清楚地记得家人为我量身高时用的尺子——两头磨损得厉害,很有可能短了近一英寸。尽管测量时有误差,但它也满足了日常需要。同样,我们兑换货币时并不要求汇率过分精确,误差在千分之几的范围内也可接受。
但是,了解测量误差存在的原因,并且加深对精确度的理解,有助于我们更好地认识事实的变化以及测量对知识变化的影响。
在1980年,德斯勒(A. J. Dessler)和拉赛尔(C. T. Russell)在美国地球物理联盟旗下的Eos杂志上发表了一篇不够严谨的论文8。在论文中,他们研究了冥王星质量的逐年变化情况。我们至今仍然不知道冥王星的确切质量。它的外层大气会向外层空间逃逸,因此,天文学家们在计算时往往会遇到麻烦,有时他们也搞不清那到底是它的表面还是凝结而成的氮霜。
冥王星最初进入人们视野的时候,被认为与地球的大小相似,后来人们逐渐发觉,它并没有之前预计的那么大。德斯勒和拉赛尔对此进行了浅显的解释:冥王星其实在不断萎缩。他们把冥王星质量的衰减曲线输入一个含有无理数π的奇怪数学函数,他们认为,冥王星将在1984年消失。但别担心,根据公式,冥王星将在272年后重现(它的质量会从数学虚数变成实数)。
当然,这很荒谬。更合理的解释应该是,随着时间的推移,摩尔定律之类的定律势必会改进技术,于是我们的工具越来越先进,从而冥王星问题得到了更好的解决。虽然测出冥王星的确切质量还有待时日,但是我们现在已经明白:所谓事实,就是技术的进步,与测量的进步之间是有明确关系的。
说到误差,测量里有两个词:精确度(precision)和准确度(accuracy)。任何测量方法都具备这两种属性,要检测某样东西的真实值的时候,可千万不要忘了它们。让我们通过一个异想天开的例子来理解一下精确度和准确度。
想象一下,我们要通过一个激光指针来测定地表以上很远的一个点的位置。我们派两个不同的人来瞄准定点:一个是懒惰的年轻男孩,另一个是对测量十分严谨的老者。年轻男孩双手有力,能够将激光精确地指向墙壁上的点。但是他并不想瞄准那么长时间,因为根据我们的假定,他天生懒惰,所以他总是将胳膊搭在附近的平面上。这种的话,不管这个男孩瞄准多少次,激光点总是会落在低一点的位置上,因为他的手腕搭在了低处的平面。
与男孩相反,老者则竭尽所能。他把激光瞄向那个点位,但是由于年事已高,他的手轻微地震颤。因此,激光始终围绕该点在一定范围内徘徊,但它并不是那个点真正的位置。
如果你还没有明白,那我告诉你,这里的老者代表准确度,而年轻男孩代表精确度。精确度指的是多次测量所得结果的一致性。如果某个物体的真实长度是20英寸,那么精确度指的测量值如何围绕真正的值波动。要是一种测量方法测出的值始终是25英寸,而另一种测量方法测出的值始终是20.5英寸,那么它们都不准,但后一种方法更加精确,即使其测量结果是错误的。
准确度指的是测量值与真实值有多接近。如果你的测量值比真实值高了5英寸,那么就算你的测量结果非常一致(因此是高度精确的),它仍是缺乏准确性的。
当然,每一种方法都不是完全精确的,也不是完全准确的;它们或多或少都存在着不精确和不准确的地方。但是,我们可以继续努力去改善测量方法。我们这样做的话,精确度和准确度上的变化就都会影响我们的知识,有时还会引起翻天覆地的事实变化。
每个人都知道化学元素周期表。所有已知化学元素以列表的形式排列,包含了丰富的信息。每一块都包含着大量的事实。我们可以知道每个化学元素的化学符号、全名、原子序数和相对原子质量。
最后这两个词究竟是什么意思呢?原子序数的意思很简单:它代表一个原子核内质子的数量,也就是说等于原子核外电子的数量。因为原子核外电子的数量很大程度上影响着原子间的相互作用,所以知道了原子序数,化学家们就能相当迅速地掌握一种元素的化学性质。
但是相对原子质量就比较复杂了。当我还在小学的时候,老师说相对原子质量等于一个“正常”的原子核内的质子数加中子数。然而老师又说,每一个原子的中子数不尽相同。质子数相同的原子为同一种元素,而具有不同中子数的同一种元素的原子被称为同位素(isotopes)。
我们认为只有一个质子的氢是正常的(非放射性)原子。然而,还存在着另一种氢的同位素,它的原子核内有一个质子和一个中子,人们称之为氘。如果你把氘制成水,就得到重水,因为这种水比正常的水要重。重水凝结成的冰块在普通的水中会沉入底部。
所以,其实相对原子质量这个定义比我小时候学到的复杂得多。元素的相对原子质量等于其各种同位素原子核质量的加权平均值。所以,如果一个元素只有两种同位素,那么我们把它们在自然界中出现的频率乘以对应的质量,这样,如果你从地球取一大块该元素原子,而且是该元素所有同位素的混合物,那么就会得到一个你期待的重量,也就是一堆中子和质子的重量。
在很长的一段时间里,人们认为相对原子质量是常数。100多年前,人们首次计算出相对原子质量,后来它们就被写入元素周期表,在世界各地传播开来,唯有更为精确的测量出现时才偶有更新。但结果表明,相对原子质量不是一个定值。同位素混合值会因取样地、水源地而异。
现在,对同位素出现频率的更精确的测量已经成为可能,相对原子质量不再被视为常量。随着我们识别微小变化、淘汰过于精确的原子量的能力越来越强,最近,国际理论与应用化学联合会(The Internal Union of Pure and Applied Chemistry)承认了世界的这个状态;现在这个机构只是给出相对原子质量的范围(尽管许多的周期表仍然缺乏这一项),而不再给出具体的数字。
一度被认为是极其准确的常量,随着测算技术的进步,事实也变得模糊起来(就像珠穆朗玛峰的高度)。但是,测算的作用不仅在于计算数量和丈量高度。不论何时,只要我们想测试一个假设的正确性,测算(和它的近亲:误差)一般是科学进程中非常重要的因素。科学知识有赖于测算。
如果你在阅读科研成果时喜欢深究,那么你会经常碰到一个词:p值(p-value)。p值是新知识产生过程不可分割的一部分。更重要的是,它们为我们提供了一种估错的可能。
只要一个科学家想发现新的事物,或是验证一个令人兴奋的新假说,那他就要针对其他的东西来进行测试。具体来说,我们的科学家要对假设不成立的那个世界进行测试。这种世界状态,即有趣的假设不成立,目之所及与我们的悲观预期一样枯燥,就被称为零假设(null hypothesis)。我们可以通过p值来判断这个世界与令人兴奋的假说与否一致。
让我们举一个例子。假设我们认为某个基因——暂且称之为L基因——在左利手当中更为常见,因此它与左撇子有一定关系。为了验证这一点,我们召集了100个人,其中有50个左利手,还有50个右利手,并且测试他们的L基因。
我们发现了什么呢?我们发现,50个左利手当中,有30个人具有这个遗传标记,而50个右利手当中,只有22个人具有这个遗传标记。这似乎正是我们所预期的情形,我们发现:左利手比右利手更可能携带L基因。但真的是这样吗?
统计科学致力于通过更精确的提问来回答这个问题:左利手与右利手携带L基因的概率相同,但我们这回只是碰上了一批L基因分布不均匀的人,这种可能性有多大呢?我们知道,就是抛10次硬币,我们也不一定正好抛出5次正面朝上和5次背面朝上。我们的L基因实验也是同理。
输入p值。通过复杂的统计分析,我们可以把这种复杂的问题简化为一个数字:p值。我们的结果(似乎支持我们的假设)很可能仅仅是个巧合。
例如,通过一定的假设,我们可以计算出针对上述结果的p值:0.16,即16%。这意味着,这样的结果约有1/6的可能9是由于取样造成的(比我们预计的等频率的情况多出了几个携带L基因的左利手,又少了几个携带L基因的右利手)。
让我们再想象一下,如果我们扩大取样范围,仍然得到相同的比例:500个左利手当中,有300个人携带L基因,而500个右利手当中,只有220个人携带L基因。这种情况下,我们得到的p值非常小,小于0.0001。这意味着,上述可能性只有0.01%。样本越大,我们的检验效果越好。p值越小,我们的发现就越靠谱。
但是,要在一本科学杂志上发表研究成果,你并不需要那么小的 p值。通常来说,p值只要小于0.05就可以了[19],有时是0.01。0.05意味着,发表文章中声称的结果有5%的可能是不真实的!
漫画作家兰德尔·门罗(Randall Munroe)是这样描绘科学发表门槛的某些缺陷的10:漫画里,一些科学家在测试软心豆粒糖是否会引起痤疮。他们没有发现二者的联系,于是有人建议他们单独测试不同颜色的软心豆粒糖。他们测试了很多种颜色的软心豆粒糖,从橙红色到橘色,都不会引起痤疮,只有一个颜色例外:人们发现绿色的软心豆粒糖与痤疮有关,p值小于0.05。但是,他们究竟检查了多少种颜色的软心豆粒糖呢?答案是:20种。然而,就算结果是出于偶然[20],我们也无法阻止软心豆粒糖引发痤疮这个标题的大肆宣扬了。一位著名的进化生物学家约翰·梅纳德·史密斯(John Maynard Smith)曾进行过精辟的总结:“统计这门科学11就是让你一年做20个实验,然后把一个错误的研究成果发表在《自然》杂志上。”
我们对世界的测算和从中推断事实的能力与错误发生的概率是密切相关的,而在科学进程的每一个时点,测算的错误都可能通过各种各样的方法趁虚而入。其中之一就与p值有关,说的是当几个不同的科学家试图检验相同的问题时事实的“衰退”(有时甚至会消亡)。
在19世纪末20世纪初,天文学家们痴迷于一个对太阳系来说意义非凡的问题:X行星是否存在。
1781年,人们观测到了天王星,它是近代首个被发现的行星。之后的几十年里,人们在它的运行轨道上又观测到了许许多多运行怪异的行星。具体来说,天王星的实际运行偏离理论上的正常轨道,而且偏得很离谱。科学家们意识到,有什么东西在影响着它的运行轨道。最终在1846年,人们发现了致使天王星运行轨道异常的海王星。
这颗行星的预见以及发现特别值得庆祝:科学和数学的力量,进而人类的智慧,在此得到了充分体现。我们纯粹通过智慧就推断出了宇宙的一个组成部分——它的位置和等级完全可预测。
当然,这个过程需要重复验证。如果海王星的运行轨道也不正常,那么就可以推断,在海王星的运行轨道之外也有可能存在其他的行星。于是,自19世纪中叶起,针对X行星的位置和特性的严谨测算开始了。
但是X行星很狡猾12。冥王星被发现的时候(人们认为它就是X行星,尽管X行星与冥王星有着显著差异),针对X行星质量所进行的计算不下四次。随着海王星的运行轨道异常的估算不断深入,X行星不停地变小。
1901年,人们对它最初的估计是地球大小的9倍。到了1909年,这一数字下降到了地球大小的5倍。预期到1919年的时候,X行星就只有地球大小的2倍了。
当然,我们现在知道,如前文所说,冥王星的质量比这些估计结果都要小。因此无论德斯勒和拉赛尔怎么说,虽然冥王星短时间内不太可能变小,但是冥王星的质量是远远小于预期的X行星的质量的。
因此,即使是在冥王星被发现后,天文学家仍然在继续研究海王星和天王星运行轨道的不明特性,每一次研究都让他们意识到,X行星无须像他们以前认为的那样大。如今人们达成的共识是X行星并不存在。现在,“旅行者号任务”(Voyager missions)使我们对海王星的质量有了更好的认识,加之其他越来越精确的测算,我们觉得X行星似乎没有必要去解释先前的测定结果。
冥王星永远不会消失,但X行星似乎已经消失了。
在物理科学领域,诸如某些科研成果的有效性与某些现象的费解程度日益减弱,这样的故事很罕见。但是,在生物学、社会科学甚至是医药学领域,测算过程并不总是这么清晰,其结果也往往更具变数(由于存在人为原因等麻烦因素),所以这个问题更为常见。这被称为递减效应(decline effect)。在某些情况下,重复检验一项科研成果,那么它的有效性会日益衰减,重复检验一个现象也是如此。除了事实本身的半衰期,递减效应也表明,事实的影响力和量级有时也会发生衰减。
有些人把它搞得很神秘,其实不用这样,就像我们之前提到的X行星那样。越来越精确的测算往往让我们的探寻过程更为准确。而这些测算方面的进步常常会降低科研成果的有效性。
但递减效应不仅仅是测算造成的。它还有一个影响因素与测算的传播有关,叫作发表性偏倚(publication bias)。发表性偏倚的意思是,科学界和整个社会只了解那些已发表的信息。如果发表的信息里存在任何形式的系统性偏差(而且因此被众人测算),那么我们可能只会看到片面的信息。
阴性结果[21]的世界就是一个典型的例子。你应该还记得约翰·梅纳德·史密斯的话“统计这门科学就是让你一年做20个实验,然后把一个错误的研究成果发表在《自然》杂志上”。但是,如果同一个实验被20个不同的科学家各做了一次,其中19个人都将失败,19个人的职业生涯都会止步不前。这肯定很恼人,而且你会觉得这些科学家的时间都白费了,但是科学就是这么运作的。大多数的想法和实验都是不成功的。科学家们认识到,起起落落是这项比赛的固有特性。但重要的是,失败的结果很少能发表。[22]
然而,对于得到错误结果的那一位科学家来说(很棒,它的p值够低),真是非常的兴奋,他以为自己的测算万无一失(确实,他的测算万无一失,错误是统计本身的缺陷造成的),就很高兴地发表了他发现的有趣现象。
但是,如果一个人把他的研究工作重复一次,那么可能结论根本无效,就算说明了什么的话,可能也不明显,因为从一开始来讲,实验就不会成功。
这就是科学的运作方式。许多人想对测算和错误之间的关系了解得深入些,于是就更进一步钻研了科学的软肋,约翰·伊奥安尼迪斯(John Ioannidis)就是其中之一。
约翰·伊奥安尼迪斯是希腊约阿尼纳医学院(University of Ioannina School of Medicine)的一名医生兼大学教授,他痴迷于科学进程中的失败和更多的人类属性。他不研究趣闻逸事(如冥王星的例子),而是把众多例子结合在一起来探讨,以期对我们学习科学新知的方式有更深层的理解。他自己已经研究过递减效应,并发现这种现象在医学文献里屡见不鲜。他发现,那些引用频率高的临床试验13可能原先意义重大、影响深远,但是后来却淡出了视线或者完全销声匿迹,而且出现上述情况的还不在少数。
伊奥安尼迪斯翻阅了近15年内的医学文献,研究了引用频率最高的那些科研结果。在他检查的45篇论文中,有7篇(15%以上)最初具有很高的影响因子,另有7篇被后来的研究彻底反驳。此外,近1/4的科研结果再也没有被测试过,这意味着,文献中可能有许多的错误结果,它们因无人验证而不为人所知。
最初具有很高的影响因子的研究涉及众多研究领域。不管是HIV的治疗、血管成形术、中风,没有一个领域可以抵御递减效应。当然,类似地,还有一些领域受到了不一致研究成果的影响:冠状动脉疾病、维生素E的研究、一氧化氮等等。医生中流传一句话:“趁着新药目前还有效,赶紧使用。”
在这里,递减效应产生的原因是什么呢?伊奥安尼迪斯有没有提出什么新的解释呢?递减效应并不是由什么惊天动地或者让人困惑的东西引起的,它归结起来是一个复制和重要性的问题。测试得越多,我们就越了解。通常来说,越是重要的领域,测试也越频繁。可能在医学文献领域有比我们想象中多得多的错误结论,它们只是在等待着被验证。
当然事情总是很复杂的。伊奥安尼迪斯指出:
如果新的研究无法证实早期研究的有效性,或者新的研究得到的结果比早期的研究成果的有效性弱,那么这并不代表早期的研究成果是完全错误的,也不代表规模更大、可控性更强的新的研究得到的结果就是正确的,因为两者之间是存在差异的,这些差异可能包括疾病谱、接受实验的资格、伴随干预措施等。
我们应该警惕妄下结论。
然而,与提高精确度和p值的想法一致,伊奥安尼迪斯写道:
认为有效性很强的那些早期实验,其有效性是有一定的概率范围的。这一点佐证了一种观点,那就是临床研究成果,尤其是早期的研究成果,不仅应该用点估计来解释,而且应该考虑到它们周围的不确定性。
最近,伊奥安尼迪斯对各种生物标志物进行了同样的实验14,他发现,随后的荟萃分析经常出现递减效应。我们必须时刻谨记,我们是存在于不确定性之中的。如果忘记这一点,我们就会做出草率的结论。
这些不一致的有效性与伊奥安尼迪斯的一篇论文有关,这篇论文估计是他最有名的文章了15,它对科学研究的许多方面进行了猛烈抨击,于2005年发表在期刊《公共科学图书馆·生物学》(PLoS Biology)上,标题是《为什么大多数已发表的科研结果都不正确》(Why Most Published Research Findings Are False)。截至2011年年底,这篇论文的总浏览量已逾40万次,被引用总量已逾800次。
他运用数学论证清楚地解释了为什么许多科研结果是错误的。他阐述了几个已经讨论过的主题,他寻找的是假阳性结果的情况,也就是一项其实不正确的发现被“发现”的情况。
在一期《每日秀》节目中,记者约翰·奥利弗(Tohn Oliver)采访沃尔特·瓦格纳(Walter Wagner),瓦格纳是一位科学老师,他试图通过诉讼来阻止大型强子对撞机(Large Hadron Collider)的启用。大型强子对撞机是可以产生巨大能量的粒子加速器,而瓦格纳认为,它能产生一个足以摧毁地球的黑洞。
当奥利弗问瓦格纳世界有多大的可能会因此被摧毁,瓦格纳回答说“我们目前只能说一半对一半”。瓦格纳认为,这件事要么发生,要么不发生,因此,事情发生的概率是50%。
不过他的说法是很荒谬的。在测试一个假设之前,人们一定会预期它发生的概率。正如另一位接受《每日秀》节目采访的科学家所说,基于现有的物理学的基本定律以及对粒子加速器的工作原理的了解,可以推断,地球毁灭的概率为0。
在测试一个假设之前,我们的预期概率被称为先验概率(prior probability)。先验概率仅仅是根据以往经验和分析所预测的概率。一旦我们测试之后,我们得到的东西被称为后验概率(posterior probability):指在得到“结果”的信息后重新修正的概率。
伊奥安尼迪斯认为,在一个给定的领域里,有一些变量是真的,但更多的变量是假的,这些真假变量之间存在一定的比例关系。所以,在每一个领域里都有一个真假变量比。你可以把它想成吸烟致癌的比例假设,或者软心豆粒糖引起痤疮的比例假设。
于是,伊奥安尼迪斯就采用这种比例,以及统计假设检验中被称为显著性(discriminating power)的东西(显著性是)一个概率值,代表实验得到阳性结果的能力,来检验实验的结果是否正确。
他用定量的方式从本质上揭示出:即使是错误的研究成果,如果具有了统计学意义和可发表性,那么也有发表的可能。这种情况非常多,比如一个领域的研究真假变量比较低(也就意味着虚假关系出现的可能性很大,或者这项实验取样很少,或者这个领域的研究成果无法复制重现)。
根据他的分析,伊奥安尼迪斯建设性地提出了一些常识性推论,我也添加了自己的注释:
在一个科学领域里,研究的规模越小,得出的结论越不真实。如果一项研究的规模很小,那么它因为偶然性而得出阳性结果就很容易。就像那个在小白鼠身上进行新药检测的典型临床试验,它声称新药在1/3的小白鼠身上/疗效显著,1/3的小白鼠无明显反应,1/3的小白鼠逃走了。
在一个科学领域里,效应量越小,得出的结论就越不真实。如果效应量很小,那就可能和X行星一样,那么我们只是测算没有意义的噪声而已。
在一个科学领域里,测试次数越多,选择的测试关系越少,得出的结论就越不真实。更多次的实验可以让我们发现那些因为偶然概率才成立并获得发表的结论。
在一个科学领域里,研究的设计、定义、结果、分析模式等越灵活,得出的结论就越不真实。数据的窜改空间越大,人们为了获得理想的结果而窜改数据的可能性就越大。
在一个科学领域里,研究中涉及的经济或其他方面的利益越多,偏见越多,得出的结论就越不真实。既然科学家也是人,并非十全十美,那么可能出现的偏向越大,得出的结论就越有可能是错误的。
在一个科学领域里,竞争越是激烈(参与其中的科学团队越多),得出的结论就越不真实。更多的角逐团队意味着任何阳性结果都会被迅速而夸张地炒作,并且很快就人尽皆知,但是它却使得那些很容易反驳的研究获得了等量的炒作。伊奥安尼迪斯指出,这就是变形杆菌现象产生的原因,也就是他说的“快速逆转极端的研究成果以及与之恰恰相反的研究成果”。
要解决这个难题,就需重复实验,一遍又一遍地测算同一个问题。通常情况下,试着去发现一些新的东西比重复别人的实验要有意思得多,所以人们不会去重复实验。还有一个原因是,许多科学家重现实验结果是很困难的。特别是当他们认为实验结果其实是错误的,他们就更不会这样做了。
为什么会这样呢?卡尔·齐默(Carl Zimmer)在《科学》杂志上发表了一篇论文,关于细菌的DNA骨架会不会吸收砷的争论16。他解释道:
但是,没有一个持反对意见的人真去重复最初的实验。这项研究要花上好几个月的时间:首先向最初进行实验的科学家团队索要细菌,然后培养细菌,接着设计实验,再收集结果,最后分析结果。许多科学家都不愿意花那么长的时间在他们认为已成定局的结论上,而研究生们也都不愿意重复实验,因为他们希望自己的第一个实验能引人注目,而不是去证实别人已经提出来的假设。
“我还有自己的课题要研究呢。”约翰·黑尔曼(John Helmann)对《自然》杂志如是说,他是康奈尔大学的一位微生物学家,也是《科学》杂志的一位评论家。
讲得更明白一点,纽约州立大学石溪分校(State University of New York, Stony Brook)的科学社会学家斯蒂芬·科尔(Stephen Cole)援引一位科学家的话说:“如果证实了第一个科学家的研究成果17,那么是帮助这个科学家获得了诺贝尔奖,而他们(进行重复实验的团队)却什么好处也捞不着。再者说,如果不能证实这个研究成果,那么他们的工作就不会产生任何积极意义。”
但是,只有通过重复实验,科学才能像我们希望的那样不断改正错误。重复实验使得推翻实验结果和靠近真理都成为可能,这也是科学的最终目的。在一篇后续论文中,针对伊奥安尼迪斯多少有些悲观的结论,研究人员计算出:少量的重复实验18可以使我们的科学更为强大。但是我们应该怎么做呢?
许多科学家正在努力让阴性结果的发表更为容易,也更易被人们所接受。由于在科学的世界里,令人兴奋和惊讶的东西总是先声夺人,所以声称一个假设有错误的论文几乎是不可能发表的。除非这项研究工作推翻了一些知名的成果或法则,否则就算它发表了也不会有人理睬。很多科学家都在倡议,期刊和数据库应该致力于阴性结果的发表,从而填补这一部分的空白,并且,这样的期刊已经开始筹划了。如此一来,总是出现在文献里的阳性结果就会遇到阻碍,阴性结果的存在也将有助于把握递减效应。此外,阴性结果还能为行走在科研道路上的其他科学家指路,让他们明白哪些研究尚未得出明确结论,从而避开不成功的研究。
科学并没有崩溃。要是上述内容引起了读者的担心,那么我必须解释一下,科学绝不是一堆庞杂的错误。但是,我们要如何从混乱地带(那里可能充斥着错误和草率的结论)的边缘返回正途呢?
所幸,在科学领域里,错误和草率的结论并不多。虽然在少数的情况下它们确实会出现,但是总的来说,科学还是在不断向前发展的。
正如英国皇家学会会长弗洛里勋爵(Lord Florey)所说:19
科学很少被“突破”(这是我们当今的术语)推动,我们知识的增加更多地是依赖于千千万万科学工作者的努力,他们的添砖加瓦最终成就了这个绚烂多姿的世界,就好像法国点画派艺术家用点彩技术绘制他们极为漂亮的油画一样。
科学不总是日积月累的20,科学哲学家托马斯·库恩(Thomas Kuhn)这样说。科学的进程少不了挫折、错误和错误的逆转。然而,我们必须把科学的核心与边界区分开来,这两个词来源于纽约州立大学石溪分校的斯蒂芬·科尔。科学的核心指的是在某一领域内为我们所知的相对稳定的那一部分内容,这些事实不大可能发生改变。毫无疑问,将来我们还会发现一些新的知识,它们将帮助我们了解DNA真正的工作原理以及基因是如何开启和关闭的,但是,DNA里基因的基本编码机制不大可能属于中央事实范畴。虽然关于DNA如何携带蛋白质信息这条生物学的中心法则会变得日益复杂,但是它的基本原则是我们所知的科学核心部分。这些核心内容是业内公认的真理,并且通常被写进了教科书。
另一方面,科学的边界往往充满变数,不管是报纸里关于什么健康什么不健康这类常识的更迭,还是期刊上无尽的撤稿、澄清和重复实验,皆是如此。这就是科学家们的世界,说句老实话,这也是令人兴奋之事的诞生地。在这里,大多数科学家都不知道什么将会变成敲定的事实。
一位潜心研究科学的社会性的理论物理学家约翰·齐曼(John Ziman)指出:
科学文献里半成品俯拾即是21,它们或多或少都有正确的部分,但它们的细致程度和概括性并没有达到一劳永逸地解决问题的地步。原来,本科阶段的理科教材里,编入教材的知识系统有序,而现在,取而代之的是一个无以名状的领域,上面散落着星星点点的碎片,纵横着鸿沟,充斥着巨大的未见成果的知识体系和微小的巧妙的杰作,而研究生们则要从中找出一篇不知所云的评论文章,然后以此确立自己的研究方向。
一般民众想要搞懂这些还真不容易。
科学边界上的错误有很多,包括测量错误、假阳性结果等等,本书已一一探讨过。但是科学也因此而有刺激性。科学本来就依仗人类的刻苦钻研,含着人性里所有的消极面。但我们不妨也积极地看待这种不确定性,因为科学还未尘埃落定的时候是最刺激、最令人兴奋的。
知识从边界向相对紧凑而微小的核心区域移动正是一个筛选和过滤的过程。我们应该享受这个过程,而不是陷入绝望。最让人欣慰的其实并不是我们发现了事实的变化、颠覆,而是我们能够竭力地解释这个世界。而且,现在这些新的事实的产生只能依靠测量。
除了找出定量错误、界定我们周围的事物(如测量珠穆朗玛峰的高度),测算在其他方面也能产生深远的影响,如推翻浅显的道理、创造前所未有的新知识。
战争22以及它是否存在,就是一个明显的例子。乍一听挺愚蠢的:战争当然存在。它一直存在,似乎还是一种常态,至少在世界上某些地方是这样的。
然而,美国俄亥俄州立大学(Ohio State University)的一名政治学教授约翰·米勒(John Mueller)决定实际测试一下这个概念。米勒首先给出了“战争”一词的贴切定义,他的定义合理,而且定义的接受度很高:战争指的是两个政府之间,或是一个政府和一个有组织的团体之间发生的冲突(包括内战),而且因冲突导致的死亡人数每年逾千人。
米勒通过各种渠道搜集到了自1946年以来的所有数据,结果发现,从1946年到冷战结束的这段时间里,战争的数目出现过一次增长,而从那之后,战争的数目发生了骤减。他的研究还表明,绝大多数的战争都是内战。除了诱因以外,战争的数目现在已然是中央事实了。在过去的几十年里,战争已经从愈演愈烈的常态变成了很罕见的事情。
这则事实很是惊人。除了有悖常理以外,还有一个原因:没有细致测算的话,这个事实便不能浮出水面。一个新兴的科学组织正在通过数据挖掘来探寻认识世界的全新方式。此类数据挖掘的功臣正是弗朗西斯·高尔顿(Francis Galton)。
弗朗西斯·高尔顿生于1822年23,他出身于名门望族,高尔顿家族世代都是科学家和商人,查尔斯·达尔文和他是表亲。但是高尔顿最初并不得志。虽然人们认为他是少年神童,但是他在孩提时代的生活其实相当漂泊而平凡——他游历世界,在剑桥大学的学习成绩相当差。
然而,高尔顿的探索一经编纂出版,他的科学家潜质即刻显现出来。不久,他参与的研究遍及生物学、数学、摄影和人类学等领域,并且在这几个领域都做出了杰出的贡献。
对数据和数字的痴迷贯穿了他毕生的工作。高尔顿收集各种数据。他研究当代杰出人才的相关数据。他研究大学生学习成绩的相关数据。他研究人类身高的相关数据。他写了一篇论文24,题为“论剑桥大学学生的头增长”(On Head Growth in Students at Cambridge)。他甚至基于自己的研究给《自然》杂志写了一封信,探讨人脑的数字可视化25。向英国首都伦敦警察厅总部(又名苏格兰场,Scotland Yard)推荐指纹识别技术的正是高尔顿。他甚至根据他在不同的地点邂逅美女的数量26,绘制了一张英国的美女分布图。芝加哥大学的统计学家斯蒂芬·斯蒂格勒(Stephen Stigler)认为,高尔顿是统计启蒙运动的始祖27。
同样对数据满腔热忱的德里克·普赖斯这样评论过高尔顿28:
我觉得,有两篇文章最能表现高尔顿自娱自乐的热情。在第一篇论文里,他根据人们的祈祷推算出王室和牧师还将在世上存在的年限;他得到的结果是一个负数。而关于第二篇论文,则是画家为他画肖像时他觉得坐着无聊,为了打发时间,他计算出一幅简笔画大约有20 000笔;他还计算出编织一双袜子手要动20 000下。
高尔顿对数据从来没有抵触情绪。虽然他的许多研究成果可能不再被人认可,但是他这种把分析与数学技术相结合的方法大获成功,他这样做以后,许多只能通过细致、详尽、烦琐的测算过程才能发现的新事实显露了出来。
专注数据研究,发现数据库中的新知识,这正是科学的标志。对于数据如此痴迷的高尔顿并非异类,也不能说科学剑走偏锋。相反,许多妙趣横生的伟大实验都说明了,数据采掘其实是科学(尤其是社会学和社会心理学领域)传统的一种盛大传承。
斯坦利·米尔格兰姆因权力服从研究的电击实验而名声大噪,他也是测出六度人脉的第一人,他设计过众多巧妙的实验。其中有一个很具高尔顿风范,被人们称为人行道实验(sidewalk experiment)。他让研究生们站在纽约市的一条人行横道上抬头仰望,然后测算这组学生里有多少个向路人提出停下来加入他们行列的要求,至少让路人看看他们自己。这些精心收集的数据为群体行为研究提供了一种视角。
通过类似的古怪社会实验来采集数据的人还有很多。例如,研究人员研究过餐饮店的选址以及不同社区的特点,甚至研究过老人是否在绿灯给定的时间内穿过马路29。
在过去的几年中,所谓的数据科学(data science)有了长足的发展。当然,所有的科学都离不开数据,但是数据科学不仅仅囿于高尔顿的方法,它分析大量的数据,如人们如何在互联网上约会、如何在拨打电话、如何在网上购物等等,如此一来,我们对世界的认识就变得形象化、明晰化,在这个过程中,我们也会发现有关自己和周围事物新事实。
一言以蔽之,测算给了我们一双发现的眼睛,而用来量化周边环境的工具功不可没。但是,测算并非屡试不爽,总有量化之光无法照到的地方。有些测算容易,有些测算难,而且这种难易差异会对我们的知识产生深远影响。
什么可测,以及什么时候可测,两者都决定了我们能学到什么。如果我们不能测算,那么我们的知识就会出现偏差。例如,生物学中有个词叫分类偏好(taxonomic bias)。它指的是我们研究某些生物的动机不在于该物种更普遍,而是因为我们更喜欢,或者因为它们更易于获得。虽然脊椎动物(大多数我们熟悉的生物都属于这一类)只是地球上种类极少的一个种群,但是绝大多数的科学论文都以它们为题30。有时愈演愈烈——比起鸟类和哺乳动物,两栖类和爬行类动物较少受到关注,因为它们体表黏糊糊的,或者长相不那么可爱,科学家们甚至称之为分类沙文主义31(taxonomic chauvinism)。
别以为分类偏好在科学知识领域里不值一提,它可会对大众文化产生蝴蝶效应。让我们再回过头来讲讲恐龙。这些集众人宠爱于一身的庞然大物,已经深深嵌入了大众文化,特别是暴龙、三角龙、剑龙这些家喻户晓的恐龙。
但这是有原因的。美国的恐龙古生物学着手研究时,有两处主要的恐龙化石遗址:蒙大拿州的地狱溪(Hell Creek)和怀俄明州的科摩崖(Como Bluff)。地狱溪恐龙化石遗址发现得较晚,1900年才开始挖掘;而科摩崖恐龙化石遗址的影响特别大,因为负责挖掘的是奥斯尼尔·马什。当然,爱德华·柯普誓不罢休,这使得科摩崖恐龙化石遗址成为他们化石大战的众多战场之一。
这两个遗址出土的恐龙化石属于侏罗纪和晚白垩纪。由于它们是最早的大规模发掘点,而且出土了大量的恐龙化石,所以它们在美国恐龙史上占有举足轻重的地位。科学家们在这些遗址里最先发现的和数量最多的是什么恐龙?是暴龙、三角龙、剑龙。其实雷龙之所以32具有如此显赫的地位,主要原因就是马什在科摩崖恐龙化石遗址发现了一具完整的“雷龙”骨架。
如今,任何一家值得一去的博物馆都有这些大牌恐龙展。而大多数人都没想过为什么展览的是它们。其实原因很简单:这些恐龙的发现时间最早,在某种程度上,它们就是恐龙界低垂的易摘果实。它们在化石中具有先发优势,因此,它们在我们大脑存储的恐龙知识里占据了非常大的比重。存在的事物不一定会成为我们的研究对象;我们研究的往往是自己感兴趣的,要不就是最容易发现的。
测算是一把双刃剑。它可以产生前所未有的错误。它可以不知不觉地把我们频繁引向某些特定主题,于是就造成了一种信息偏差。它可以编造科学的弥天大谎。测算有待检验,我们绝不能轻易地全盘接受。虽然我们可能无法一眼识破错误的研究成果,但是科学原则会让我们明白,我们是如何一步步误入歧途的。
但是测算也可以创造新的知识,可以推翻虚假事实,亦可以把世界上我们尚未察觉的新东西揭示出来。随着测算技术的进步(测算技术的进步遵循数学规律),我们现在能够更深入地了解这个世界。
对周围环境的测量是人类发展进程的内在组成部分。但是,想要把事实和创造、传播、揭穿它们的人分离开来,几乎是不可能的。测量更是如此。我们已经知道了事实是如何改变的,现在是时候来讲讲最后一个问题了:人类对知识变化的影响。
[19]在概率学中,5%以下为小概率事件,可以忽略不计。——译者注[20]取样过少,不具有统计学意义。——译者注[21]在软心豆粒糖与痤疮的实验中,两者有关即为阳性结果,无关即为阴性结果。——译者注[22]科学研究中不可避免地会出现阴性结果(p值>0.05)。如某个问题的研究,有阳性结果,也有阴性结果,尚不能下结论,但如果阳性结果均得以发表,而阴性结果被搁置,那么错误的研究成果可能就无法得到修正,因为有时会忽略发表的结果为假阳性结果的可能。——译者注
第9章 被人类影响的事实
青蛙的视觉1很特别。如果你把一只死的飞虫悬在饥饿的青蛙面前,青蛙并不会吃它。青蛙根本意识不到死飞虫的存在。但是,如果让一只活的飞虫和青蛙共处一室,那么青蛙一定会积极地捕捉它的午餐。
看来,青蛙只能看到运动中的目标:如果食物不动,青蛙就会认为它不存在。
虽然这有别于人类的视觉特点(我并不希望我的食物一直移动),但是我们从中明白了一个道理:我们很容易发现移动中的和迅速变化的东西。但是,如果只有非常缓慢的变化,我们通常就意识不到。我之前讲过的“温水煮青蛙”也是这个道理,温水里的青蛙会心甘情愿地接受死亡。尽管无凭无据,许许多多的人仍不断提起这个故事,包括我自己在内。这是为什么呢?这是因为我从中发现了一些道理。我们看不出公园里怪异的“人体雕像”在缓慢移动,我们无法看出植物的生长过程,天降温了以后我们才发觉穿的太单薄……我们不具备应对缓慢变化的能力。
人类的认知能力并不是十全十美的。我们会产生视觉幻象,需要越来越昂贵的安慰剂,记忆还经常被扭曲。人类在东非进化过,现在已经时过境迁,我们每天面临的情况和当时作为搜食者的人类所面临的情况已截然不同。进化过程中有一些不完美的部分,导致我们对现代社会的许多方面无能为力。
这并不是说我们所做的选择都是不合理的、荒谬的,也不是说我们应该畏缩不前,不再与精彩的现代技术世界打交道。但是,我们的处世之道确实符合丹·阿雷利(Dan Ariely)所说的“可预见的非理性”的方式。然而,如果我们知道了我们的大脑和心理有怪异之处,我们就可以更好地理解自己做出的决定,更好地认识我们为自己创建的世界。纵使我们获取新知和事实的方式不是完全理性的,但其中的偏差还是有规律的、可预测的,对我们来说,这才是最重要的。本章主要介绍我们大脑和心理的怪异之处对认知的影响。
曾经有人向约翰·梅纳德·凯恩斯(John Maynard Keynes)发问,为什么他会转变自己的货币政策立场,然后他说出了一句不朽的箴言(尽管可能是他杜撰的):“当事实发生变化的时候,我会改变我的想法。您会怎么做呢,先生?”很多时候,我们没有像凯恩斯那样做。我们被困在原地,动弹不了,就算与事实的改变撞个正着,我们也不会有任何的改变。这是为什么呢?原因纷繁复杂:可能是我们未能察觉变化,可能是我们不相信变化正在发生,还有可能是我们根本就不相信那些事实,我们的不完美让我们无法立即适应身边的变化。
纵观我们的一生,那些缓慢的变化(人生的中央事实)皆是如此。不管我们出生时世界是什么状态,过不了多久,我们往往会把它当成正常状态。
这种情况叫作变动基准线症候群(shifting baseline syndrome),它指的是当我们出生时,或初次遇到某种情况时,我们如何适应那种状态。由于我们只能看到一代人身上发生的变化,如果缓慢的变化延续了好几代人,那么我们常常无法察觉到。
丹尼尔·保利(Daniel Pauly)在提出世界鱼群数量变化时创建了变动基准线,他是提出这一概念的第一人。当欧洲人刚开始在纽芬兰(Newfoundland)和科德角(Cape Cod)捕鱼时,鱼多得令人难以置信。在17世纪的时候,科德角的鱼如此之多,2“以至于我们几乎无法划船前行”。好像没有什么能够减少它们的数量。但是,人类捕鱼史尚不足两百年,可是许多物种都灭绝了。
这怎么可能呢?保利对此描述道:
每一代渔业科学家都把职业生涯刚开始时的鱼群规模和物种构成作为基准,并以此来评估之后的变化。当下一代人开始其职业生涯时,鱼群的规模进一步下降,但是这时鱼群的规模又被当成了新的基准。结果就是基准线逐渐改变,鱼群的密度下降,自然资源中的物种渐渐消失。
每当我们迎来新的开始,定好基准线后,记住事物的“常态”总是很容易的,有时这可能只是我们下意识的做法。但是,我们不能让它左右我们的思想,因为它有可能导致灾难性的后果。
当然,变动基准线还可以在小处以更微妙的方式影响我们。计算机科学的先驱艾伦·凯伊(Alan Kay)对科技的定义是“人类诞生之后的所有发明”3。对于很多人来说,这个定义代表了一切新兴的、颠覆传统的一流技术创新,如网页浏览器和iPad。如此一来,我们便忽视了身边旧有的那些同样重要的技术,从铅笔到窗玻璃,都属于这一范畴。
但是,即使在一个生命周期内,一般性的事实惰性无处不在。不知道你在纽约乘地铁时有没有向老纽约人问路的经历?你本以为他的回答是一趟以数字或字母命名的火车,结果,你会听到很多IND、BMT、IRT这样的词汇。其实这些神秘的首字母缩写是机构的名字——独立地铁(Independent Subway),布鲁克林–曼哈顿线(Brooklyn-Manhattan Transit),区际捷运(Interborough Rapid Transit),而纽约市的地铁最开始是由它们运营的。尽管在20世纪40年代,这些相互竞争的系统被合并了,但是许多人仍在使用它们之前的名字。可能只是我们无法与事实变化的速度同步吧。
面对变化却墨守成规的例子也不在少数。1920年1月13日,《纽约时报》嘲笑了罗伯特·戈达德(Robert H. Goddard)的观点。戈达德是火箭技术领域一位开创性的物理学家,并得到史密森学会(Smithsonian)的支持。尽管如此,灰色女士(Gray Lady)[23]在一篇社论中说道,认为火箭可以在真空空间里工作是极其愚蠢的,也是对高中物理学明目张胆的践踏。编辑们甚至列出了要点一一细述以抨击戈达德。
所幸,《纽约时报》自发地做出了修正。唯一的问题是:修正文章见诸报端正是1969年阿波罗11号飞船发射的后一天,即人类首次实现月球行走的三天前,他们轻描淡写地撤回了之前的社论4:
进一步的调查和实验证实了牛顿在17世纪的发现,现在火箭确实可以在真空中以及大气中工作。《纽约时报》为之前的错误致歉。
为什么我们相信错误和过时的事实呢5?原因有很多。凯瑟琳·舒尔茨(Kathryn Schulz)在她的著作《我们为什么会犯错》(Being Wrong)中对我们犯错的原因进行了逐一探讨。我们犯错,有时是因为我们想要相信它是真的。有时是因为矛盾(舒尔茨指出有种偏执正是因为物极必反)。但是通常来说,原因就是我所说的事实惰性:在信息失实很久以后仍然墨守成规的一种倾向。
事实惰性形式多样,近来出现了一些进化心理学方面的阐述。进化心理学不仅没有对我们的认识偏差讳而不提,还接纳了这些偏差,甚至试图去寻找这些偏差对人类进化的贡献,在此之前,人们可能认为这些偏差不利于进化。
那么,事实惰性到底会以怎样的形式呈现呢?我们来看看布拉德利·雷(Bradley Wray)的歌词吧。
2009年12月,布拉德利·雷正在帮助高等预科心理学课的高中生们备考6。雷创作了一首朗朗上口的歌曲以便于他的学生们复习,他还在网上发布了歌曲的一段视频。
这首歌的主题是什么呢?是认知偏差(Cognitive bias)。进化的不完全迫使我们都背负着一整套心理层面的怪异。这些怪异之处或许有助于我们在大草原上分辨季节的变化以及觅食,但是在如今这个相互关联、高度复杂、快速变化的世界里,它们的作用并不大。这些怪异之处被称为认知偏差,各种偏差还有不少,甚至还涌现了一个致力于记载它们的小型出版产业。
雷的歌曲里有这么几句(这种歌词肯定获不了格莱美奖):
我有失偏颇,因为我可能把你分错了类。
代表性偏差(Representativeness Bias):不要把这首歌放在老套的那一类……
我有失偏颇,因为我为成功邀功请赏,却把失败归为外因。
自利性偏差(Self-Serving Bias):成功在于我,失败在于你。
这些偏差在我们的生活中比比皆是。对很多人来说,自利性偏差一点儿也不陌生,只不过人们浑然不觉罢了:体育运动中总会上演这一幕。在曲棍球或足球比赛中,如果球队获胜,那么射门得分球员功不可没。但是如果球队输了呢?守门员会受到不公平的对待。从某种程度上来说,其他球员都是自利性偏差的受益者——成功了他们有功,失败了他们无罪,至少媒体总是这么描绘的,虽然说这种认知偏差和他们没有任何利害关系。目前,已经有超过100种偏差被人们编目入书。
19世纪40年代,有一位独具慧眼的著名医生叫伊格纳兹·塞麦尔维斯(Ignaz Semmelweis)。那时他刚进入维也纳医院的妇产科,但是他注意到,有的产妇在他的科室分娩,有的产妇在自家分娩或通过其他科室的护士助产,两者之间存在一个奇怪的差别。较之于助产分娩的产妇来说,那些在医院妇产科进行分娩手术的产妇患上产褥热(childbed fever)的概率要高得多,这种病常会导致妇女在分娩后迅速死亡。塞麦尔维斯还发现,如果在那些医生不进行尸体解剖的科室里分娩,那产妇患产褥热的概率与在家分娩一样低。
塞麦尔维斯认为,这些医生7又解剖又接生,前脚从太平间出来,后脚直接迈进了产房,因此不知不觉把尸体上什么坏东西带到了临盆的妇女身上,才导致了她们的死亡。
塞麦尔维斯提出了一个简单易行的建议:进行接生手术之前,医生要用漂白粉溶液洗手。而这个建议奏效了。患上产褥热的产妇数量降低到了原来的1/10。
然而,塞麦尔维斯并没有因为挽救了无数条生命而获得赞许,相反,他遭到了排挤。19世纪中叶还没有任何细菌理论。主流观点认为,“脾性”失衡导致了疾病的发生。如果你注意到有的人“脾性和善”,这就是昔日医学理念的遗存。所以,大部分医疗机构都无视塞麦尔维斯的建议。这件事情对他造成了极大的刺激,他最后的几年是在精神病院度过的。
仅仅因为有悖于一个人的世界观就漠视一些信息,这种倾向被称为塞麦尔维斯反射,也叫塞麦尔维斯效应。与之相关的是证实性偏差(confirmation bias),也就是你只接纳与自己的世界观一致的信息。
塞麦尔维斯反射和证实性偏差都是重要的事实惰性。即使我们碰到的一些事实本应改变我们的世界观,但我们还是选择了无动于衷。我们只喜欢在自身现有知识库存的基础上有所拓展,而不是去忘掉自己的世界观,接受不符合已有成见的新知识。这就类似于丹尼尔· 卡尼曼(Daniel Kahneman)的理论诱导盲区(theory-induced blindness)理论8:“一旦你接受了某套关于世界运作方式的理论并笃信之,你就很难发现世界的本来面目了。”
一般而言,这些偏差是有用的。这让我们快速地知晓未知的事物,并从信息中完成推断,以便当机立断。你要深究我们到底看到了什么,毫无疑问我们的祖先就总是这么做的。例如,过去我们看树顶,即使视线有些模糊,我们也可以知道它与之前见过的树顶是否一样。如果看着不像,这个画面还是会留存在我们的脑海里(例如,它看上去很奇怪,因为有一只猴子在上面)。但是,但凡我们要评估知识和事实的正确性,我们就会经常受到这种偏差的影响。
塞麦尔维斯反射只是众多认知偏差中的一种,与它相关的有另一种心理机制缺陷,叫作变化盲区(change blindness)。它指的是我们的视觉处理系统出现的一种异常。如果我们过于专注一件事情或者一项任务,我们就无法察觉其他的变化,甚至是重要的、令人惊讶的东西。联盟学院(Union College)的克里斯托弗·查布里斯(Christopher Chabris)教授和伊利诺伊大学(University of Illinois)的丹尼尔·西蒙斯(Daniel Simons)教授在这个领域进行了一系列开创性的实验9。你可能在网上的趣味小视频里看到过他们的实验。
其中有一个视频拍的是健身房里的小实验。视频里,实验对象要完成一项任务,即观察篮球运动员的传球姿势(如跳传),或是谁传球给谁(篮球运动员身着不同颜色的球衣)。
然后,有趣的事情发生了。视频播到一半的时候,一个从头到脚扮成大猩猩的女人走到了篮球运动员中间。她像大猩猩一样捶打胸部,然后又穿梭于篮球运动员中间。当然,她与正常传球的人们迥然不同,用“奇怪”、“令人惊讶”等诸如此类的形容词来描述她一点也不为过。
但最惊人的是:50%的实验对象完全没看见大猩猩。这一变化盲区又被称为无意视盲,它是一种信息处理系统的异常。盯着一处看的时候,我们完全忽略了身边其他的东西。
魔术师巧妙地利用了我们的这一缺陷来误导我们。魔术师会趁你的注意力集中在他的左手时,快速用右手完成所有的重要戏法。这一把戏甚至能骗过接受过训练的魔术师们。
魔术师学习新魔术的常见方式是看教学视频。首先,魔术师当着观众演示一遍魔术,然后他会对其中的奥妙娓娓道来,然后再演示一次,最后再从不同的角度、放慢速度演示一次。我曾经见过一个拇指尖魔术——用一个假的橡胶拇指来隐藏各种东西,如手帕。魔术师教完他的小把戏后,他告诉观众,为了让观众更容易看懂,他特意用了鲜红色的拇指尖。
经他这么一说,我震惊了。我看得如此专注,依然被魔术师骗了,我根本没留意到眼前的东西:一根可笑的红色假拇指。我也受变化盲区所困。
在事实和知识的世界里,变化盲区也很棘手。有时候,新的事实就在眼前,我们只要把新的事实过滤出来就行了。但更多的时候,我们必须换一个视角才能学习新的东西。我们的盲区不是看不到新的事实;而是看不到残留在大脑中有可能彻底过时了的事实。相对而言,继续引用一个你几年前阅读杂志时学到的事实是不难的,难的是进一步发现目前美国排名前十的大城市,并且意识到它们早不是我们年轻的时候学的那些了。
但是不管我们被怎样的偏差所困扰,事实惰性都贯穿我们的一生当中。
我们在文件上写错日期或年份就是这样一个疏于响应变化的例子。
新年伊始,你有没有写错过年份?不管是在学生的作业里,还是在法律文件里,这种错误都不少见。还有更夸张的。2011年5月24日,美国总统奥巴马访问英国。途经威斯敏斯特教堂(Westminster Abbey)的时候,奥巴马决定在留言簿上签个名10。他写下的关于扩大美英两国共同利益的外交辞令简直无可挑剔。唯一的问题是落款时间,他写成了2008年5月24日。也许他3年前胜选后就再也没有写过日期了。不管怎样,无法应对变化不仅仅是日常的小插曲;它的后果可能非常严重。所幸,即使是法律的拟定也体谅我们有弱点,体谅我们不能总是更新事实。在法庭上,重要的是意图,而不是无意识的机械记忆,所以错签一份具有法律效力的文件一般是不需要承担责任的。
我决定在一个由亚马逊创建的土耳其机器人(Mechanical Turk)的网站上做一个简单的实验,以此来了解人类的事实惰性。土耳其机器人这个词得名于18、19世纪一场著名的骗局。土耳其机器人是一台复杂的设备,它曾经在整个欧洲大陆上巡展。虽然看起来它是在自动下棋,但其实是有一个人隐藏它的后面控制着机器。
为了向此致敬,亚马逊公司把它的在线劳工市场网站命名为土耳其机器人。人们在这个平台上发布需求(如标记图片),之后,土耳其机器人们(就是想完成任务的人)就会执行这些任务,从而赚取一些零花钱。因为实验对象众多、价格低廉、实验周期短,所以近年来,土耳其机器人已经成为社会科学绝好的实验基地。虽然它选取的研究对象也有一定的局限性,但是这已经远远好过传统实验中的研究对象(一般都是大学生)。
作为科学研究的一部分,我和团队开发了一个软件基础平台,它通过在线运行实验来研究人们在土耳其机器人的关系网中如何合作。正因为如此,我也对土耳其机器人颇为赞赏。我要了解人类的事实惰性,那么土耳其机器人可以帮我迅速调查人们的信仰和知识。
我决定研究一下人们是否知道流鼻血时的最佳处理方法是什么。我清楚地记得大约10年前我流鼻血的情景,那晚,我的鼻子血流不止。我一只手拿着纸巾止鼻血,另一只手在网上搜索着应急处理办法。该把脑袋后仰?还是脑袋前倾?捏住鼻子的某个地方?我听说过太多的信息,我真的不记得 “正确”的做法是什么了。去网上搜索鼻中隔前部出血是我唯一能做的。
于是,我在土耳其机器上提出了一个类似的问题:
“如果流鼻血,最佳处理方法是什么?”
A. 脑袋后仰
B. 平躺
C. 脑袋微微前倾
D. 脑袋自始至终前倾
“你会如何捏住鼻子?”
A. 完全捏闭鼻腔
B. 捏鼻梁
我问了100个人,调查完成后我给了每个受访者5美分。虽然大部分钱没给受访者,而是让亚马逊赚去了,但是我只花了不到6美元就获得了新知识。我提问后不到一分钟的时间,就有一个人回答了我的问题,结果他的回答是错误的。几天后,100份问卷就收集全了。
顺便说一下,WebMD上说11,正确的处理方法是将头部向前倾,然后再捏住鼻梁,所以正确答案分别是C(或者D)和B。
但是我的实验对象是如何回答的呢?他们勾选的答案所占比例如下:
“如果流鼻血,最佳处理方法是什么?”
脑袋后仰:50%
平躺:14%
脑袋微微前倾:31%
脑袋自始至终前倾:5%
“你会如何捏住鼻子?”
完全捏闭鼻腔:17%
捏鼻梁:83%
虽然受访的人们似乎都知道完全捏闭鼻腔不是个好办法,但是他们并不知道正确的姿势是怎样的,大约只有1/3的人知道自己保持哪种姿势才是对的。
这样的实验结果并没有让人大跌眼镜。我们除了背负着各种各样的认知偏差,还很难及时更新各种信息变化。小的时候,我们接受通才教育,掌握各种各样的信息。我们学习地理、历史、数学,学习看地图,还学习一大堆科学细节。我们甚至能毫不费力地掌握几门语言。
但是后来随着我们年龄的增长,奇怪的事情也发生了,我们对待教育的方式不同了。除了不再被人强迫学习各种知识(毕竟我们是大人了,不会再被强迫学习什么),如果我们继续让自己受教育的话,我们会把原本分散的精力集中起来。我们选择一个专业,并且针对那一个主题进行学习(比如生物学)。然后,我们成为这一领域的专家。我们学习的范围越来越窄,但对这个范畴的东西知道得越来越多。
但是,我们之前所学的知识都停滞了。应该说,我们过去学来的知识不再增长,也不再发展,通常它们就一成不变了。除非偶然之间,我们看到一本杂志或一张报纸上的一篇文章,里面碰巧讲到一个科学发现;要么是一则非常重要、惊天动地的新事实,让我们不禁惊呼它的新颖性,否则我们仍然会停留在学生时代的那个事实层面。
我们一直称不同国家为第一世界国家、第二世界国家、第三世界国家,却没有意识到这些词原本指的是冷战时期的联盟。还有,我们对化学元素周期表的认识仍然停留在高中阶段,我们没有发现相比于我们上化学课的时候,元素的数量已经增加了很多。
但是,要是认为我们只有年轻时才学习,长大后就不学习了,这想法未免太过简单,甚至武断。其实很多人还在不断更新各种各样的知识,只不过是一阵一阵的罢了。而这些知识飞跃之间的时间间隔很精确:刚好是一代人的间隔。
科学作家布赖恩·斯威特(Brian Switek)告诉我,大多数人学习一个知识话题(我们那时聊的是恐龙,但是其实对任何话题都适用)是在年轻的时候,此阶段的默认模式正是疯狂的知识积累,然后我们就不再理睬它,转而投向更加成熟的话题,或者是现在我们感兴趣的话题。
但是,只要我们的孩子也开始经历这个阶段,我们就又会回到这些话题上来。你平时察觉不到这些中央事实以一种平稳的方式慢慢地改变,你只有在下一代遇到它们时才突然察觉,例如,你的孩子回家告诉你,恐龙是恒温动物,长得像鸟儿一样。即使知识稳步改变并增长,这一世代知识(generational knowledge)仍会断断续续出现。
不管与你童年时代学到的知识有什么出入(尤其是和恐龙有关的话),你总会觉得新说法是错误的。正如变动基准线会让我们认为我们出生时事物的状态才是常态,直到下一代人采用了不同的基准线后,我们才知道事实改变了。那时,我们才不得不面对它们之间的差异。
冥王星就是这样一个例子。如果你在2012年时让小孩子列出行星的名字,他们会一直说到海王星,然后补充说,冥王星是一颗矮行星,或者用其他的方式把冥王星与八大行星区分开来12。但是,这可能只是暂时的。这些教学想让孩子们了解冥王星以及它的特殊状态。但是过不了多久,冥王星就会消失为一个奇怪的注脚,19世纪的那一幕将再次上演:谷神星和其他几个小行星一度也被算作行星(人们把它们标记在图表上,几十年来一直这么教授给学生),直到人们在小行星带上发现了众多小行星,这一切才结束,所以,冥王星的这种特殊地位可能也会一去不复返。
当然,我们无须从字面上硬抠世代一词的意思,虽然通常来说,我们大脑里的事实都与我们生老病死的周期分不开。我们也可以更加形象地去理解世代一词的意思。例如,对大学知识来说,考虑到老生毕业和新生入学,一世代的时间就是4年(并不是好几十年)。对机构记忆以及随之而来的事实和知识来说,一世代就仅仅是一世代。
我读完迈克尔·查邦(Michael Chabon)的一篇文章13后就彻底明白了这一点。他哀叹近年来的商业运作破坏了乐高(Lego)玩具原有的纯正性。他先是指出,现在儿童手里的乐高玩具色彩绚烂,堪比彩虹:粉色、紫色、天蓝色等等。除此之外,还出现了主题玩具,从哈利·波特系列到星球大战系列,每一个人物都是特别制作的。但是在他年少的时候,玩具只有屈指可数的颜色:红色、蓝色、绿色、黑色、白色和黄色(这一点我很赞同)。
然后,他继续感叹导致乐高玩具堕落的罪魁祸首是“微形象”。查邦认为,这些黄色面庞、咧嘴笑的小人更凸显了乐高美学的混乱形象,除此之外便一无是处。
这下我不能苟同这篇文章了。他说的不对。虽然我不喜欢那些主题玩具和特制玩具,而且其中有一套玩具的主题似乎还是关于外星人绑架,但是这些微形象陪伴着我长大。他们是我童年的一部分!查邦居然说这些小人形象腐化了乐高的文化理念!他们本来就是乐高文化理念的一部分。
而这恰恰是问题所在。我们俩都是在拒绝与我们各自的童年所不同的东西。之前说过,很多人只注意到我们出生之后才有的“技术”发明,与此类似,我们也把自己设好的基准线(我们刚开始玩乐高玩具时它的状态)当成了乐高玩具的常态。
但是这就结束了吗?我们的思想会不会永远停留在出生时的那个世界的状态?就算改变头脑中已有的知识对我们来说有点儿困难,但它是完全不可能的吗?
在第5章中,我已经探讨了知识的传播和扩散。但是就算知识可以迅速传播,那人们认可知识的速度如何呢?正如知识会经历相变,人们对知识的消化吸收也是有相变的。因为就算事实在传播,事实被我们牢牢记在脑海里也需要花点儿时间。而且不管对科学家还是对门外汉来说,这都是真理。
显然,科学不是与日常生活脱节的一种抽象的风险事业。科学事业会受激情和偏差影响。科学完全是一种人类进程。科学是通过直觉和对关系的机会识别来完成的,实验室里热烈的讨论14和辩论会丰富它。但是,科学也受到我们自身劣根性的影响。科学家们隐藏数据、拒绝合作,他们之间的积怨也会左右同行的评议。
科学新知要获得认可,不可不考虑人的因素。如果出现了一个新的发现或者新的理论,我们并不总是分析证据、权衡利弊,然后做出决定,尤其是如果它会彻底颠覆我们的科学世界观的话,那我们就更不会这么做了。通常我们会一拖再拖,把替代理论和矛盾数据丢向新的理论观点。非常好。有几种反对意见的话,每个人都会诚实一些。但也有可能很糟糕,比如说,塞麦尔维斯就被无视了,还被那些拒绝接受事实的同事逼疯了。但是,面对铺天盖地的证据,大多数人便发觉他们的反抗适得其反,便欣然接受了新的理论。
兰特·普里切特(Lant Pritchett)真是太了解这一点了,他是哈佛大学肯尼迪政府管理学院的一名教授,致力于研究国际化发展。在国际化发展领域有许多不容置评的东西,如果你胆敢挑战它们,那绝不会有什么好果子吃的。为了帮助发展中国家发展,普里切特最近提出了一个有趣的想法15:开展大量的外来工项目。但是,每个人都会权衡它的优点吗?不一定。普里切特认为,恰当地说,这些想法的际遇总是被劈头盖脸地说成:“疯狂。疯狂。疯狂。明显是疯了。”
在图表上表示出来,你就会得到一个相变,但这次是一个想法被接受和采纳的相变图。托马斯·库恩是一位物理学家,后来摇身一变成为科学史学家,他在著作《科学革命的结构》(The Structure of Scientific Revolutions)一书里也讨论了如此快速的转变是如何发生的。库恩用范式(paradigm)一词来指代全面的世界观或理论。(虽然库恩并不是提出范式一词的第一人,但是他对这个词的频繁使用为该词的普及做出了重要贡献。)例如,万有引力是一个很好的理论,并且它的解释力非常强大。但是,虽然大量的工程应用仍然在使用牛顿力学原理,可它早已逊色于爱因斯坦提出的假设性世界观。库恩称这种视角的变化为范式转移(paradigm shift)。
库恩认为,从一个范式变化到另一个范式16的过程是混乱的,新的范式的接受过程常伴随着新人换旧人——老科学家退休或死亡,而想法更加开放的年轻人拿过接力棒,在这个过程中,老科学家会负隅顽抗。
另一位物理学家麦克斯韦·普朗克(Maxwell Planck)把它变成了定律:“一个新的科学真理的发扬光大并不是通过让它的反对者们信服、让他们看到真理之光明,而是等到这些反对者们最终死去,等到熟悉真理的新一代成长起来。”
这种说法似乎非常好理解。科学存在偏颇,还有人为因素在作怪,所以我们不能指望一个新的想法一经产生,科学老骨干们就改变他们的想法。我们只能等到他们死去。
然而,普朗克定律其实是错误的17。
细致地研读一下达尔文的著作就可以看出来。他的自然选择进化论是科学领域典型的相变和范式转移。进化论诞生之前,生物学的一切都像是在收集复杂的邮票,它们让我们的生活环境井井有条,也让我们不断探索奇迹。随着进化论的诞生,生物学家终于有了一种考量周围事实意义的概念框架。但是,人们对进化论的接受并不是一蹴而就的。虽然《物种起源》是一本畅销书,但是在维多利亚女王时代,它并没有获得广泛的认同。
科学家也没有广泛认同自然选择理论。科学哲学家戴维·赫尔(David Hull)研究了许多与达尔文同时代的名人,想看看哪些人最终接受了自然选择理论,以及这个接受过程到底花了多长的时间。赫尔与两名研究生——彼得·特斯纳(Peter Tessner)和亚瑟·戴蒙(Arthur Diamond)——一同研究了67位与达尔文同时代的英国科学家。他们发现,达尔文的《物种起源》首次印刷出版是在1859年,之后的10年里,只有约3/4的科学家接受了达尔文的进化论。因此,出乎我们的意料,进化论并不是一个知识接受的快速相变。
但是,这是由于绝大多数持反对态度的科学家都太老了吗?达尔文的思想有没有被年轻一代迅速地接受?是不是在年轻科学家群体中达尔文的思想其实是有相变的,只是年龄掩盖了它?接受进化论的人比10年后还是拒绝进化论的人平均年龄小,这是真的。但是情况有点儿复杂。这一理论中,年龄只能解释约5%的接受或拒绝变量。年轻的科学家并不一定会迅速接受达尔文的思想;在这10年中,年轻科学家的接受速度和年长科学家差不多。近年来,对普朗克定律的研究基本证实了赫尔最初的观点:普朗克定律不成立。年轻的科学家不一定更乐于接受新的思想,而且新的思想在人群中的扩散也不像我们想象的那么迅速。
虽然我们采纳事实是有偏差的,但是我们仅靠直觉来理解事实惰性的运作是不行的:我们要测试我们的非理性。这正是微软研究院中首席研究员邓肯·瓦特(Duncan Watts)的工作内容之一。瓦特进行过众多的探索研究,不管是研究音乐是如何流行起来的,还是研究市场是如何运作的,它们都已经证明18,我们非常善于给自己讲故事,这些故事听起来挺真实的,但必须经过严谨的定量分析来验证。
在科学领域,群体意识渗透既包括知识在人群中的传播,也包括到目前为止我们讨论过的所有的认知偏差。但是如果只看单一的学科(生物学或者经济学),我们无法看出这个问题有多么普遍,看不出它其实悄悄影响着个人信仰或观念与一个群体的总体“事实”之间的相互作用。
我们不得不面对群体知识与个人知识之间这些复杂而美妙的相互作用,语言就是这样一个例子。
语言反复无常,不断变化。语言学家阐述语法规律时,甚至都分为两种方式:规定性语法(prescriptive grammar)和描述性语法(descriptive grammar)。规定性语法规定事物应该如何,而描述性语法描述事物的样子。规定性语法在过去几个世纪里一直占据着统治地位,它定义什么样的语法正确、什么样的语法不正确。它们主管一切语法规则,诸如禁止在动词不定式前加修饰副词,或一个句子不可以介词结尾。
与之对应,描述性语法着眼于如实地记录我们的语言习惯。它往往客观地反映语法规律在不同语体和语境中的表现,不拘泥于固定的语法规则。本来,有很大一部分的描述性语法是符合规定性语法的,但是随着时间的推移以及日常生活中习惯用语的变化,描述性语法与规定性语法变得格格不入,在教条的规定性语法与变通的描述性语法之间,差异日渐明显。
语言既有稳定性,也有变化性。一方面,有证据表明19,现代英语的辅音频次与古英语大同小异,即使讲英语的现代人与古人已相隔千年。
但是另一方面,我们的语言习惯发生了诸多改变,比如,出现了许多新词,废弃了一些旧词。同样,词语本身也发生了变化,比如,规则动词逐年增多,并更贴近语法规则。在英语中,我们的动词分为规则动词和不规则动词。例如,discuss这个动词的过去式是discussed(规则动词变为过去式直接在后面加“ed”),但speak这个动词的过去式不是speaked而是spoken。所幸,这种变化不是随机的:原来,越频繁使用的词语越不可能发生改变,两者存在明显的量化规律,即一个动词的规则性20与它的使用频率的平方成反比。那么我们怎样才能了解语言事实以及它们的变与不变呢?
我们之前探讨过的绝大多数事实,要么是社会观念里的真理(比如科学真理),要么是当前世界的某种状态(比如最强大的计算机的运算速度)。但是,语言是一种截然不同的事实领域。与那些坚持规定性语法规范的人所不同,一些手册中就压根儿没有真正意义上的客观真理,也没有一成不变的规则,而且完全不受说话者的影响。如果误用一个词的人足够多,那就不算错。一旦大多数人开始交替使用disinterested和uninterested这两个词,继续一一纠正他们的错误21就很烦了。
从某种角度说,语言的事实是一种群体平均值,里面包含了个体所特有的一套套规则。每个人的一套规则被称为个人方言(idiolect),它取决于你年轻的时候所学的知识以及身边的人对你的影响。个人方言包括词汇、语法、单词的发音和口音。我们的语言事实落入了知识改变困境:它们是由缓慢的适应性变化、事实惰性和变动基准线三者混合而成的复杂体。
与他人进行交谈的时候,我们会朝着不同的方向推动并影响对方的讲话方式,尽管可能只是下意识的,我们影响着他人的说话方式,相应地,他人的说话方式也在影响着我们。这样的例子有很多;一个是嗓音起始时间(Voice Onset Time),它是指某一辅音从除阻的一刻到声带开始震动所经过的时间。这种发声完全是自动的,但它是可以改变的。在与一个嗓音起始时间较长22的人交谈时,人们往往会下意识地开始模仿对方。
另一种下意识的语言叫临场方言(situation-based dialect):一个语言学家团队研究了奥普拉·温弗瑞(Oprah Winfrey)23介绍不同种族的嘉宾时的差异。他们发现,她介绍不同肤色(白种人和黑种人)的嘉宾时居然用了不同的说话方式。与之类似,我认识一个人,他出生在南非,但在美国长大:他只有与他的父母说话时才有南非口音。又比如,我的妻子在一个地区说苏打水,在另一个地区会改说汽水。
当然,我们并不完全由周边的人塑造;我们的可塑性毕竟有限。例如,讲话者拉长嗓音起始时间,会引起倾听者嗓音起始时间的改变,但是如果反过来,讲话者缩短嗓音起始时间,倾听者却不会跟着缩短自己的嗓音起始时间。亨利·基辛格(Henry Kissinger)在美国居住了长达70年,但他仍然带有浓重的德国口音;他的个人方言一点儿也没有改变。要了解习得语言和语言在个人层面上的变化,是一个复杂的、多维度的问题。
但是不论如何,语言的变化以及我们的大脑如何响应语言的变化,可以启发我们适应身边的事实。
语言学家约翰·麦克沃特(John McWhorter)写了一篇有关禁忌和诅咒的文章,专门探讨了这种语言的变化是如何在我们身边发生的24:
我们阅读时困惑不已,一如科学家挖出灭绝生物巨大的骨头时的困惑。《圣经》教给我们的知识以及人类寿命的短暂,我们花了数百年才明白,世界上的动植物一直处在永恒的、无法估量的变化之中。今天,语言的门外汉也常常处在一种类似的困惑之中。语言本身也是多变的,就像熔岩灯内的光影移动。但是,出版物让我们明白,“真正的”语言其实没有改变,倒是我们的寿命太短了,以至于除了反面的提示我们什么也没看到。
当然,我们确实看到了一些提示:金格尔·罗杰斯(Ginger Rogers)在一部老电影里说有一个男人向她“made love”,我们知道她说的意思是“靠近”。但是,我们活的时间不够长,所以无法知道200年以前“obnoxious”的意思是“易受伤害”,800年前“quaint”的意思是“聪明”。
我们往往就像陷入了沼泽。我们改变,但只是缓慢地改变,在我们身上仍残留着旧时的痕迹。
有时,这些变化是迅速而广泛的,在人类历史上被冠以美名的元音大推移(Great Vowel Shift)就是这样的例子。我第一次见元音大推移这个词是在语言学入门教材上,我很着迷。显然,这是语言学领域可以和黑死病、大觉醒、启蒙运动和工业革命相提并论的重大事件。我深入阅读之后却发现,它并不像我预想的那么戏剧化。人们还没搞清楚发生这次转变的确切原因,但是知道它始于14世纪,时间跨度有几个世纪,主要体现在英语长元音的变化上。正因为它,我们现在把“老鼠”读作“mouse”而不是“moose”。
但是想象一下生活在那个时代,人们在变,我们会作何反应呢?我们是会被这些变化的事实弄得晕头转向,还是会迅速适应已经发生的改变呢?
在这方面,我有一段比元音大推移变化小些的亲身经历。我很小的时候,我的哥哥和我与祖父聊天。我们俩其中一人形容一个活动“very fun”(非常有趣),我们的祖父却说,这个说法不恰当。别人根本不会说什么“very fun”。但是,我们没觉得这么说有什么不妥。我还清晰记得我们当时非常困惑,试图让祖父明白人们就是这么说的,我们的说法是对的。
图9 “very fun”一词使用频率的逐年变化曲线。请注意,在1980年左右,这个词的使用频率迅速增加。
数据来源:谷歌图书 Ngrams and the Cultural Observatory。
其实我们只是见证转变历程中的一个部分。虽然在近两百年里,这个说法都没有得到认同,但是在20世纪80年代初期,全世界的人们都接受它了。
这个例子说的是变动基准线,或许它可以让我们了解生活在元音大推移时代是什么感觉。我的祖父一直没有意识到他身边的语言在缓慢地变化,直到世代知识(在这里指两代人语言事实的跳跃)出现了。
为了更好地理解头脑中语言规则集里的这种转变,我们对它进行了量化。我们在什么时候、什么情况下学习一门语言,常常会影响我们一生的语言方式,有时甚至会影响我们看待周围事物的视角(比如我祖父的例子)。
语言学家们基于年龄对地方口音的各个方面进行了研究25。他们发现,对一个群体而言,年龄不同,改变在数量上会有差异,这样的例子数不胜数:年纪越大的人越不可能进行语言创新,无论是什么语言创新。当然,人们在自己的一生当中也会发生改变;尽管有许多人一辈子都对童年学习的知识坚定不移,也有很多人自觉不自觉地改变了他们的讲话模式。例如,喜剧演员兼影星史蒂芬·科拜尔特(Stephen Colbert)付出了很大的努力,改掉了他幼年在南卡罗来纳州形成的南方口音。但是很多时候,社会层面的语言变化也可以从不同年龄段的说话者身上体现出来。
这种语言的衰减是相当普遍的。例如,20世纪法裔加拿大人身上就发生过元音大推移。在魁北克(Quebec),几十年来人们一直在改变自己某些长元音的发音。而且正如之前所说的那样,年轻人更容易出现这种转变。
但是,有趣的是,并不是所有单词的发音都发生了变化;只是在某些情境下,发音才会发生变化26。与旧时光有关的词(比如与父母、第一次世界大战、甚至冰箱有关的词)的发音并没有随着其他单词发音的改变而改变。有人猜测,年轻人更经常从他们的长辈(长辈们没有改变自己的元音发音)那里听到这些词,因而年轻人更容易保持这些词原有的发音。一个人的语言事实真真切切地受到我们在听谁说话的影响。
这与我对某些细胞生物学术语的感觉很像。我在大学时代修了一门细胞生物学课程,任课老师是一位英国人教授。由于我后来没有继续研究细胞生物学,所以我很肯定,我脑海里存储的许多细胞器用词的发音都是那门课上听到的英式发音。当我和我的父亲聊到程序性细胞死亡过程,也就是“apoptosis”(细胞凋亡)一词的时候,我更确信了这一点。我说它读作“A-PUH-TOE-SIS”,而我父亲告诉我,许多美国人会把它读作“A-POP-TOE-SIS”。虽然在我听来,美式发音比较傻,但是显然我的发音听起来才傻吧。
总而言之,语言的事实,而在这个例子中,语言的事实指的是我们在学校学习时掌握的描述性规则,它建立在我们自己的语言体验的基础上。在童年时代,不管是技术创新,还是恐龙方面的知识,甚至是接纳不同类型的乐高玩具,我们对诸多事情的看法就定型了,语言也不例外。
现在我们应该已经非常清楚,无论我们拥有怎样的知识,就更新个人知识库而论的话,我们还远未达到完美。但必须达到完美吗?换句话说,我们可以适应所有的此类变化吗?我们能否识别自己身上的所有偏差,从而避免这些偏差导致的每隔一代人才更新一次知识?
现在已经有一些组机构在应对事实的时间尺度问题,试图帮助我们应对变化。在事实迅速变化的那一端,有一家成立于几年前的公司,名字叫Ambient Devices,它是由麻省理工学院媒体实验室衍生出来的。Ambient Devices为迅速变化的信息(包括市场和天气数据)创造了多项信息工具。例如,他们发明了一个可以放置在桌面上的球体,市场景气时它会发出红光,市场下跌时会发出绿光。他们还发明了一种伞(伞被命名为Ambient Umbrella),天气预报广播有雨的时候手柄就会亮起,因此人们很难忘记带伞。这些使人觉得有用的小工具让我们能够随时了解在我们身边不断变化的事实。但是,这一类的设备只适用于快速变化的事实。
在事实变化的另一端,有一家Long Now基金会,它旨在培养人们长期的思考和意识。他们让人们以千年为单位来进行思考,他们甚至在得克萨斯州的沙漠里建造了一个时钟,准备让这个时钟工作一万年。他们也提供一项偶尔有人用的新闻剪报服务,这项服务能凸现几个世纪以前可能具有相关性的文章,从而密切关注非常大的和非常重要的变化。
但是其他的事实变化怎么办呢?所有那些以中间速率(以年为时限或以一代人为时限)改变的事实该怎么办?这就是中央事实的时间表,我们大多数人都无法紧跟这些事实的变化,在这个领域,认知障碍占了上风。
我有一个办法可以对付不断变化的事实,但可能说起来容易做起来难:终身学习并随时随地了解信息。当然,你可以自行决定是否采用这个费事的办法,但以下是我的一些建议。
例如,有一个网站叫Worldometers27,它作为实时统计项目(Real Time Statistics Project)的一部分,扮演着一种实时计数器的信息交流中心的角色,我们可能看到过的实时计数器是纽约市的时代广场(Times Square)附近的国家债务钟(National Debt Clock)。Worldometers聚集了众多组织的计数器,其数量非常巨大,包括目前的世界人口、联合国成员国的数量、今年新出版的书籍、艾滋病毒感染的个体、地球上的剩余原煤储量和今年已经灭绝的物种数量。它们中的许多已经被估计出来,人们现在精心地组织它们,用它们来测算我们目前对世界的认识。
但是我们还能做些什么呢?选择几件事情来关注比较容易,要应对所有不断变化的事实就难了。我们该如何平衡呢?
也许,某种形式的信息分流已经准备就绪。此外,我们可以定期地重新审视基本信仰。具体来说,我们应该怎么做呢?让我们举一个身边事实的例子吧——价格。
大多数人对日常用品的花销都有直观感受。要是我们听说买12穗玉米要花1美元,那么我们认为价格不高,可能会选择购买。可是从另一方面来说,我们对某些商品的价格可能并不敏感。我对乳糖不耐受,因此,我对一加仑牛奶多少钱没有概念。从个别商品价格里跳出来,经常留意一下居民消费价格指数(CPI)的话,我们就能够更有连续性地看待价格变动,而且可以结合历史价格对现有商品价格做出分析。例如,我们可以看出,CPI的变动主要出现在最近几年,而在20世纪以前的几个世纪里,消费品的价格都相当稳定。
同样,我并不知道目前的黄金价格如何,除非它高得离谱了。但是我在中学的时候,每天都密切关注《华尔街日报》(Wall Street Journal)的财经和投资版块,很在意金价到底是涨了还是跌了。
虽然这是一个让我们确信还跟得上时代的办法,但是对我们大多数人来说,每天关注价格变动似乎太麻烦了。如果还要进一步把历史数据找出来并做一下综合分析,那这要求就太过分了。要是很多人使用MeasuringWorth.com28,那应该挺不错的,这个网站里有1245年以来所有的以英镑为单位的购买力的数据;但是尽管如此,我发现这个网站并没有什么要流行起来的迹象。
当然,某个领域的专家需要及时地了解相关信息。黄金交易者必须跟踪黄金价格的变动。我们已经多次提及医学知识,它的变化和推翻非常频繁。医生要想紧跟知识的步伐,就需要修读一些医学方面的继续教育课程。每隔几年,他们就必须根据最新的需要更新自己的知识库。过去,医生们听录音带,然后进行空格填字的测试。现在,他们可以听CD,甚至可以在线上课,然后参加在线考试。日常信息不停地轰炸我们,所以我们必须听一些专家课程,并且积极地持续学习;否则,我们注定要淹没在过时中央事实的洪流里。
如果一个人的生活与医学操作、玉米和黄金的价格八竿子打不着,那就更难做到这一点了。掌握自己的专业领域的最新知识已经够难了,要掌握与自己的专业领域没有关联的知识更是难上加难。除非我们真的想弄懂如何投资,否则使用指数基金就行了,不用过分关注个股。
也许同样的建议也适用于知识领域。除非掌握某个知识领域的最新知识是出于工作的需要,否则使用信息领域里的“指数基金”就够了。但什么是信息指数基金呢?它们是把不断变化的知识汇聚于一处的出版物和网站,包括杂志、博客、《华尔街日报》的“最新消息”专栏等等。
信息指数基金确实对我们有帮助,但是随时随地的阅读仍然很重要,而且已经有人向我们提供了一些帮助。《大西洋月刊》(The Atlantic)出了一个名为Media Diet的系列专栏29,它采访那些有影响力的思想家,问他们阅读什么,以及如何获取事实和新闻。这些有影响力的人包括盖伊·塔利斯(Gay Talese)、戴维·布鲁克斯(David Brooks),他们把细细品读的报纸和经常光顾的博客(也就是他们的信息饮食)分享给我们,从而给予我们指导和帮助。
但是,如果你只是想察觉事实,实际上有一个更好的办法:不要再记东西了,改掉这个习惯。听起来可能很可怕,但事实并非如此。我们的个人记忆可以全都外包给云存储。也就是说,与其总是记着过时的知识,我们还不如只记得一半,去拥抱“互联网和搜索引擎近在咫尺,需要什么知识立马唾手可得”这样的想法。
这已经发生了30。最近,《科学》杂志上发表了一篇文章,它认为人们正越来越多地依赖搜索引擎,而不是自己的记忆。当研究成果被公之于众,很多人担心这会伤害我们的大脑,让我们变笨。虽然这个说法很普遍31,但是我持相反的意见。我认为,不依赖我们自己的记忆之后,我们时常更新知识的概率更大了,因为最新的知识更可能出现在网上,而不是我们自己的大脑里。医学界已经利用这个想法建了一个不断更新的在线医学参考32,也就是一个名为UpToDate的网站:查资料可确保你获取的信息都是最新的。
当然,在我们的脑海中最好还是保留一定的对世界的认识,但是我们查询的次数越多,我们就越有可能遇到新的惊人的想法。
不断变化的事实就在我们的身边。但是,我们脑子里的知识与我们身边的事实往往是脱节的。有时这两者之间的差异相当大,而且可能是由各种各样的原因造成的,可能是由于事实惰性,可能是由于世代知识。所幸我们并不是无能为力,我们可以尽最大的努力去避免被新信息所惊吓。比如,我们可以系统地更新个人知识库,也可以通过技术工具来做到与时俱进。但还有一点更为基础,本书也希望能引导大家认识我们身边知识变化的内在规律。
[23]由于《纽约时报》风格古典严肃,有时也被戏称为“灰色女士”。——译者注
第10章 知识的边缘
在15世纪末,一位名叫卢卡·帕乔利(Luca Pacioli)的意大利方济会修士写了一本数学方面的书。这本名为《算术、几何、比率及比例概要》(Summa de arithmetica, geometria, proportioni et proportionalita)的教科书是印刷术问世之后最早出版的书籍之一。虽然此书的侧重点是在代数和数学的其他方面,但是里面也有很重要的一部分阐释了会计学。
帕乔利记载了复式记账法(有借必有贷,借贷必相等),这种方法见诸出版物还是第一次。这种曾经被意大利商人所使用的错误检查方法1,最终广为流传。
玛丽·普维(Mary Poovey)是纽约大学的一名英文教授,也是《事实近代史》(History of the Modern Fact)一书的作者。她主张,我们近代人对事实一词的定义2为具有某些定量特点的客观现实,此定义首见于中世纪。具体说来,普维认为事实一词的“发明”与复式记账法的产生有关。普维认为,15世纪左右引入了这种记账方法以后,人类才逐渐习惯用这样的方式来思考信息。
当然,这听起来不太对。我们人类记载知识已经有几千年的历史了,就算有时数学真理不如分类账里那么客观,但它好歹也是事实。这样的例子我们可以一直追溯到古希腊。阿那克西曼德(Anaximander)是希腊米利都(Miletus)的一位哲学家,他生活在公元前6世纪后期,立论了人类的起源3:水是万物之源,人类从鱼演化而来。这也是阿那克西曼德不建议人们吃鱼的原因之一。
我们还可以看看另外一位前苏格拉底哲学家,他叫恩培多克勒(Empedocles),他写下了“水酒相溶,水油不相溶”的事实。再看看阿那克萨戈拉(Anaxagoras),他写了很多关于自然的东西,其中包括一则对天气的讨论,他指出,云撞击产生雷,闪电是云与云之间摩擦的结果(就像电火花一样)。虽然古代哲学家想通过努力使世界秩序井然,但是他们或多或少存在疏失和错漏的地方。
中世纪末期,世界已经做好了迎接新类型的知识的准备。中世纪及其会计系统让位给了文艺复兴时期,相应地,文艺复兴时期又为科学革命奠定了基础,在这个过程中,事实被赋予了新的重要意义。
随着科学方法的汇编整理,我们的周遭首次展现出实验般的严谨性,事实产生和颠覆的速度也越来越快。最终,可测的科学事实时代到来了。这是科学革命的要义:科学要求一个观点具有可证伪性4。一个概念看起来具有说服力是不够的,它必须要具有带动新知识、证明这个新知识是伪知识的潜力。我们已经见得很多了,这不仅可能发生,而且往往是普遍现象。凯瑟琳·舒尔茨在《我们为什么会犯错》(Being Wrong)一书中写道:
这是科学革命的要义5:即知识的进步有赖于现有的理论在新的见解和发现面前土崩瓦解。在这种进步的模式中,错误不会把我们带离真相。相反,错误使得我们一步步靠近真相。
自从中世纪、科学革命以及见证了千变万化的技术事实的工业革命结束以来,我们就一直生活在这个令人兴奋的、全新的知识领域。但是,事实及其创建和更迭的下一步会是什么呢?自16世纪以来,我们似乎已经被越变越快的知识包围了。还会不会更快呢?事实半衰期本身会不会缩短,我们是不是必须学会越来越快地适应它们呢?还是说我们就生活在事实短暂的最佳点,过了这个点之后,某些领域事实的变化速度就可能会放缓?
在本书中,我探讨了各种各样可能加速的趋势,无论是技术创新,还是科学认识,甚至是信息全球化。但是,我们将来会遭遇瓶颈期吗?还是说我们注定了永远要受万事万物越变越快之苦?
正如我在第6章中所说,城市创新的步伐正在加快。为了持续地增长,城市似乎需要定期进行剧烈的创新重置(从先进的污水处理系统,到摩天大楼的建造方法),而剧烈的创新重置愈加频繁。人们在短短的一世代要经历多重快速变化,这在历史上前所未有。况且这些快速变化没有任何放缓的迹象。
而研究伟大思想如何诞生以及如何融入社会的工作也在同步进行。1971年,一个研究团队对自1900年以来社会科学领域最伟大的62项进步进行了编制6,意在研究这些观念的产生过程以及它们的属性。他们特别研究了这些重大进步彰显之前的阶段。他们发现,重大进步深入人心大约需要10年时间,而且在最近几年,这个时间缩短了。毫无疑问,如果类似的研究现在再做一遍,我们得到的数字会可能更小。
最近的气候变化甚至已经改变了我们对这个世界的认识,在我们看来,这些事实原本并不属于中央事实。由于海平面上升,有一些太平洋岛国可能会在未来的几十年里消失不见,这引发了与国家状态相关的离奇问题:被淹没的岛屿已经是海洋的一部分,那么它还能算作国家吗7?马尔代夫(Maldives)、基里巴斯(Kiribati)等国就面临着这样的问题,虽然无关侵略,也不涉及政治原因,但是这些国家很担忧自己国家的未来状态。国家的实体存在性可能会发生变化,这一类问题我们还从没遇到过。
从这些例子中我们似乎可以看出,新的知识越来越多,传播得越来越快,而且它们引发了一些改变,而我们甚至还没有意识到这些改变属于中央事实。
另一方面,我们似乎也可以看出事实的变化速度正在放缓。虽然摩尔定律顺风顺水地持续了几十年,而且它一直在广纳历代的技术,但是,仍有很多人觉得8再过个几十年,它就不成立了。在不久的将来,我们将开始遭遇物理极限,比如说,原子的大小最终将限制电路板所能集成的电路数。
同样的限制也会出现在交通运输上。我们已经拥有了一系列惊人的技术,它们使运输速度越来越快,但是,指数增长的步伐似乎不会永远持续下去。虽然去月球午休听起来很奇妙,但是这样的事情确实不太可能发生。
这并不意味着技术变革不再遵循数学规律。从长期来看,它们很可能会遵循逻辑曲线,越来越靠近极限,最终步伐放缓下来。只是我们现在还处在曲线上瞬息万变的中间部分,所以很难看到最终放缓的景象。应该说我们人类太悲观,太容易低估自己持续创新的能力。单个技术可能会达到极限,但是这时往往又会出现一项新的技术,它基于已有的限制继续创新,以至于我们身边的变化可能在未来很长一段时间都不会放缓。
但是科学知识会怎么样呢?虽然我们离科学的尽头还太远,如果把我们未知的事情加起来,一定多得吓人,但是很可能我们身处的是不断变化的知识的逻辑曲线,而不是指数增长曲线。我这么认为的其中一个原因很简单:人口统计数据。人口似乎不太可能再猛增了。一个国家一旦实现了工业化,那它的人口出生率就会随之下降9。因此,随着全球技术的整体进步,人口在未来的几十年甚至几百年里都不会再骤增了。再结合能源限制来看,我们的需求是无底洞,但能源肯定不是无限的,知识的指数增长趋势不能永远持续下去。但是话说回来,随着计算能力的进步,计算机辅助的科学发现不会让放缓的趋势很快到来。
尽管如此,事实的变化和增长还是有规律可循的:虽然速度放缓,但是事实将继续增长,继续被推翻,而且在很长的一段时间里,我们的知识肯定还是会继续呈指数增长趋势。
但是就算任何事物都会继续快速增长,我们对这种变化的认识以及适应力却有可能受到一定的限制。
18世纪,卡尔·林奈提出了生物的分类法,他把生物分为三个界10,动物、植物和矿物,又进一步分为纲、目、属、种。当今,生物学家把生物分为五个界:介于界和纲之间的叫作门;在目和属之间的第三高的层次叫作科。由于我们知道的物种数量从数千增加到了数百万,我们的分类系统也要有所改变。
同样,疾病的类目也在迅速增长。1893年,第一版《国际死亡原因名单》(International List of Causes of Death)涵盖了大约150种疾病11。2012年,我们正在对第10版12《国际死亡原因及相关的健康问题统计分类》(International Statistical Classification of Diseases and Related Health Problems)进行修订(简称为ICD-10)。它发行于1990年,涵盖了12 420种疾病,这一数字是前一版本ICD-9的近两倍,而这两个版本的发行时间前后相差也不过十几年。事实激增,所以我们对知识的管理和认识也必须跟着愈发精细复杂的分类系统一同成长。
一方面,我们的智力随着复杂性的增强而增强,无论这种复杂性是疾病分类领域的,还是生物分类领域的,或是许许多多我们在使用的其他分类系统的——这些分类系统非常之多(例如,职业类型,互联网域名)。多看需要动脑的电视节目、多玩需要动脑的电子游戏13会让我们的批判性思考能力增强,同样地,更多的事实和愈加复杂的分类系统也会让我们变聪明。
然而,似乎我们人类的认知范围有限,因此在日常生活中我们也会力有不逮。
我们的大脑只有这么大。似乎是大脑的大小在决定我们能维系多少社会关系,能和多少人经常交往并把他们记在心里。这被称为邓巴数字(Dunbar number),得名于它的提出者罗宾·邓巴(Robin Dunbar),他研究了各种灵长类动物大脑的大小。意思是说,一个人能够拥有且有效经营的社会关系数介于150~200人之间。一个军队的士兵数14(不管是古罗马的军队还是现代的军队)与此差不多,它和小村落里的村民数也相当。让人意外的是,尽管先进的科技推动了社会关系领域的变革,但是我们Facebook上的平均好友数量仍然符合邓巴数字,2011年是190人15。
同样,如果看一下每个人的亲密社交圈,我们便会发现另一个规律。虽然我们认识很多人,但是诸如配偶或最好的朋友这一类的亲密关系并不多。大多数人的亲密社交圈里大约有4个人。我在一项相关研究中发现,要是我们增加自己亲密社交圈里的人数16,那么平摊到他们每一个人头上的亲密度都会下降。因此来说,如果我去掉5个亲密朋友中的一个,那我和剩下的4个人就会走得更近。这似乎是某种关注守恒:倘若我们增加关注的总人数,那么我们放在这些人身上的注意力就会更分散。
我们的大脑容量有限,至少在社会关系这方面确实如此。那这种说法是否适用于不断变化的知识?当有人指出福尔摩斯连哥白尼的日心说也不懂时,他回应道17:
你看,我认为,最初的时候,一个人的大脑就像是一间空空的小阁楼,你要往里面放你选的家具。傻瓜会把他碰到的每一件木制品都放进去,因此空间不够了,对他有用的知识反倒有可能被挤出来,就算所幸没被挤出来,它也和其他很多东西混在了一起,于是他想找出来的时候就很困难。而技术娴熟的工人在填充大脑阁楼的时候确实非常谨慎。他只会把有助于他工作的工具放进去,而且他分了大类,一切排列得井井有条。千万不要认为这个小房间的墙壁有弹性,可以缩放自如,那肯定是不对的。所以基于这一点,到了一个时间点以后,你每加进来一点知识,你就必须忘记一些之前知道的东西。这点至关重要,因此,不要让无用的知识侵占有用知识的空间。
我们会接触很多知识,但是我们无法驾驭全部,虽说见多识广让我们的思维更加完善,但是如果应对的是迅速变化的事实,那毫无疑问,我们能力有限。这听起来像是个坏消息。我们的大脑将根本无法应对各种知识、信息以及它们的迅速改变。但还有救,比如前一章我们说过“在线搜索引擎”。令人欣喜的是,就算快速变化真的发生了,事情也不会像我们想象的那么恐怖。
许多未来学家都很关心所谓的奇点(singularities),在这个时间节点,技术引起的快速而深刻的变革将永远地改变世界的面貌。就像第7章中提到的一些变化,这些相变发生得太快,以至于它们永远地改变了人类与周围环境的关系。未来学家认为,典型的奇点是有可能诞生超人的机器智能。虽然许多科学家认为这是天方夜谭,但是奇点究竟会如何影响我们呢?是奇点挑战我们的认知极限,还是我们有能力驾驭奇点呢?
前文提到过,克里斯·玛吉是麻省理工学院教授,他在研究身边技术的快速改变,他与葡萄牙贝拉地区大学(University of Beira Interior)的特萨列诺·德瓦萨斯(Tessaleno Devezas)一道,决定以史为鉴,18进行研究。玛吉和德瓦萨斯希望从两个已经发生的重大事件上看出人类如何应对快速变化。他们先是研究了15世纪时葡萄牙帝国的扩张,即它是如何逐步控制越来越大的国土面积。他们还研究了过去一千年来人类在时间测量精度方面取得的进步。这两个领域都存在着事实的快速变化,这些变化符合指数增长,并逐步积累,最终达到了众人认为的某种奇点阈值。在葡萄牙的例子中,该国建立了叱咤全球的海上帝国;在计时器的例子中,计时器变得如此先进,以至于对时间的测量精度赶超了人类的知觉。
但是,人类很好地吸收了这些改变。当谈到计时的创新时,玛吉和德瓦萨斯写道:
显然,人们日益接纳了这些巨大的变化,这个过程波澜不惊;比方说,没有“时钟骚乱”的记载,尽管抵抗是有的,适应也是必要的。在上述领域,这些巨大的改变在不到一个世代的时间里就完成了。
因此,我可以乐观地说,让很多人吃惊的变化并不是紊乱的。而且,人类的适应能力很强,所以我们有能力去适应知识的改变。
当然,这也是本书想传达的信息。
我希望我已经让你明白,事实改变的方式令人吃惊,而且非常复杂。但是,知识的变化绝不是随机的,相反,这些变化是系统的,也是可预测的。无论这一知识变化是关于自然的还是关于人造世界的,无论它是测量变化引起的还是发现了一个错误导致的,它都遵循着一种可识别的规律。
除了在互联网上寻找事实,以及在书桌上放一个能响应市场变化的发光球体,还有一种方法能让你免于知识变化的惊吓,那就是你要意识到知识变化并不可怕。
我们正越来越擅长适应变化。例如,许多医学院老师告诉学生,在几年之内,他们所学的知识一半都会变成错的,而老师并不知道哪一半会是错的。无论是因为变化太缓慢而难以察觉,还是因为我们学习和观察周遭环境时自身存在缺陷,我们往往无法真正意识到,事实总是在变化。
在接受一次专访时,小说家乔纳森·弗兰岑(Jonathan Franzen)说:“说真的,世界变化如此之快19,要是你不以超过80年的时间跨度来思考问题,那我感觉你在心理上一定承受不了这个世界。”我们中的许多人仍冥顽不灵,无法应对变化。这又何苦呢。我们得开始教育自己以及我们的孩子,从而认识到知识万变,但万变不离其宗,也必须开始揭示这些变化背后的规律。比学习知识更重要的是学习如何适应不断变化的知识。唯有这样做,我们才能不会继续被新的信息弄个措手不及。
事实不会变化无常。尽管知识一直在变化,但令人惊讶的是,它的变化是有规律的;事实有半衰期,且遵循数学规律。一旦我们认识到这一点,我们就为在这个迅速变化的世界上生活做好了准备。
致谢
这本书的付梓出版,凝结了太多人的智慧和汗水。在科学的世界里,他们给予我很多的支持和帮助。虽然我无法一一列出每个人的名字,但是我要特别提一下史蒂夫·斯托加茨(Steve Strogatz)和尼古拉斯·克里斯塔克斯(Nicholas Christakis)。史蒂夫是我的研究生导师,可谓我的良师益友,我们一起研究了众多的项目。此外,他鼓励我写作,甚至为我提供了一个在《纽约时报》上发表文章的机会,让我的作品首度呈现在广大读者的面前。而尼古拉斯·克里斯塔克斯也是我很好的合作伙伴,他是我博士后阶段的同事,后来我又加入了他的小组,他不仅教导我做研究,而且指导我写作。我有幸与如此杰出的科学家和作家共事,得益于他们的栽培,我为自己选择了一条打破传统的高复合型之路。
在写作界,我也拥有一大批支持者。加里斯·库克(Gareth Cook)是《波士顿环球报》Ideas版面的前任编辑,他在我的早期作品中看到了我的潜力,并提高了我的技巧。还有Ideas版面的两位现任编辑,加里斯(Gareth)和史蒂夫·霍伊泽(Steve Heuser),他们促成了我最初关于中央事实的文章的发表,而正是这些文章孕育了本书。我的文章有幸在《波士顿环球报》和《大西洋月刊》上发表,特此感谢。我还要感谢戴维·莫德华(David Moldawer),在本书初具形态的时候,他就买下了本书的版权。
许多读者阅读了我的初稿后给予肯定,为此我深感欣慰,他们的各种反馈也令我受益匪浅。感谢艾薇·杰斯坦布利斯(Avi Gerstenblith)、保罗·德罗斯基(Paul Kedrosky)、尤卡–佩卡·翁内拉(Jukka-Pekka Onnela)、杰森·普来姆(Jason Priem)、尼尔斯·罗森奎特(Niels Rosenquist)和乔希·森夏恩(Josh Sunshine)。
我还要感谢K·布拉德·雷(K. Brad Wray),他让我了解到包括普朗克谬误定律在内的众多科学原理,除此以外,他还读完了整本书稿,并给予我非常宝贵的建议。我还要感谢阿里·科恩·戈德堡(Ari Cohen Goldberg),他为我提供了大量语言领域的专业知识。感谢布瑞恩·斯维泰克(Brian Switek)与我谈起过去几十年来恐龙方面的知识如何变化,于是我确信我对恐龙的认识没有太大偏差,并且花了很长的时间追忆雷龙。此外,布瑞恩和阿里不约而同都与我说起世代知识的变迁,他俩深深启发了我。还有莎拉·吉尔伯特(Sarah Gilbert)和丽娜·劳尔(Rena Lauer),她们在中世纪欧洲的问题上给了我很大帮助。
在本书的创作过程中,我得到了无数人各种形式的帮助,许多的文章与见解开阔了我的思路。谢谢大家。
当然,如果你读完本书,那么你已经知道事实会过时,而且错误会传播。因此,我自然得提醒读者,作者难免有疏漏,请读者谅解。
我非常感谢我的经纪人麦克斯·博克曼(Max Brockman),是他领我走进这片文学的天地,自始至终他也向我提供了很多的建议。我的编辑考特尼·杨(Courtney Young),她参与了本书每一个环节的工作,并与多方协调,我一直非常感激她。妮可·帕帕佐普洛斯(Niki Papadopoulos)参与了编辑的全过程,这本书能完美地呈现在读者面前,她居功至伟。
我的父母一直以来都大力支持我写作本书,他们读过很多次书稿,对此我非常感激。但更重要的是,他们培养了我的求知欲。在我上小学之前,他们就教育我:“勤于思考,享受生活,并成为一个受人尊敬的人。”
我的祖父欧文·阿贝斯曼(Irwin Arbesman),除了为本书开了一个好头,他还是我了不起的参谋,在整本书的创作过程中,他给予我许多有益的反馈,我非常感谢他。
最后,我想感谢我的妻子德布拉。她是我坚实的后盾,她一直支持我,为我取得的点滴成绩而自豪。我的书稿她读了许多遍,均一一评论,并且一直不厌其烦地听我述说书中内容(她耳朵都听出茧子了)。德布拉,你是一位真正有才华的女性。
注释
第1章 事实半衰期
Martin, Aryn. “Can’t Any Body Count? Counting as an Epistemic Theme in the History of Human Chromosomes.” Social Studies of Science 34, no. 6 (December 1, 2004): 923–48; Tjio, Joe Hin and Albert Levan. “The Chromosome Number of Man.” Hereditas 42, no. 1– 2(1956): 1– 6.
Gartler, Stanley M.“The Chromosome Number in Humans: A Brief History.”Nature Reviews Genetics 7, no. 8 (August 2006): 655– 60.
科学哲学家无疑会认为,我对事实和知识的定义有别于基本真理,且过于简单。然而,我必须声明一下,我并不是把它们与一些客观的科学真理分隔开来,我只是说它们正在接近这个真理。另外,我坚信,这样的科学真理是客观存在的,不依人的主观意志为转移。而且我对一步步接近客观真理持乐观态度。但是,随着讨论的进一步深入,许多不同类型的知识在以相似的方式改变,因此把所有的事实视为一体是一项强大的研究方法。
一则事实以及它的改变最终还是和人有关:我们从他人那里了解事实;我们选定希望探索的领域,然后有所发现;有时事实只是因为其他人才成立。所以让我们把知识的变化分为四类:
a)一个社会对世界的认知更新。
b)世界自身的真实改变。
c)个人的认知更新。
d)一个小群体的认知更新。
例如,对人类染色体数目的修正属于第一类。地球上有多少亿人,世界上最强大的计算机是哪一个,则属于第二类。第三类是指我们对第一类和第二类变化的认识,有时它存在几年或几十年的延迟,雷龙存在(或不存在)就属于这一类。第四类是指在信息传播的过程中一群人如何应对这些信息,比如说我们可能通过小道消息听说新的东西。当然,这四类变化的界限没有那么明确,它们之间往往有交集。例如,雷龙既属于第一类也属于第三类,甚至还能算第四类(古生物学家的群体比一般民众的改变快)。世界上黑死病尚存的地区涉及了第二类和第四类。另外,我惊讶地发现,2011年底地球上的人口将达到70亿,这是第二类和第三类相结合。
- 中央事实组成了所谓的无形当下:我们每个人都能感受到变化——泛红的天空带着点点黎明的新光,暴雨时节渐丰的湖水,季节更迭、温度和雨水影响我们的植被景观。我们中的一些人还看到了长期的事情,他们记得去年冬天雪更少,或者好几年前鱼更多。但是如果一个人感觉到在过去的几十年里发生的每一个精确变化,那就很不寻常。这么长的一段时间,我们倾向于认为世界是静止的,而且我们通常会低估变化的实际程度。这是因为我们不能直接感知缓慢的变化,也因为我们解释因果关系的能力有限,这些因果关系都隐藏在我所谓的“无形当下”。(Magnuson, John J. “Long-term Ecological Research and the Invisible Present.”Bioscience 40 [1990]: 495– 501.)
第2章 发现的步伐
Garfield, Eugene.“A Tribute to Derek John de Solla Price: A Bold, Iconoclastic Historian of Science.” In Essays of an Information Scientist, ISI Press. Vol. 7, p. 213.
Price, Derek J. de Solla. “Quantitative Measures of the Development of Science.” Archives Internationales d’Histoire des Sciences 4, no. 14 (1951): 85– 93.
Price, Derek J. de Solla. Little Science, Big Science—and Beyond. New York: Columbia University Press, 1986.
Lehman, Harvey C. “The Exponential Increase of Man’s Cultural Output.” Social Forces 25, no. 3 (March 1, 1947): 281– 90.
Enquist, M., et al. “Why Does Human Culture Increase Exponentially?” Theoretical Population Biology 74 (2008): 46–55.
Lee, Kyungjoon, John S. Brownstein, Richard G. Mills, and Isaac S. Kohane. “Does Collocation Inform the Impact of Collaboration?” PLoS ONE 5, no. 12 (December 15, 2010): e14279.
Wuchty, Stefan, et al. “The Increasing Dominance of Teams in Production of Knowledge.” Science 316, no. 5827 (May 18, 2007): 1036– 39.
Hirsch, Jorge E. “An Index to Quantify an Individual’s Scientific Research Output.” Proceedings of the National Academy of Sciences of the United States of America 102 , no. 46 (November 15, 2005): 16569–72.
Lehrer, Jonah. “Fleeting Youth, Fading Creativity.” Wall Street Journal, February 19, 2010.
Zuckerman, Harriet. “Nobel Laureates in Science: Patterns of Productivity, Collaboration, and Authorship.” American Sociological Review 32, no. 3 (1967): 391– 403.
项目名为reCAPTCHA,详见www. google. com/ recaptcha.
Arbesman, Samuel, and Nicholas A. Christakis. “Eurekometrics: Analyzing the Nature of Discovery.” PLoS Computational Biology 7, no. 6 (June 2011): e1002072.
Cowen, Tyler. “The Great Stagnation in Medicine.” Marginal Revolution, 2011. www. marginalrevolution. com/ marginalrevolution/ 2011/ 02/ the-great-stagnation-in-medicine. html.
Carney, J. Aidan. “The Glandulae Parathyroideae of Ivar Sandstr?m: Contributions from Two Continents.” American Journal of Surgical Pathology 20, no. 9 (1996): 1123– 44.
Price. Little Science, Big Science.
第3章 真相的渐近线
Goodall, Jane, Gail Hudson, and Thane Maynard. Hope for Animals and Their World: How Endangered Species Are Being Rescued from the Brink. New York: Grand Central Publishing, 2009.
有趣的是,自从活的腔棘鱼被发现以后,6 500万年来的腔棘鱼化石相继出现。这是我与Brian Switek私下交流后得知的。
Fisher, Diana O., and Simon P. Blomberg. “Correlates of Rediscovery and the Detectability of Extinction in Mammals.” Proceedings of the Royal Society B: Biological Sciences (September 29, 2010).
Poynard, Thierry, et al. “Truth Survival in Clinical Research: An Evidence-Based Requiem?” Annals of Internal Medicine 136, no. 12 (2002): 888– 95.
此衰减呈相对平稳的线性,所以我们可能需要添上更多年的数据才能得出指数衰减。
有时基础出版物正因为重要所以实际上已经停止引用了。牛顿的研究成果对基础物理学影响深远,所以人们已不必再引用他的书名。
Redner, Sidney. “Citation Statistics from More Than a Century of Physical Review” (2004). http:// arxiv. org/ abs/ physics/ 0407137.
Midorikawa, N. “Citation Analysis of Physics Journals: Comparison of Subfields of Physics.” Scientometrics 5, no. 6 (November 26, 1983): 361– 74.
Tonta, Yas?ar, and Yurdagül ünal. “Scatter of Journals and Literature Obsolescence Refl ected in Document Delivery Requests.” Journal of the American Society for Information Science and Technology 56, no. 1 (2005): 84– 94; doi:10. 1002/ asi. 20114.
Price, Derek J. de Solla. “Citation Measures of Hard Science, Soft Science, Technology, and Nonscience.” In Communication Among Scientists and Engineers, eds. C. E. Nelson and D. K. Pollock. Lexington, MA: Heath, 1970. pp. 3– 22.
Tang, Rong. “Citation Characteristics and Intellectual Acceptance of Scholarly Monographs.” College Research Libraries 69, no. 4 (2008): 356– 69.
Ho, C. Y., R. W. Powell, and P. E. Liley. “Thermal Conductivity of the Elements.” Journal of Physical and Chemical Reference Data 1, no. 2 (April 1972): 279– 421.
Asimov, Isaac. “The Relativity of Wrong.” The Skeptical Inquirer 14, no. 1 (1989): 35– 44.
Carroll, Sean. “The Laws Underlying the Physics of Everyday Life Are Completely Understood.” Cosmic Variance, 2010; http:// blogs .discovermagazine. com/ cosmicvariance/ 2010/ 09/ 23/ the-laws-underlying-the-physics-of- everyday-life-are-completely -understood.
又称狄拉克方程。Carroll, Sean. “Physics and the Immor -tality of the Soul.” Cosmic Variance, 2010; http:// blogs. Discover magazine. com/ cosmicvariance/ 2011/ 05/ 23/ physics-and- the immortality-of- the- soul/.
Census of Marine Life. “Giant Undersea Microbial Mat Among Discoveries Revealed by Marine Life Census.” Science Daily, April 18, 2010.
Kelly, Kevin. “The Long Tail of Life.” The Technium, 2010; http:// www. kk. org/ thetechnium/ archives/ 2010/ 04/ the_ long_ tail_ o. php.
第4章 万事万物的摩尔定律
Rawsthorn, Alice. “Why @ Is Held in Such High Design Esteem.” International Herald Tribune, March 22, 2010.
Moore, Gordon E. “Cramming More Components Onto Integrated Circuits” (Reprinted from Electronics, pg 114–17, April 19, 1965). Proceedings of the IEEE 86, no. 1 (1998): 82– 85.
Myhrvold, Nathan. “Moore’s Law Corollary: Pixel Power.” New York Times, June 7, 2006.
Koh, Heebyung, and Christopher L. Magee. “A Functional Approach for Studying Technological Progress: Application to Information Technology.” Technological Forecasting and Social Change 73, no. 9 (2006): 1061– 83; Koh, Heebyung, and Christopher L. Magee. “A Functional Approach for Studying Technological Progress: Extension to Energy Technology.” Technological Forecasting and Social Change 75, no. 6 (2008): 735– 58.
假定这种增长模式下,营养物质会源源不断地供应。
Christensen, Clayton M. “Exploring the Limits of the Technology S-Curve. Part I: Component Technologies.” Production and Operations Management 1, no. 4 (1992): 334– 57.
最近的研究还未达成共识,它们到底是指数函数还是其他类型的快速增长函数,如幂律或二重指数。但结果是一样的:都符合特定规律。请见McNerney, James, et al. “Role of Design Complexity in Technology Improvement.” Proceedings of the National Academy of Sciences 108, no. 22 (May 31, 2011): 9008– 13; Nagy, Béla, et al. “Superexponential Long- term Trends in Information Technology.” Technological Forecasting and Social Change 78, no. 8 (October 2011): 1356– 64. 更多性能曲线请见数据库:http:// pcdb. santafe. edu.
Powell, Corey S. “The Rise of the Machines Is Not Going as We Expected.” Discover (May 2010).
Kelly, Kevin. What Technology Wants. New York: Viking, 2010.
个人研究。数据取自Bureau International des Poids et Mesures. The International System of Units, 2006.
MacArthur, Daniel. “The Plummeting Cost of Genome Sequencing.” Wired Science, 2011. http:// www. wired. com/ wiredscience/ 2011/ 02/ illustrating - the - plummeting- cost-of- genome- sequencing.
数学领域也有这样的倍增。例如,由于计算能力的增长,已知的最大的素数的位数呈指数增长。进多信息请访问:http:// primes. utm. edu/ notes/ by_ year. html.
Cox, Jürgen, and Matthias Mann. “Is Proteomics the New Genomics?” Cell. Cell Press, August 10, 2007. http:// linkinghub. elsevier. com/ retrieve/ pii/ S0092867407009701.
Stevenson, Ian H., and Konrad P. Kording. “How Advances in Neural Recording Affect Data Analysis.” Nature Neuroscience 14, no. 2 (February 2011): 139– 42.
Cole, Jonathan R. The Great American University: Its Rise to Preeminence, Its Indispensable National Role, Why It Must Be Protected. New York: Public Affairs, 2009.
Petroski, Henry. “Engineering Is Not Science.” IEEE Spectrum 9 December 2010.
Yensen, T. D. “What Is the Magnetic Permeability of Iron?” Journal of the Franklin Institute 206, no. 4 (1928): 503– 10.
Cirasella, J. and D. Kopec. “The History of Computer Games.” Exhibit at Dartmouth Artificial Intelligence Conference: The Next Fifty Years (AI@50). Conferences, Seminars and Symposiums: Conference Presentation. Dartmouth College, Hanover, NH, July 13– 15, 2006.
不幸的是,发达国家根除脊髓灰质炎仍是一个中央事实。由于世界全球化,脊髓灰质炎仍有可能卷土重来,从发展中国家传播到发达国家。
Kotler, Steven, and Peter H. Diamandis. Abundance: The Future Is Better Than You Think. New York: Free Press, 2012.
Wolfram|Alpha. “Life Expectancy, United States” ; http:// www. wolframalpha. com/ input/? i= life+ expectancy + United+ States, 2011.
Grey, Aubrey D. N. J. de. “Escape Velocity: Why the Prospect of Extreme Human Life Extension Matters Now.” PLoS Biol 2, no. 6 (June 15, 2004): e187. Further reading: Finch, Caleb E., and Eileen M. Crimmins. “Inflammatory Exposure and Historical Changes in Human Life- Spans.” Science 305, no. 5691 (September 17, 2004): 1736– 39.
Murphy, Tom. “ Galactic-Scale Energy.” Do the Math, 2011. http:// physics. ucsd. edu/ do-the- math/ 2011/ 07/ galactic- scale- energy.
Kelly. What Technology Wants.
McCarney, Rob, et al. “The Hawthorne Effect: A Randomised, Controlled Trial.” BMC Medical Research Methodology 7, no. 1 (2007): 30.
Henrich, Joseph. “Demography and Cultural Evolution: How Adaptive Cultural Processes Can Produce Maladaptive Losses: The Tasmanian Case.” American Antiquity 69, no. 2 (April 1, 2004): 197– 214.
Caplan, Bryan. http:// econlog. econlib . org/ archives/ 2011/ 05/ replies_ to_ crit. html. 2011.
Kremer, Michael. “Population Growth and Technological Change: One Million B. C. to 1990.” The Quarterly Journal of Economics 108, no. 3 (August 1, 1993): 681– 716.
Bettencourt, L. M. A., J. Lobo, D. Helbing, C. Kuhnert, and G. B. West. “Growth, Innovation, Scaling, and the Pace of Life in Cities.” Proceedings of the National Academy of Sciences of the United States of America 104, no. 17 (2007): 7301–06.
Kremer. “Population Growth.”
最简单的模型是零级动力模型,但是在这里我们至少要讨论人口和技术进步的关系。
Ashraf, Quamrul, and Oded Galor. “Dynamics and Stagnation in the Malthusian Epoch.” National Bureau of Economic Research Working Paper Series no. 17037 (2011).
Merton, Robert K. “Science, Technology and Society in Seventeenth-Century England.” Osiris 4 (January 1, 1938): 360– 632.
Cliff, Andrew, and Peter Haggett. “Time, Travel and Infection.” British Medical Bulletin 69 (January 2004): 87– 99.
Ibid.; Grübler, Arnulf. Technology and Global Change. Cambridge, UK: Cambridge University Press. 2003.
Marchetti, Cesare. “Anthropological Invariants in Travel Behavior.” Technological Forecasting and Social Change 47, no. 1 (September 1994): 75– 88.
Noble, J. V. “Geographic and Temporal Development of Plagues.” Nature 250, no. 5469 (August 30, 1974): 726– 29.
第5章 事实的传播
Schwartz, David A. “How Fast Does News Travel?” The Public Opinion Quarterly 37, no. 4 (December 1, 1973): 625– 27.
Tai, Mary M. “A Mathematical Model for the Determination of Total Area Under Glucose Tolerance and Other Metabolic Curves.” Diabetes Care 17, no. 2 (February 1, 1994): 152– 54.
Dittmar, Jeremiah E. “Information Technology and Economic Change: The Impact of the Printing Press.” The Quarterly Journal of Economics 126, no. 3 (August 1, 2011): 1133– 72.
我建议你去参观美因兹的古登堡博物馆,里面有惊人而深度的讲解。
Christakis, Nicholas A., and James H. Fowler. Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives. New York: Little Brown, 2009.
Onnela, Jukka- Pekka, et al. “Geographic Constraints on Social Network Groups.” PLoS ONE 6, no. 4 (April 5, 2011): e16939.
Christakis and Fowler. Connected. 最近,这项研究方法受到了质疑。更多细节请见下列论文:VanderWeele, T. J. “Sensitivity Analysis for Contagion Effects in Social Networks.” Sociological Methods and Research 40 (2011): 240– 55; Christakis, Nicholas A., and James H. Fowler. “Social Contagion Theory: Examining Dynamic Social Networks.” Statistics in Medicine, forthcoming.
Gould, Stephen Jay. Bully for Brontosaurus: Refl ections in Natural History. New York: W. W. Norton, 1992.
Hamblin, T. J. “Fake!” British Medical Journal 283 (1981): 19– 26. The persistence of incorrect facts in the literature over time was explored further in Tatsioni, Athina, Nikolaos G. Bonitsis, and John P. A. Ioannidis. “Persistence of Contradicted Claims in the Literature.” JAMA: The Journal of the American Medical Association 298, no. 21 (December 5, 2007): 2517– 26.
Mauboussin, Michael J. Think Twice: Harnessing the Power of Counterintuition. Harvard Business School Press, 2009; See For Yourself: The Importance of Checking Claims, Legg Mason Global Asset Management, 2009.
Munroe, Randall. “Misconceptions.” xkcd. https:// www. xkcd. com/ 843/.
详情及更多内容请在谷歌图书搜索contrary to popular belief.
Bothamley, Jennifer, ed. Dictionary of Theories. Farmington Hills, MI: Gale Research International Ltd., 1993.
Bowers, John F. “James Moriarty: A Forgotten Mathematician.” New Scientist (December 23– 30, 1989).
Kennaway, K. D. “String Theory and the Vacuum Structure of Confining Gauge Theories.” PhD dissertation. University of Southern California, 2004.
Mauboussin, See For Yourself.
Fallows, James. “Boiled Frog Does a Surreal Meta- Backfl ip.” The Atlantic, March 2, 2010. http:// www. theatlantic. com/ technology/ archive/2010/ 03/ boiled-frog-does-a-surreal-meta-backfl ip/ 36934/.
Barbrook, Adrian C. et al. “The Phylogeny of The Canterbury Tales.” Nature 394, no. 6696 (August 27, 1998): 839.
其他人也发表了许多论文:Simkin, M. V., and V. P. Roychowdhury. “Stochastic Modeling of Citation Slips.” Scientometrics 62 (2005): 367– 84; “Read Before You Cite!” arXiv:cond-mat/ 0212043 (December 2002).
Liben- Nowell, David, and Jon Kleinberg. “Tracing Information Flow on a Global Scale Using Internet Chain- letter Data.” Proceedings of the National Academy of Sciences 105, no. 12 (March 25, 2008): 4633– 38.
Castillo, Carlos, Marcelo Mendoza, and Barbara Poblete. “Information Credibility on Twitter.” In Proceedings of the 20th International Conference on World Wide Web. New York: Association for Computing Machinery, 2011. 675– 84.
第6章 隐藏的事实
Arbesman, Harvey. “Is Cutaneous Malignant Melanoma Associated with the Use of Antibacterial Soaps?” Medical Hypotheses 53, no. 1 (July 1999): 73– 75.
Arbesman, Harvey. “Dairy and Acne— the Iodine Connection.” Journal of the American Academy of Dermatology 53(6): 1102. December 2005.
“The Benefits of Open Innovation.” InnoCentive. http:// www. innocentive. com/ seekers/ benefits- open- innovation.
Legatum Center for Development & Entrepreneurship. “Legatum Lecture Series Presents: Alpheus Bingham of InnoCentive, Inc.” http:// legatum. mit. edu/binghamlecture.
Swanson, Don R. “Undiscovered Public Knowledge.” The Library Quarterly 56, no. 2 (April 1, 1986): 103– 18.
Swanson, Don R. “Medical Literature as a Potential Source of New Knowledge.” Bulletin of the Medical Library Association 78, no. 1 (January 1990): 29– 37; Swanson, Don R. “Migraine and Magnesium: Eleven Neglected Connections.” Perspectives in Biology and Medicine 31, no. 4 (1988): 526– 57.
Swanson, Don R., and Neil Smalheiser. “Undiscovered Public Knowledge: A Ten- Year Update.” In KDD-96 Proceedings. Edited by Evangelos Simoudis, Jia Han, and Usama Fayyad, 295– 98. AAAI Press, 1996.
约三分之一的创新中心项目都已得到解决。Lakhani, K. R., et al. “The Value of Openness in Scientific Problem Solving.” Harvard Business School Working Paper No. 07— 050. (2007); http:// www. hbs. edu/ research/ pdf/07— 050. pdf.
Simkin, M. V., and V. P. Roychowdhury. “Re-inventing Willis.” Physics Reports 502, no. 1 (May 2011): 1– 35.
Trakhtenbrot, B. A. “A Survey of Russian Approaches to Perebor ( Brute- Force Searches) Algorithms.” IEEE Annals of the History of Computing 6 (October 1, 1984): 384– 400.
Robinson, Karen A., and Steven N. Goodman. “A Systematic Examination of the Citation of Prior Research in Reports of Randomized, Controlled Trials.” Annals of Internal Medicine 154 , no. 1 (January 4, 2011): 50– 55.
Lau, Joseph, et al. “Cumulative Meta-Analysis of Therapeutic Trials for Myocardial Infarction.” New England Journal of Medicine 327, no. 4 (July 23, 1992): 248– 54.
Frijters, Raoul, et al. “Literature Mining for the Discovery of Hidden Connections between Drugs, Genes and Diseases.” PLoS Computational Biology 6, no. 9 (September 23, 2010): e1000943.
Frijters, Raoul, et al. “CoPub: A Literature-Based Keyword Enrichment Tool for Microarray Data Analysis.” Nucleic Acids Research 36, no. supplement 2 (July 1, 2008): W406– W410.
另一个类似工具的例子:Kuhn, Michael, et al. “ Large-Scale Prediction of Drug-Target Relationships.” Federation of European Biochemical Societies Letters 582, no. 8 (April 9, 2008): 1283– 90.
请见TRIZ,它是一种发明和发现的方法。例如:www. aitriz. org.
Sanseau, Philippe, and Jacob Koehler. “Editorial: Computational Methods for Drug Repurposing.” Briefings in Bioinformatics 12, no. 4(July 1, 2011): 301– 2.
Darden, Lindley. “Recent Work in Computational Scientific Discovery.” In Proceedings of the Nineteenth Annual Conference of the Cognitive Science Society(1997) 161– 66.
请见TheoryMine: http://theorymine. co. uk.
Cisne, John L. “How Science Survived: Medieval Manuscripts’ ‘Demography’ and Classic Text’s Extinction.” Science 307, no. 713(February 25, 2005): 1305– 7.
Johnson, Steven Berlin. “Tool for Thought.” New York Times, January 30, 2005.
第7章 知识相变
Sagan, Carl. The Varieties of Scientific Experience. New York: Penguin, 2006.
Kelly, Kevin. What Technology Wants. New York: Viking, 2010. p. 157.
在物理学中,与求所谓的序参量(order parameter)有关,这个量一半为零,另一半非零。要确定序参量,就要对每个系统做一定量创造性的努力。
Arbesman, Samuel, and Gregory Laughlin. “A Scientometric Prediction of the Discovery of the First Potentially Habitable Planet with a Mass Similar to Earth.” PLoS ONE 5, no. 10 (October 2010): e13061.
此后又有人提出了其他的宜居度指标。如类地指数(Earth Similarity Index),请见:http:// phl. upr. edu/ projects/ earth-similarity-index-esi.
开普勒22b可能比地球大得多。然而,开普勒任务发现有一些候选行星更像地球,但截止到2012中旬尚未证实。
Singh, Simon. Fermat’s Enigma. New York: Walker & Company, 1997.
更多内容见戈德尔完备性定理(Goedel completeness theorem):G?del, Escher, Bach: An Eternal Golden Braid by Douglas R. Hofstadter. Basic Books. 1979.
Arbesman, Samuel, and Rachel Courtland. “2011 preview: Million- Dollar Mathematics Problem.” New Scientist, December 2010.最近,Ryohei Hisano和Didier Sornette进行了一项更为复杂的统计分析;他们估计,到2014年概率为41%,与我们预测的50%很接近。Hisano, Ryohei, and Didier Sornette. “On the Distribution of Time-to-Proof of Mathematical Conjectures.” (2012); http:// arxiv. org/ abs/ 1202. 3936.
Bettencourt, Luis M. A.,et al. “Growth, Innovation, Scaling, and the Pace of Life in Cities.” Proceedings of the National Academy of Sciences 104, no. 17(2007): 7301– 6.
West, G. B, J. H. Brown, and B. J. Enquist. “A General Model for the Origin of Allometric Scaling Laws in Biology.” Science 276 (5309): 126.
与Sarah Gilbert和Rena Lauer私下交流后得知,他俩都是研究中世纪的科学家。
Loschek, Ingrid. When Clothes Become Fashion: Design and Innovation Systems. London: Berg Publishers, 2009.
第8章 珠穆朗玛峰与错误的发现
请见Everest@National Geographic: http:// www. nationalgeographic. com/ features/ 99/ everest/ roof_content. html (accessed December 20, 2011).
Preston, Richard. “Tall for Its Age.” The New Yorker (October 9, 2006): 32–36.
Cukier, Kenneth. “A Special Report on Managing Information: Data, Data Everywhere.” The Economist (February 25, 2010).
Wilkins, John. An Essay Towards a Real Character, and a Philosophical Language. 1668. Available online: http:// www. metricationmatters. com/ docs/ WilkinsTranslationShort. Pdf.
更多测量请见美国标准与技术研究院网站: http:// www. nist. gov/.
Cardarelli, Fran?ois. Encyclopaedia of Scientific Units, Weights, and Measures:Their SI Equivalences and Origins. New York: Springer Publishing, 2004.
Crease, Robert P. “Measurement and Its Discontents.” New York Times. October 23, 2011.
Dessler, A. J., and C. T. Russell. “From the Ridiculous to the Sublime: The Pending Disappearance of Pluto.” Eos, Transactions, American Geophysical Union 61, no. 44 (1980): 690.
Fisher的具体实验被用在了这里。在线计算器见:http:// www. graphpad. com/ quickcalcs/ contingency1. Cfm.
Munroe, Randall. “Significant.” xkcd. http:// xkcd. com/ 882/.
Penman, Bridget, et al. “ Genomewide Association Studies in Plasmodium Species.” BMC Biology 8, no. 1 (2010): 90; 统计学家对此已经提出了技术方面的解释,如所谓的Bonferroni校正法,即在进行显著性比较时,如若比较的变量过多,校正后的检验水准会过小,因而p值应该更严格、更小。
Quinlan, Gerald D. “Planet X: A Myth Exposed.” Nature 363, no. 6424 (May 6, 1993): 18–19. Grosser, Morton. “The Search for a Planet beyond Neptune.” Isis 55, no. 2 (June 1, 1964): 163–83. The History of Science Society.
Ioannidis, John P. A. “Contradicted and Initially Stronger Effects in Highly Cited Clinical Research.” JAMA: The Journal of the American Medical Association 294, no. 2 (2005): 218– 28.
Ioannidis, John P. A., and Orestis A. Panagiotou. “Comparison of Effect Sizes Associated With Biomarkers Reported in Highly Cited Individual Articles and in Subsequent Meta- analyses.” JAMA: The Journal of the American Medical Association 305, no. 21 (June 1, 2011): 2200– 10.
Ioannidis, John P. A. “Why Most Published Research Findings Are False.” PLoS Med 2, no. 8 (2005): e124.
Zimmer, Carl. “It’s Science, but Not Necessarily Right.” New York Times, June 26, 2011.
Quoted in Cole, Stephen. Making Science: Between Nature and Society. Cambridge, MA: Harvard University Press, 1992.
Moonesinghe, Ramal, Muin J. Khoury, A. Cecile, and J. W. Janssens. “Most Published Research Findings Are False— But a Little Replication Goes a Long Way.” PLoS Medicine 4, no. 2 (February 27, 2007): e28.
Cole, Jonathan, and Stephen Cole. Social Stratification in Science. Chicago: University of Chicago, 1973. p. 217.
Cole, Stephen. Making Science: Between Nature and Society. Cambridge, MA: Harvard University Press, 1992.
Ziman, John M. Public Knowl-edge: An Essay Concerning the Social Dimension of Science. Cambridge, UK: Cambridge University Press, 1968.
Mueller, John. “War Has Almost Ceased to Exist: An Assessment.” Political Science Quarterly, 124, no. 2 (2009).
Galton, Francis. Inquiries into Human Faculty and Its Development, 1883. Available online: http:// galton. org/ books/ human- faculty/ text/ human- faculty. Pdf.
Galton, Francis. “On Head Growth in Students at the University of Cambridge.” The Journal of the Anthropological Institute of Great Britain and Ireland 18 (January 1, 1889): 155– 56.
Galton, Francis. “Visualized Numerals.” Nature (March 25, 1880): 494– 5.
Gorraiz, Juan, Christian Gumpenberger, and Martin Wieland. “Galton 2011 Revisited: A Bibliometric Journey in the Footprints of a Universal Genius.” Scientometrics 88, no. 2 (2011): 627– 52.
Stigler, S. M. “Darwin, Galton and the Statistical Enlightenment.” Journal of the Royal Statistical Society: Series A (Statistics in Society) 173 (2010): 469– 82.
Price, Derek J. de Solla. Little Science, Big Science—and Beyond. New York: Columbia University Press, 1986.
Hoxie, R. E., and L. Z. Rubenstein. “Are Older Pedestrians Allowed Enough Time to Cross Intersections Safely?” Journal of the American Geriatrics Society 42, no. 3 (March 1994): 241– 4.
May, Robert M. “How Many Species Are There on Earth?” Science 241, no. 4872 (September 16, 1988): 1441– 49; Clark, J. Alan, and Robert M. May. “Taxonomic Bias in Conservation Research.” Science 297, no. 5579 (July 12, 2002): 191– 92.
Bonnet, Xavier, Richard Shine, and Olivier Lourdais. “Taxonomic Chauvinism.” Trends in Ecology & Evolution. Amsterdam: Elsevier Science Publishers, (January 1, 2002).
Gould, Stephen Jay. Bully for Brontosaurus: Reflections in Natural History. New York: W. W. Norton, 1992.
第9章 被人类影响的事实
Lettvin J. Y., et al. “What the Frog’s Eye Tells the Frog’s Brain,” Proceedings of the Institute of Radio Engineers 47 (1959): 1940– 51, reprinted in Warren S. McCulloch, Embodiments of Mind. Cambridge, MA: MIT Press, 1965.
Helfman, Gene S. Fish Conservation: A Guide to Understanding and Restoring Global Aquatic Biodiversity and Fishery Resources. Washington, DC: Island Press, 2007.
Kelly, Kevin. What Technology Wants. New York: Viking, 2010. p. 235.
“A Correction.” New York Times, July 17, 1969.
Schulz, Kathryn. Being Wrong: Adventures in the Margin of Error. New York: Ecco, 2010. Schulz认为容易犯错的一个主要原因是对和错给人感觉很像。
Wray, Bradley. “Cognitive Bias Song”; https:// www. youtube. com/ watch?v= 3RsbmjNLQkc.
Hempel, Carl G. Philosophy of Natural Science. Englewood Cliffs, NJ: Prentice-Hall, 1966.
Shirky, Clay. Cognitive Surplus: Creativity and Generosity in a Connected Age. New York: The Penguin Press, 2010. p. 99.
Chabris, Christopher, and Daniel Simons. The Invisible Gorilla: And Other Ways Our Intuitions Deceive Us. New York: Crown Archetype, 2010.
Amira, Dan. “President Obama Has No Idea What Year It Is.” New York: Daily Intel, 2011; http:// nymag.com/ daily/ intel/ 2011/ 05/ president_ obama_has_ no_ idea_ wh. html.
WebMD. “Blood Nose (Nosebleed) Causes and Treatments”; http:// firstaid. webmd. com/ nosebleeds-causes-and-treatments; accessed February 4, 2012.
我一个朋友的儿子向我解释说,冥王星被摧毁了,就像超人的家园氪星被摧毁了。
Chabon, Michael. “To The Legoland Station.” In Manhood for Amateurs. New York: HarperCollins, 2009, pp. 51–58.
Johnson, Steven. Where Good Ideas Come From: The Natural History of Innovation. New York: Riverhead, 2010.
Howley, Kerry. “Welcome Guest Workers.” The Atlantic (July/ August 2009).
Kuhn, Thomas S. The Structure of Scientific Revolutions. Chicago: University of Chicago Press, 1996. p. 151.
Hull, David L. Science as a Process. Chicago: University of Chicago Press. 1988; Wray, K. Brad. Kuhn’s Evolutionary Social Epistemology. Cambridge: Cambridge University Press. 2011.
他的作品概览及这一话题请见Watts, Duncan. Everything Is Obvious *Once We Know the Answer: How Common Sense Fails Us. New York: Crown Business, 2011.
Martin, Andrew Thomas. “The Evolving Lexicon.” Dissertation. University of California Los Angeles, 2007.
Lieberman, Erez, et al. “Quantifying the Evolutionary Dynamics of Language.” Nature 449, no.7163 (2007): 713– 16.
更多例子请见Ben Yagoda’s article in Slate, “The ‘Nonplussed’ Problem”; http:// www. slate. com/ articles/ life/ the_ good_ word/ 2011/ 04/ the_nonplussed_ problem. 2. html.
Kuniko, Nielsen. “Specificity and Abstractness of VOT Imitation.” Journal of Phonetics 39, no. 2(April 2011): 132– 42.
Hay, Jennifer, Stefanie Jannedy, and Norma Mendoza- Denton. “Oprah and / ay/: LexicalFrequency, Referee Design and Style.” In Proceedings of the 14th International Congress of Phonetic Sciences, eds. John J. Ohala et al. (1999): 1389– 92.
McWhorter, John. “Swearing In: Are Curse Words Becoming More Common?” The New Republic, March 23, 2011.
请见Suzanne Evans Wagner的研究,例如:Wagner, Suzanne Evans. “Language Change and Stabilization in the Transition from Adolescence to Adulthood.” Dissertation. University of Pennsylvania, 2008.
Yaeger- Dror, Malcah. “Phonetic Evidence for the Evolution of Lexical Classes: The Case of a Montreal French Vowel Shift.” In Towards a Social Science of Language, ed. G. Guy, et al. Philadelphia: Benjamins, 1996. 263– 87; Yaeger- Dror, Malcah, “Lexical Classes in Montreal French: The Case of (E:),” Language and Speech 35 no. 3 (July/September 1992): 251.
http:// www. worldometers. info.
http:// www. measuringworth. com/ ppoweruk.
http:// www. theatlanticwire. com/posts/ media- diet.
Sparrow, Betsy, Jenny Liu, and Daniel M. Wegner. “Google Effects on Memory: Cognitive Consequences of Having Information at Our Fingertips.” Science 353, no. 6043 (2011): 776–78.
Nicholas Carr用定量的方法探讨了这一话题,请见论文:July/August 2008 issue of The Atlantic, “Is Google Making Us Stupid?”
http:// www. uptodate. com/ home/ about/ index. html.
第10章 知识的边缘
Johnson, Steven Berlin. Where Good Ideas Come From: The Natural History of Innovation. New York: Riverhead, 2010.
Poovey, Mary. A History of the Modern Fact: Problems of Knowledge in the Sciences of Wealth and Society. Chicago: University of Chicago Press, 1998.
Barnes, Jonathan. Early Greek Philosophy. New York: Penguin, 1987.
这是Karl Popper的证伪主义观点:只有可测的、可以被反例所反驳和证伪的科学理论才是真的科学理论。他的讨论见书:The Logic of Scientific Discovery. Routledge. Reprinted in 1992.
Schulz, Kathryn. Being Wrong: Adventures in the Margin of Error. New York: Ecco, 2010. p. 32.
Deutsch, Karl W., John Platt, and Dieter Senghaas. “Conditions Favoring Major Advances in Social Science.” Science 171, no. 3970 (February 5, 1971): 450–59.
“I Am a Rock, I Am an Island: How Submerged Islands Could Keep Their Statehood.” The Economist, May 26, 2011.
“Tech Luminaries Address Singularity.” IEEE Spectrum, June 2008.
这被称为人口过渡。
Natural History Museum, London. “Carl Linnaeus.” http:// www. nhm. ac. uk/ nature- online/science-of- natural- history/ biographies/ linnaeus/ index. html.
World Health Organization. “History of the Development of the ICD.” Available online: www. who. int/ entity/ classifications/ icd/en/ HistoryOfICD. Pdf
美国版甚至比国际版多出千万个分类。
Johnson, Steven. Everything Bad Is Good for You. New York: Riverhead Books, 2005.
Christakis, Nicholas A., and James H. Fowler. Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives. New York, New York, USA: Little Brown, 2009.
Ugander, Johan et al. “The Anatomy of the Facebook Social Graph”; http:// arxiv. org/ abs/ 1111.4503.
O’Malley, A. James, et al. “Egocentric Social Network Structure, Health, and Pro-Social Behaviors in a National Panel Study of Americans.” PLoS ONE. 7(5): e36250.
Doyle, Arthur Conan. A Study in Scarlet, 1887. First published by Ward Lock & Co. in Beeton’s Christmas Annual, London. Available online: http://www. gutenberg. org/ ebooks/ 244.
Magee, Christopher L., and Tessaleno C. Devezas. “How Many Singularities Are Near and How Will They Disrupt Human History?” Technological Fore -casting and Social Change 78, no. 8 (October 2011): 1365– 78.
Flood, Alison. “Jonathan Franzen Warns Ebooks Are Corroding Values.” The Guardian. January 30, 2012. http:// www. guardian. co. uk/ books/2012/ jan/ 30/ jonathan- franzen- ebooks- values.