下书网

写作是门手艺全文阅读

外国小说文学理论侦探推理惊悚悬疑传记回忆杂文随笔诗歌戏曲小故事
下书网 > 文学理论 > 写作是门手艺

第9章 进阶:变量是思考的支点

书籍名:《写作是门手艺》    作者:刘军强
推荐阅读:写作是门手艺txt下载 写作是门手艺笔趣阁 写作是门手艺顶点 写作是门手艺快眼 写作是门手艺sodu
上一章目录下一章
    《写作是门手艺》第9章 进阶:变量是思考的支点,页面无弹窗的全文阅读!



主旨

·什么是变量思维?

·变量间有何种关系?

·变量思维边界何在?

关键词

·变量·常量·因变量·自变量·比较差异·寻找机制

·巧合·相关·因果·反事实推断·双盲实验

·单案例比较维度·简单系统·复杂系统

(一)从衣衫褴褛到衣冠楚楚

历史学家布尔斯廷讲了一个有趣的案例:古代普通人通常穿得衣衫褴褛,只有富人才有钱去量身定做。为什么呢?布尔斯廷说:

一直到十九世纪中叶,人们普遍认为,每个人躯体的尺寸同另外任何一个人的尺寸都大不相同,这在当时是一种常识,而“每个灵魂都有自己的独特之处”这种宗教观点使人们对上述常识更加坚信不疑。如果事实确实如此,那么,大批量制造适合不同人穿的服装就会变得徒劳无益。一个人若想有一身合体的衣服,他要么自己动手,要么雇一个裁缝。

但是,为什么到了近现代普通人也能穿得比较体面了?换个问法:为什么现在的衣服成本如此之低?大家通常会有这样的回答:生产力发展了,原材料便宜了,劳动分工了……这些解释都对,但是都太笼统、太宏观,属于正确的废话。咱们需要的是微观、直接、能够诉诸机制的解释。真正的原因是:

南北战争促使人们突然需要大量的制服,同时也提供了人体一般尺寸的大量新资料。于是,人们发现了一个重要的事实:某些配套的尺寸经常重复出现,并且有一定的规律。如果一个男人的腰围是三十八英寸,袖长三十四英寸,那么,他的肩宽十有八九是某一固定的数字。由于这个简单的发现,为大量人口制造合体的衣服就成为可能了。这个发现虽然很简单,它对成衣工业却是至关重要的。因为,没有它,商店要得到能满足顾客需要的存货是根本不可能的。南北战争结束时,服装制造商们就开始利用这些常见尺寸为一个规模空前的市场提供大批成衣了……到二十世纪初,人们有史以来首次可以走进一家服装店,说明他是“四十二号”,然后穿上一件上衣,只需稍加修改,或者根本不要任何修改,就可以使最爱挑剔的人也感到满意。人们开始知道自己属于某一个“尺寸”,鞋子、衬衣、长裤和帽子都有一定的尺寸。[80]

这个有趣的历史故事展现了测量和数据积累的重要性,其背后是变量思维。何为变量?何为变量思维?

(二)动静之间:比较差异、寻找机制

变量(variable)是指至少有两个取值的量,包含了“动”的意蕴。与变量相反的是常量(constant),取值恒定,或者说缺少变化,即所谓“静”。对一群人而言,性别是一个变量,因为它至少有男、女两个取值;身高也是一个变量,因为它可以从几十厘米到几百厘米(想想姚明和潘长江);同样,体重也是如此。但对个人来说,性别是个常量,出生地也是常量。因为人只能出生一次;除非做变性手术,否则性别也不会变化。体重则是变量,在家宅上几个月,体重不变才怪呢。身高也是变量,一早一晚都有差异。

观察世间万物,诀窍就在这动静之间。万物必有盛衰,万事必有张弛。青蛙的眼睛只能看到移动的物体,同样我们的头脑在分析的时候对“变异”“变化”的东西更加敏感,因为它们更能把事物间的联系暴露出来。《周易》有云:“参伍以变,错综其数。通其变,遂成天下之文;极其数,遂定天下之象。”如果一个事物静止不变,就如同一只黑箱,我们难以发现它的运动规律以及和其他事物之间的联系。正因如此,排查原因时首先被排除的就是那些没有变化的因素。

变量分为两类:因变量(dependent variable)和自变量(independent variable)。我们观察到一个有趣的现象(谜题),我们把它作为一个有待解释的结果。从这个结果出发,我们可以反推哪些原因造成了这个状况。这实际上就是一种变量思维。结果是因变量,而原因是自变量。

牢固树立因变量和自变量的思维习惯有助于保持明晰的头脑。变量思维是如此重要,因此我要花费很多篇幅来说明。第一个例子,如果你肠胃不适,怎样排查原因呢?你怀疑有四个原因:吃的东西、喝的东西、天气、压力。如果这几天你吃的、喝的都跟前几天一样,那么这些恒定的东西就被排除掉了。这几天的天气也很正常,你也没有着凉,这个常量就也被排除掉了。最后你发现这几天你要通宵赶一个报告,压力重重。这个变化的因素很可能是你肚子难受的原因。

表9-1 如何甄别肚子难受的原因?

我把变量思维概括为八个字:比较差异、寻找机制。科学推理建立在两个最核心的思维环节上:控制和比较。通过比较现象之间的差异来认识事物间的关系,但比较的同时尽量加以控制,以使得比较对象之间“可比”。[81]

我们通过第二个例子来说明:有的动物如猪、狗,只能活十几年,但是弓头鲸可以活几百年。疑问自然而来:同样是哺乳动物,为什么寿命差别如此之大?在这里,动物寿命是因变量,它的变异(有长有短)是我们需要解释的对象。我们会比较不同动物的性成熟时间、基因以及一系列其他特征,这些因素都属于自变量。通过研究,我们能够建立哺乳动物寿命与其他因素的变量关系,建立一个模型。

按照控制、比较的思路,这种推理可以继续往下进行。如果说基因可能很大程度上决定了不同哺乳动物寿命之长短,那么咱们可以聚焦到人或者小白鼠一类动物上,从而控制住基因的影响。同样作为人,为什么有的人活得长,有的人活得短?这也是一个值得解释的变量差异。我们会追果溯因,去建立寿命与一系列其他因素的关系,例如生活方式、工作条件、收入、健康照料条件等。这些变量关系可以帮助我们规划生活,以延年益寿。

另如,为什么有的动物脑容量大,有的动物脑容量小?甚至同属于灵长类,人类、黑猩猩、猿猴等的脑神经元数量差异也很大。如何解释这些差异?脑科学家们用切片、溶液、抽样、计算细胞核的方法计算出人脑的神经元数量,并且顺藤摸瓜测量了灵长类、啮齿类动物的脑容量,从而解释了脑细胞差异的由来,而且提出了一个有趣的假设:人类会做饭,大大提升了热量摄取的效率。[82]

好多人认为理工科和量化研究才用得着变量思维。实际上,定性研究同样需要“比较差异、寻找机制”。咱们看第三个例子:彭长桂、吕源教授的《制度如何选择:谷歌与苹果案例的话语分析》。[83]在相似的压力下,为何谷歌和苹果做出了不同的反应?这篇论文是典型的定性研究,采用了话语分析法,解释了差异产生的机制。虽然没有使用量化数据,但其分析、推理均采用了“比较差异、寻找机制”的路径。

变量无处不在。咱们在中学课本上学过这么一句话:世界万物是普遍联系的。但是怎样联系的呢?具体而言,世界万物通过变量相互联系在一起。有了变量思维,我们才能够把孤立的事情联系起来,通过变量之间的关系把整个世界编织成一个比较有组织的网络。整个世界在我们眼里不再杂乱无章,而是由各个变量和机制串联起来的有机体。

你自己是第四个例子。你的身高是一个变量,体重也是一个变量,这两个变量会影响第三个变量:身体质量指数(Body Mass Index, BMI)。BMI通常用于衡量身体是否超重,是一个非常有用的指标。BMI作为一个变量,又与其他变量相互联系着:

·它跟你衣服的尺码(变量)密切相关。BMI超标的人往往得穿大码的衣服。如果BMI严重超标,可能就得去胖子衣服专卖店了。

·它和你的心脑血管疾病发病率(变量)密切相关。BMI超标的人,更容易发生一系列疾病。它是糖尿病、心脑血管等疾病的风险因子。

·如果你想买一份商业保险,你会发现BMI会影响你的保费(又是一个变量)。

以上就是比较差异、寻找机制的思维过程。变量关系不仅是理解研究问题最关键的一把钥匙,也是理解这个世界运行规则的一个基础视角。蒯因说过一句含意隽永的话:每一种存在都对应着一个变量的取值(to be is to be a value of a variable)。[84]的确,我们的生存状态对应着多个变量的取值,每个人身上都是一堆变量的集合:既有性别、身高、体重、血压、年龄等生理变量,也有爱好、心情、价值观等主观变量,还有出身、种族、宗信信仰、工作、收入等社会变量。外在于她的个体,她还从属于一大堆其他的变量:她可能为人母,她属于某个圈子等。这些变量揭示了她是一个什么样的人,即她的生存状态(to be)。人身上的变量在何时变成常量呢?如果一个人年龄不再增长,体温不再变化,血压恒定,心电图变成毫无波澜的直线,那么只有一种状态可以概括:死亡(not to be)。

北岛写过一首名叫《生活》的诗,短到只有一个字:网。在我看来,生活就是由无数变量织成的一张大网,可谓变量在手,天下我有。

(三)双盲实验:鉴别变量关系的照妖镜

变量之间的关系大致有三种:巧合、相关和因果。你穿了红袜子,结果买彩票中了奖,这两者完全是巧合。对于巧合,我们得心存警惕,不要过度推论。各类穿凿附会的迷信大多诉诸巧合,例如占星术之类。有时变量间是相关关系(correlation),例如爱喝葡萄酒的人似乎更健康。但葡萄酒和健康之间仅是相关而已:喝葡萄酒的人工作和收入要相对好一些,因此身体也更好。如果发现相关关系,我们可以高兴一下,因为相关关系可以提供有用的连接。

如果相关关系能够被识别为因果关系,我们就更高兴了。发现可靠的因果关系是整个科学研究最重要的目的之一。有了因果关系,我们才能够合理解释,恰当干预。面对社会问题时,政策措施才会有的放矢。然而,因果关系的识别需要非常苛刻的条件,需要用到反事实推断(counterfactual inference):你吃了一种药后病好了,这不能证明药物有用(事实);你还需要证明,如果没吃这个药,病就没好(反事实)。[85] 这一正一反结合起来,才能算是因果关系,如同两个平行宇宙的对比。

反事实大多存在于想象之中。[86] 电影《生活多美好》(It’s a Wonderful Life, 1946)中,善良的主人公乔治被恶霸逼得想自杀,前来营救他的天使苦劝无效。天使只好让乔治返回去看看如果他没出生的话,这个世界会是什么样的。一个小人物对世界的影响就通过这个对比显现出来了。另如《人类消失后的世界》(Life After People,2008),科学家想象没有人类的地球是什么样子。史铁生的《好运设计》、海伦的《假如我有三天光明》都属于此类。

正如美国诗人罗伯特·弗罗斯特的《未选择的路》:在那条没有走的路上,我们永远不知道会发生什么。如果一件事情没有发生,咱们怎样进行对比分析呢?答案是随机受控实验(Randomized Control Trials)。传奇的统计学家罗纳德·费歇尔(Ronald A. Fisher)较早提出并设计了随机实验的原则。费歇尔职业生涯早期曾担任农技站的技术人员,他要解决的问题就是如何识别肥料是否有用。但是:

任何人观察土地上的作物时,都会很明显地感到有的地块土质好于其他地块。在某些角落,作物长得又高又密,而其他角落,作物则又细又稀。这可能是由于排水方式、土壤类型的改变、未知养分的出现、多年生野草的抵制,或者一些其他未能预见的原因。如果农业科学家要测试两种人工肥料间的区别,他可以将一种施于地块的某一角,而另一种施于地块的其他角。但这会将肥料的效应与土壤或者排水等的效应混淆在一起。如果试验在相同的地块不同的年份进行,又会把肥料的效应与气候变化的效应相混淆。[87]

怎么办呢?在大家争吵不休时:

费歇尔笑眯眯地坐在一边,听任他们卷入复杂的争论。他已经考虑过这些问题,并有了简明的答案。了解他的人这样描绘费歇尔:即使是争论触及他,他仍是静静地坐在那里,吞云吐雾,等待容他给出答案的时机。终于,他拿开嘴上的烟斗,说道:“用随机的方法吧!”

随机受控实验已经成为因果关系识别的金标准,尤其在医学领域,在社会科学中应用也在扩展。[88]我们判断药品是否有效,最可靠的标准还是双盲实验——随机受控实验的一种。例如,2020年的新冠肺炎治疗中冒出好多方子。据说,我们“对某病了解得越少,治疗方法就越多”[89]。他们中有些是无意的骗子,有的则是有意的骗子。鉴别并不容易,因为有用没用之间掺杂着无数干扰因素:

·个体差异:不同人的体质、基因、生活习惯差异。

·自我修复:即使不吃药,身体也有可能自行好转痊愈。

·心理暗示:即使药物没用,有人服用后也会感觉得到治疗了,从而促进痊愈。

怎样鉴别呢?双盲实验是不二法门。通过一系列精巧设计,双盲实验可以消除上述因素的影响。操作如下:

·随机分组。将病人随机分为两组,务必保证随机。这两组分别为实验组和控制组。控制组相当于实验组的平行宇宙。样本足够大时,两组均值、方差和分布几乎一致。

·区别用药。实验组用真正的药物,而控制组用安慰剂,这是两组唯一的差别。

·前测后测。对实验组和控制组进行前测和后测,跟踪比较给药前后的病情变化。

·完全匿名。实验组和控制组名单对病人和医生都保密,只在最终结果出来时才公布。安慰剂的外观跟药物完全一致。这样做可以屏蔽掉心理暗示。

通过随机分组、实验组与控制组差别对待以及前后对比,药物的真正效果就能水落石出了。如果实验组结果优于控制组,那么证明药物有效;如果实验组和控制组结果无差异,那么药物就被证明无效。双盲实验是迄今为止最可靠的因果识别机制,如同一面照妖镜。在头脑中牢固树立双盲实验的思维,你会拥有一双火眼金睛。

电影《酒业风云》(Bottle Shock,2008)讲了一个美国加州葡萄酒靠盲评逆袭的故事。在1976年以前,美国葡萄酒被贬低为汽水。后来一个酒庄组织了一次盲品会:顶级品酒师,全部为法国人;酒品打乱顺序且匿名,评委喝完逐一打分。结果加州纳帕谷大获全胜,一举把傲慢的法国葡萄酒业拉下马,史称“巴黎评判”。盲品会虽然不是双盲实验,却借鉴了其要素,因而刨除了刻板印象、晕轮效应、首因效应等认知偏差,让品质最佳者胜出。

(四)变量思维的边界

1. 单案例研究可否使用变量思维?

在《中阶:谜题是文章的救星》一章中,我提出的“有的……有的……”句型直接对准变量的实质:变异。变异是指变量的取值及其范围。“有的……有的……”句型是为了比较变异,而“同样……”则实现了一定的控制,使得比较对象间具备相似性,从而使得比较变得可比、可信。因此,好的研究问题需要做到以下三点:

·控制部分,比较对象之间越相似越好,越可比越好。

·变异部分,差异越大越好,无论是结果还是原因。

·解释部分,能讲清楚自变量和因变量之间有无关系、何种关系(相关还是因果),以及它们具体的作用机制是什么。

但是有人会说,我只研究一个个案(一个村庄、一只动物、一起案件),没有比较,也没有变异。此言差矣。变异就像海绵里的水,只要愿意挤,总是会有的。你至少还可以从三个维度找出差异:时间维度、空间维度、类别维度。

表9-2 案例研究中的比较维度

通过这三方面的比较,你就获得了大量的变异。通过比较变异,你就能够深入案例分析之中,进而发现有趣的机制。学术上的庖丁解牛,无非是把案例内部的差异进行系统的比较,以发现关联。

2. 变量思维的局限

控制与比较的变量思维是实验方法在思维中的应用。人类依靠科学实验积累了史无前例的科学知识。变量思维如此强大,咱们可否利用变量思维认识世间万物的所有奥秘?还真有人这么想。法国数学家皮埃尔-西蒙·拉普拉斯设想了这样一个智者:“知道让自然运转的所有力量,也知道自然界所有事物所处的位置。对于这样的‘智者’来说,没有不确定的事,未来就像过去一样呈现在它的眼前。”[90]这个智者被称为“拉普拉斯妖”。

这个妖怪只存在于想象之中,原因在于世界太复杂了。变量思维在应用于简单系统时比较有用,例如卫星轨道运行,因为变量稀少、关系简单。一旦应用到复杂系统,变量思维就捉襟见肘了。复杂系统变量繁多且关系错综复杂,变量间关系大多是非线性。何为线性?何为非线性?不严格地说,“种瓜得瓜、种豆得豆”相当于线性关系的形象表达,而“付出与结果不成正比”则是非线性的表达。我们以农业系统为例,看看线性关系是否存在:政府投入的农业资金是否跟产量变化成正比?这还真不见得:

·投入的资金传输时会遇到各种渗漏,例如挪用、决策失误、延误等。

·农业产出还受到天气、病虫害、市场需求等各方面的影响,资金只是一个因素。

·人为因素不可忽略,例如劳动力素质、工作效率等。

人类世界比自然世界复杂得多。简单变量思维在应用于人文社科领域时尤其要谨慎。[91] 人类的复杂多变使得用变量去测量人类行为的研究非常容易被挑战。人性所体现的复杂性让文学家的描写都相形见绌:“人间世事变幻无常,却仍不似人类的情感那样变化多端。”[92]

很多变量很难准确地操作化。以大家喜闻乐见的爱情为例,你怎样测量爱情?如何判断情感的强度?即使操作化了,怎样收集相应数据?即使收集到了数据,你怎么保证调查对象如实回答?正是因为这些不确定性使得社会科学始终是软科学,尽管努力在模仿自然科学,但始终无法达到自然科学的精度和确定程度。

即使变量之操作化、数据收集、数据质量等都在可接受的范围内,但是百分之百的确定性仍然不可能。我曾经困惑于为什么更加精确的测量、更加准确的数据,更加稳健的模型,也永远无法消除不确定性。随着阅读范围的扩大,我了解到即使在自然科学甚至数学中确定性也在失去。在《数学简史:确定性的消失》一书中,克莱因指出数学的第三次危机就是由于对以往十分确定的结论、假设的质疑引起的。[93]

统计学部分缓解了研究者因为丧失确定性而引起的焦虑。[94] 有了概率工具,我们从“确定的世界”走向“随机的世界”。数据可以告诉我们事情发生的概率,包括天气,包括社会生活中的各种风险。有了概率,我们可以去部分地接受一件事情或者一个结论。正是对于不确定的承认、对于其他解释的不拒斥、对于边界条件(scope conditions)的承认,使得科学研究能够被证伪(falsifiable)。科学知识得以不断地实现有效积累。

作为一个资深文科生,我深知变量思维对文科生来说多么重要;作为一个做了十几年量化研究的社会科学码农,我也深知变量思维的局限。总之,通过变量思维去习得科学思维,但不能让变量思维使你变得刚愎傲慢。[95] 你心里要揣着明白,认识到这种思维的适用边界。承认自己的缺陷,是科学思维的一个可贵特质。


上一章目录下一章
推荐书籍:全球创新投资:经济大变局中的财富新机遇 农业和食品论争 核能 气候变化 注意缺陷多动障碍 流行病 他从屈辱中站起来:乞丐囝仔 算计 搜商—人类的第三种能力 四句话改变你的人生:一念之转