实证经济学方法论--弗里德曼.pdf-淘文阁

资源描述

《实证经济学方法论--弗里德曼.pdf》由会员分享，可在线阅读，更多相关《实证经济学方法论--弗里德曼.pdf（16页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、实证经济学方法论实证经济学方法论米尔顿弗里德曼约翰内维尔凯恩斯（John Neville Keynes）在其名著政治经济学的范围与方法一书中，区分了实证科学、规范科学以及方法、技巧问题。他认为： “实证科学是讨论是什么这类问题的一套系统的知识体系；而规范科学或也是规制科学则是讨论应该是什么这类问题之取舍标准的知识体系而（经济学）方法、技巧则是未达到既定目标的一系列原则。 ”凯恩斯评论道： “有关以上三者的混淆相当普遍，并且成为众多有意无意错误的根本原因。 ”与此同时，他还认为“确立政治经济学作为一门独特的实证科学的认识” 意义重大。本文将主要讨论在创建凯恩斯意义上的“独特的实证

2、科学”过程中，出现的某些方法论问题。具体来说，就是研究如何判定一个假说或者理论，是否应该被暂时地纳入“ 是什么这类问题的系统知识体系” 的一部分。但是凯恩斯所不愿意看到的这类混淆却又如此之普遍，它极大的妨碍了人们确立经济学能够成为并且一定程度上确实是一门实证科学的认识。所以，在文章的主要部分展开之前，大体讨论一下实证科学与规范科学的关系似乎比较合适。 1.实证经济学与规范经济学的关系实证经济学与规范经济学的关系某种程度上，实证经济学与规范经济学的混淆不可避免。就几乎每个经济学研究者而言，其所关注的问题与他们自身都极为攸关，并且也是自己经验之内和能力所及的。而这一点却成

3、为无休止的争论和广泛分歧的根源，也成了频繁立法的契机。那些自诩为“专家”的意见分歧相当大，很难保证他们都是不偏不倚、毫无偏见。无论如何，在那些事关重大的问题上，即使所有“专家”意见相近而且也无明显利害关系，我们也很难完全不加考虑的接受他们的观点。实证经济学的结论似乎是，而且确实与重要的规范问题密切相关，也涉及应该做什么以及如何实现既定目标等问题。专家与外行一样，都不可避免的有如下倾向：即调整相应的实证结论以支持自己先入为主的成见，同时又拒绝那些有悖于其自身的规范性判断或立场的结论。大体而言。实证经济学独立于任何特定的伦理立场和规范判断。正如凯恩斯所说，它关心的问题是“

4、是什么” ，而不是“应该是什么” 。其任务在于提供一套能够正确预测环境的细微变化如何影响结果的一般化体系。通过与实际状况的比较，从预测的精确程度、范围是否相当、结论是否一致三个方面，将可以评判此体系的预测能力。简而言之，实证经济学是，或者说可以是一门“客观的”科学。就“客观性”而言，其同任何一门自然并无二致。当然，经济学涉及的是人与人之间的关系，而且调查研究者本身就是被调查研究事物的一部分。于是，与自然科学相比，社会调查更加具有私我性，相应客观性可能就大打折扣。然而，这却也正使得社会科学家可以得到一系列自然科学家无法得到的数据。但以我之见，以上两点都还不是这两类科学之间的

5、根本差异所在。另一方面，规范经济学及经济学的方法、技巧亦不能独立于实证经济学。任何政策结论都不可避免地要基于采取某种、而非其他行动所产生差别影响的预测，而预测则必定会或多或少地植根于实证经济学。当然，政策结论与实证经济结论之间并不存在一一对应关系，否则就不必有单独分立的规范经济学。两个个体对某项立法可能的结果或许并无异议。但其中一个可能认为立法结果有利于平衡，进而维护这项立法；而另外一个却认为这结果是不合意的，进而反对这项立法。因此，我斗胆提出如下判断，即：目前西方世界，尤其是美国，毫无偏见的公民之间存在的有关经济政策的分歧，只要源于人们对行为的经济后果的预测有差异

6、；理论上，通过实证经济学的进步，以上分歧是可以予以消除的；相反，分歧不是有人们基本价值观立场的差异引起的，价值观差异最终也只能通过斗争予以解决。一个显而易见却又相当重要的例子就是最低工资法的问题。尽管存在各种各样支持或反对该立法的论点，而且讨论中广泛使用的 “生存工资” 概念又如此模糊不清，但所有政论方背后却都对应一个 “生存工资” 并无异议。分歧主要源于：各方在预测立法最终能够实现普遍认同的生存工资之一目标的效果上，存在着或隐或现的差异。法定最低工资的支持者们认为（即预测），该法案最终能够减少在最低工资线以下和一些收入略高于最低工资线的贫困人口，同时却又未相应的

7、增加完全失业人口数量，并且也没有损害低收入阶层在找工作上的竞争力。而该立法的反对者却认为（即预测），由于法定最低工资给就业人口带来的收入提高，无法弥补失业人口增加及就业条件恶化，进而最终该法案加剧了贫困。及时就该法案立法的经济影响上的人是不存在分歧，还是无法企求就法案的合宜性问题上各方看法一致，因为仍然还必须考虑该立法政治或社会影响等问题。因而，即使目标一致，实现最终的一致同意需要走的路仍旧相当长。工会的适当作用及其地位问题上的各种不同意见，对直接的价格、工资管制的合宜性及关税等问题上的认识存在广泛分歧，都与相应实证分析中分歧密切相关。就政府对产业规制的

8、合宜性和必要性人们意见纷争，甚至这也引发是否应当以社会主义取代私人企业的争论等问题，这些很大程度上却都是由于对所谓的“规模经济”重要性的预测上有差异。而且此类事例不胜枚举。当然，我的主张，即西方社会中人们在经济政策问题上的主要分歧大体上都是如上类型，其本身就是一种“实证”阐述，它是否能够被接受还有待于经验证据的检验。如果以上主张站得住脚，那么有关“正确的”经济政策的一致意见将不是取决于规范经济学的发展，而更多的有赖于实证经济学的发展，其所得出的结论也应当被广泛接受。这也意味着之所以必须建立明显有别于规范经济学的实证经济学，正是在于其将有利于促进政策问题上的一致意见。 2.实证

9、经济学实证经济学实证科学的终极目标就是要提出一种“理论”或“假说” ，能够对尚未观察到的现象作出合理、有意义的（而非老生常谈式的）预测。总体说来，这种理论应该是有两类基本要素构成的复杂混合体，其中部分是一套有助于发展“系统的、有组织的推理方法”的语言，而剩下部分则是一系列具体假说，后者旨在从纷繁复杂的现实中抽象出事物关键特征。作为一种语言，理论不具有任何实质性内容，而仅是一系列套套逻辑（同义反复的词语的综合体）。其功能在于为组织和理解经验材料提供分类整理依据，而用以检验这一角色的优劣也应该是依据相应的分类体系标准。诸如，类别的定义是否清楚、准确？依以上分类的划分是否穷尽了所有

10、可能性？是否能够将每一单个项目都归于具体一类吗？或者，这其中是否存在这相当程度的模棱两可现象呢？这套体系大标题及次标题的设计是否有助于迅速找到所需要的条目，而不至于到处搜寻需要的内容呢？我们所要研究的条目是否都已编排到一起了呢？编排分类系统是否已经排除了错综复杂的交叉引用问题呢？以上问题的回答部分地出于逻辑上的考虑，却又和事实脱不了干系。单一的正式逻辑规则就是可以揭示特定语言本身是否完备和前后一致，也就是说，可以判断该语言中的命题 “正确”与否。事实证据本身则可以说明“分类编排系统”的各个分类是否具有有意义的经验对应物，亦即在分析某类具体问题时是否有所助益。 “供给”

11、与“需求”这一简单的例子能够说明以上提到的事实性和一系列逻辑问题。作为经济理论语言的构成要素，供给与需求归纳了影响产品和生产要素相对价格的诸因素。这种二分法的有效性取决于如下经验性归纳事实：即“分析任何一问题时，分别可以列举一系列的影响供给和需求的共性因素” 。这种概括对于类似的最终消费品市场都是合理有效的。在这类市场中，经济个体可以被清楚地分为产品供给方和需求方两类。通常很少出现某因素一方面影响供给，另一方面却有影响需求的现象。并且也无需考虑两类别之间的交叉互指效应。这样，将相关影响因素分别归入既简单又明了的“供给” 、 “需求”两个类别下，将极大的简化所处理的问题

12、，同时又避免可能出现的差错。但是，此类概括并非总是合理的。例如，就投机性市场中的每日价格波动而言，以上概括就不是合理的。例如，有关提高超额利润税的谣传，应该被归入主要作用于当天公司股票供给方，还是应当被看作主要是针对股票需求方的影响呢？类似情况下，几乎对每一因素而言，却似乎都有将其纳入“供给”类抑或“需求”类的适当理由。这两个概念仍旧可以使用并且亦非一文不名，也还算“正确” ，然则与第一个例子相比其实用性却明显小得多，这是因为它们缺乏有意义的经验对应物。作为一个独立的假说体系，理论应该通过对其意在加以“解释”的哪一类现象的预测能力来判断。唯有实际证据才能证明理论是“正确的”

13、还是“错误的” ，或者更为确切的说，是否应当暂时的“接受”或者“拒绝”该理论。以下我将用大段篇章论证对一假说合理性的检验，将直接有赖于其预测与实际经验的对比。如果假说的预测（相比于其他假说更加“频繁地” 或更经常地）与实践相抵触，那么就可以拒绝接受该假说。若假说的预测与时间一致，那么则可以接受之。又若假说业已多次成功的避免了可能出现的矛盾、不一致现象，那么其就应具有较大的可信度。事实证据永远不可能 “证实” 一个假说，而仅仅只能无法证伪假说，或者某种意义上也并非十分准确，当我们说到某种假说在实践中已经得到了“确认”时，我们通常所指的就是这个意思。为了避免误会，可能有必

14、要明确一下，用以检验假说合理性的“预测” ，并不非得是针对尚未发生的现象，也就是说，不一定非得要是针对将来事件的预见；也可以是对于业已发生了的，但却又未被观察到的或者是预测者并未知晓的现象所作的预测。例如，给定其他一些已知的情况，某假说预测在 1906 年将出现某某情况。如果查询这一时期的史料记载， 1906 年该情况确实发生了，那么该预测就得到了实践的确认。反之，如若情况并没有发生，那么该预测就与实际情况不相符了。在这个意义上，假说的有效性本身并不足以作为对被择假说取舍的标准。观察到的事实数量上总是十分有限的，但可能的假说却是无限的。如果说某一假说恰好与已有数据相一致

15、，那么一定还有无数个假说满足此条件。举例来说，假设对某一特定的商品征收定额税后，导致价格上涨并且涨幅相当于税收的大小。完全竞争情况下稳定的需求曲线、稳定的水平供给曲线与如上观察相符。但是，在完全竞争条件下，斜率为正或者负的供给曲线配合需求曲线或供给曲线作必要的补偿移动也可以实现该结果；垄断情况下，固定不变的边际成本以及特定形状稳定的需求曲线也足以产生相同结果；类似情况还有很多，不胜枚举。进一步增加事实证据确实能够剔除一些假说，但凭借有限的证据绝无可能得到唯一符合条件的假说。虽然，也有普遍认同的相关标准，试图使结果尽量“简单易处理”同时又“富有成效” ，但面对众多与已

16、有证据均相一致的假说，选择一定程度上就相当的武断，而这却是又否定了“自我标榜”的彻底客观原则。理论越是“简单明了” ，就既定领域现象的预测所需要的初始知识也就越少；理论越是“富有成效” ，对现象的预测也就越是精确，而且理论预测所依据的范围也就越大，同时，为了进一步研究的需要，所要加以说明的东西也就越多。逻辑上的完备性与一致性虽然也与评判标准相关，但却仅仅起到一个辅助作用；二者的作用在于确保该假说能够正确的阐明其意欲言说的逻辑，使得其对每一个研究者而言均是同一含义；这里，其扮演的角色又类似于统计计算中检验说子精确与否。不幸的是，社会科学研究中很少能够设计如下实验，即将确知的

17、有重要扰动的因素排除在外，进而检验具体预测有效与否。通常，我们不得不依赖于偶然发生的 “实验”数据收集。基于以下两个考虑，依我看来，无法进行所谓的“控制实验”并非社会科学区别于自然科学的根本特点：其一，它并非是社会科学独一无二的特点（想想天文学就可以了）；其二，受控制的实验与不受控制实验的差异充其量不过是一个程度上的差异。不存在完全受控制的实验，每个实验我们都只能部分的控制，这也只是意味着在该实验过程中某些干扰因素表现出相对的稳定性。实践经验提供了相当丰富的数据资料，并且经常可以得到相当确知的结果，这与精心设计的实验并无二致。因此，无法进行实验不能成为通过

18、预测的成功与否检验假说有效性的根本障碍。但是，此类经验性证据比较难以解读，通常错综复杂又总是不直观且支离破碎。手机这种证据常常也颇费功夫，而且还需要对其进行细致入微的分析、解读，同时还设计一系列的推理判断，然则却很少能有令人满意的结果。无法通过一些“关键”实验以获取大量的直接证据，的确妨碍假说的充分检验。但与从已有证据到达成广泛一致的意见所需要经历的困难相比，缺乏直接证据似乎就显得微不足道了，并且前者也尤为迫切这也使得剔除不成功的假说进展缓慢且困难重重。不成功的假说很少永远告别经济学的舞台，相反，它们却总是不时的一再出现。当然，此类问题也并非总就只有一个模子。有时，

19、经验证据能与受控制实验数据相媲美，也有大量、直观和确定性的观察结果。也许，最明显的重要例证要数有关通货膨胀假说的经验证据，该假说认为，在一个较短的时期内，货币数量的显著增长必然伴随着价格的大幅上升。这方面的证据是相当丰富的，所需的解读、分析也相对较简单。然而，尽管可观察到大量的价格显著上涨的现象，这些现象与货币存量的剧增也有着一一对应关系，以及有关其他相关因素可能引致此类现象的分歧相当大。但是，每一轮新的通货膨胀却又势必引发激烈的争论，而且这种争论不仅仅限于普通大众之间。人们要么认为货币存量的增加仅仅只是众多引致价格水平上涨的因素之一，其重要性乏善可陈；要么认为

20、货币存量增加伴随价格上涨只是个纯粹偶尔现象。难以对大量的经济假说进行检验，使得我们讨论就退回到纯粹的套套逻辑式分析。正如我们也已阐述的那样，套套逻辑作为一种特定的“寓言”和“分析编排体系” ，在经济学及其他学科中具有极为重要的地位。此外，同样是套套逻辑的正统逻辑学与数学，又为检查推理正确与否、发现假说的引申含义和判断两个貌似不同的假说确实并非等价，并进一步分析两者之间存在的差异等，提供了重要的帮助。但是，如果经济理论希望能够做出预测，而不仅仅只是对行动的结果的描述，并且又不至于退回到数学的变种，那么仅仅只有一个套套逻辑（同意反复）体系确实是远远不够的。正如前文提到的，

21、套套逻辑（同义反复）本身的有用性，最终还将有赖于使用一系列假说分类、整理复杂实在时的可接受性。通过预测检验经济家说的困难，还使得人们就经验证据在理论工作中的作用有所误解。在以下两个独立但又紧密联系的阶段中，经验证据都起到了至关重要的作用：一是构造假说阶段，二是检验假说的合理性阶段。作为假说基础以及反过来又是假说归纳解释的对象，完整且详尽的经验资料，不仅在提出新假说时候有显著的地位，其还保证该假说的确解释了其意欲解释的现象，也就是说，现象中凸显的意旨与先前已观察到的经验证据并不矛盾。如果假说与已有资料大致相符，那么对该假说作进一步检验，将应该是推导出一些事先未知但却可

22、能观察到的事实，进而用后续的经验证据验证这些推理事实。为了保证后续检验同前面检验相关，推理事实必须一方面是假说意欲解释的一类现象，另一方面其有得定义的相当准确，使得实际观察有可能将其否证。构造假说与检验其合理性这两个阶段之间的相互联系，可以从以下两个方面表现出来。第一，某种程度上，每一阶段进入观察的既定事例，与数据收集过程以及特定调查者的知识存量特征密切相关。用以检验假说意义的事例可能同时又是构造该假说的原始资料，反之亦然。第二，创立假说的过程从来都不是从零开始的。所谓的最初阶段本身也总是要涉及比较一系列早些时候观察提出的假说。假说含义之间的矛盾激发了新假说的产生或

23、者对旧假说作进一步的修改。所以，这两个在方法上截然不同的阶段，在实际过程中又总是相辅相成、并行不悖。对这一显而易见过程的误解，主要集中于如下表述，即“假说是作为解释这一类现象而提出的” 。由于增加同一类现象的新证据以及证明其与假说内涵相一致都相当困难，社会科学将倾向于作如下认定（猜想）：即其他更为可得的相关证据对证明假说合理有效也是同样重要的；假说不仅有“内在的含义” ，它同时也含有“假设”成分；从假设是否与现实相符判断假说的有效性，与对假说内涵的检验是不同的；前者（检验假说）是对后者（检验内容）的补充。从根本上说，这一被广泛持有的观点是错误的，也是更多的后续谬误产生的根

24、源。它不仅没能合理的将有效性价说和非有效性假说筛选分开，相反却使得局面更加混乱不堪，使得人们对经验证据在经济理论中的重要性有所误解，并将为促进实证经济学发展所作的睿智探索引入歧途，最终有碍于实证经济学中就常识性假说达成一致意见。即使如果可以说理论的实质就是一系列的假设，即使“假设”的“真实性”与否可以独立于预测的有效性，理论的重要性与假设真实性之间的关系，也完全不同与前文所批评的那种观点，甚至几乎与其相反。一般可以发现，真正举足轻重的假说的“假设” ，都是对现实的一种粗略的、不十分精确的描述。而且，一般来说，理论越是重要，其“假设” （在这个意义上）就越是不真实。个中原因

25、非常简单。如果假说能够以相当简洁的形式解释丰富的内容，也就是说，如果假说能够从意欲解释的枝节交错的现象实在中抽象出一系列关键共性，同时却又能保证强大的预测能力，那么该假说就是相当出色。因此，从意义重大的角度，假说的假设就不能忠实的描述；假说在解释既有现象上的成功，表明具体现实环境因素的影响有限，那么假说的假设自然也就不必对现实环境亦步亦趋。为了使以上观点显得不那么“荒谬” ，有关理论“假设”我们需要问的问题，不是假设是否是对现实的忠实描述，因为它们从来就不是，而是假设对于我们已有的目标来说，它是否是一个良好的近似。而这一问题唯有通过考察理论是否有效才能解答，亦即理论的预测

26、结果是否足够精确。于是，原以为肚里的两种检验就只剩下一种了。不完全竞争或曰垄断竞争理论，就是经济理论中忽视上述主张的一个例证。人们认为，新古典经济理论中的“完全竞争”和“完全垄断” ，虚假的反映了现实生活情况。于是，很显然这种不满激发了以上分析范式的发展，并且使得其被广泛赞许和接受。而这一认识本身，却几乎完全仅仅基于假设本身并非观察到现实的正确描述，而不是依据新古典经济理论的预测与现实不相符得出的。许多年以前，美国经济评论有关边际分析问题所进行的长篇累牍的讨论，是另一个虽远不如前一个例子重要，但是却又更为清楚的例子。争论双方的文章，在很大程度上都忽略了，在我看来

27、似乎却是尤为关键的问题即应用边际分析得出的结论与经验事实是否相一致的问题。相反，争论者却把精力投注于考察商人决策当中，研究他们的决策是否却是通过代表边际成本与边际收益的表格、曲线和多变量函数进行这样一个几乎毫不相关的问题。也许这两个例子及其他业已揭示的许多事例，都说明了这方法论的基本原则进行深入讨论确实很有必要，它将有助于我们判断一些似是而非的现象。 3.可以通过假设的真实性来检验假说吗？可以通过假设的真实性来检验假说吗？可以先从一个简单的物理学例子自由落体规律开始我们的讨论。一个普遍认同的假说是：在真空中，一落体的加速度是一个常数g，在地球上大约是 32 英尺秒，其与落

28、体形状、投掷方法等因素均无关。这意味着落体在任何给定时间内下落的距离，可由公式 S=gt给出。这里，S 是以英尺表示的物体下落的距离；t 是物体下落的时间，单位是秒。将此公式应用于描述一个从楼顶下落的实心球，就等于说如此下落的物体，其具体运动情况就好像是在真空中下落一样。通过假设检验该假说，可能就意味得测量实际气压，并判断其是否足够接近于零。海平面的气压大概是每平方英寸 15 磅。15 磅是否足够接近于零，进而对结果的影响是否可以忽略不计呢？显然可以。因为实心球从楼顶落到地面的时间与公式给出的时间非常接近。然而，设想如果下落的是一根羽毛而不是一个实心球，那么公式得出的结果就有很

29、大的偏差。显然，对于一根羽毛而言，每平方英寸 15 磅的气压与零气压是有显著差异的。然则对实心球而言，每平方英寸 15 磅的气压与零气压是不会造成多大差别。或者，再设想将上述公式应用于从 3 万英尺高处的飞机上下落的实心球。在此海拔高度，气压毫无疑问是小于每平方英寸 15 磅。但是，从 3 万英尺下落到 2 万英尺，该点气压仍然大大低于海平面水平，实际消耗时间将与公式预测的时间有显著差异。其差异还明显大于实心球从楼顶落到地面的实验中，实际时间消耗与公式预测时间之间的差别。根据公式，下落球的速率应为 gt，并且还将稳步加速。事实上，一个从 3 万英尺下落的球再碰到地面以前早就

30、达到速度最高点了。上述公式的其他应用也大体如此。一开始提出的那个问题，即 15 这个数值时候可以被视为足够接近零进而忽略不计，就显得愚不可及。每平方英寸 15 磅等于每平方英尺 2160 磅，也等价于每平方英寸 0.0075 吨。如果没有一些外在的衡量标准，就不能说具体数字是“大”还是“小” ，而唯一相关的衡量标准就是在一系列既定的情况下，该公式在不通气压水平下是否好用。但是，这又带来应以层次上同样的问题。 “好用或不好用”的具体含义又是什么呢？即使可以消除测量误差，但物体下落的实测时间与公式计算时间，很少（如果曾经有过的话）正好完全相等。两者之间的差距达到多大时，可以判定理论

31、是“不好用的”呢？以下是两种重要的衡量标准：其一，比较被择理论可达到的精确水平，并且比较结果从各个方面看都是可以接受的；其二是存在于当已知一种理论可以实现更好预测水平，然则必须以相应的成本增加为代价的情形。根据内在目的确定具体更高的精确度水平，须与付出的相应成本代价提高之间进行权衡。以上例子说明一方面通过理论假设检验理论本身是不可行的，另一方面“理论假设”这一概念又相当模糊。公式 S=gt，对真空中的落体来说是正确的，也可以通过观察、分析真空落体的实际运动情况推导得出。因此，可以这样说：在很多情况下，实际空气中落体的运动情况，似乎“仿佛”它们就在真空中下落一样。用通常的经

32、济学语言，以上表述马上就可以变为：上述公式假定真空情况。然而，显然公式中没有诸如此类假定。上述公式实际说的是：许多情况下，大气压力、物体形状，投掷者姓甚名谁，投掷方法以及一系列相关条件，对落体在既定时间内下落的距离并无显著影响。不提及真空因素，同样也完全可以将以上假说重新表述为：在很多情况下，物体在给定的时间内下降的距离可由公式 S=gt给出。撇开公式的历史以及相关的物理理论，那么说该公式假定真空还有意义吗？就我所知，还有其他假设体系，也同样能够得出如上公式。此公式之所以被接受是因为它好用，而不是因为我们生活在一个近似真空的环境里不管接近真空是什么意思。与假说相关的

33、一个重要问题，是确定公式适用的范围，或者更准确地，是明确在各种情况下假说预测的大体误差范围。的确，正如上述假说重新表述中所隐含提到的，假说适用范围的确定与假说本身并非毫不相干。范围界定本身是假说的一个重要组成部分，而且也是假说中尤其可能随着经验事实的积累，而被不断修改和扩展的部分。就由自由落体这一特定问题，已经存在另一虽然仍不完善但更为一般化的理论。其出现很大程度上是为了解释上述简单理论预测的误差，由此可以进一步计算其他一些可能的影响因素，而原有简单理论则成为其一特例。然而，该更为一般化的理论在使用当中并非总是合适的。这是因为，其所提升的精确度很可能无法弥补使用引致的附

34、加成本。所以，在任何情况下的一种简单理论就已经“足够好用” ，仍旧是一个重要问题。气压是也仅仅只是众多界定理论适用范围的变量之一，其他相关变量还有诸如落体的形状、速度等。阐释气压以外变量的方法之一可以是，确实有无纳入特定变量对真空“假设”的背离严重与否。举例来说，考虑羽毛形状上的差异，每平方英寸 15 磅的气压和零气压可以说有很大差异，但对实心球下落一个中等距离而言形状的差异并没有造成两种气压下有显著不同结果。然而，这种说法决然区别于如下观点，即认为之所以该理论不好用是因为其假设是不真实的。相反，这两者之间的关系应该是另一种情况，即由于理论不好用，所以其假设对羽毛而言就是

35、不对的。之所以要反复强调这一点是因为，完全正确地使用“假设”界定理论适用的范围，通常被错误的理解为假设可以判定理论在任何情况下是成立的，进而也成为主张通过假设检验理论本身这一错误论断的重要源头。接下来考虑另外一个例子，这个臆造出来的与社会科学中的假说有很多相似特征。考察一棵树上的叶子的厚度，我提出如下假说：给定周围叶子的位置，叶子们好像是有意的通过最大化其所能获取的阳光量，确定各自具体位置；每片叶子好像都知晓决定不同位置获取具体阳光量的物理规律，并且能够迅速转移到任何未占据的合意位置。该假说更为确切的一些含义明显与实际情况相符：例如，树南侧的叶子一般密于树北侧，但

36、本假说也指出，山的北坡，或树的南侧被其他东西遮盖，那么以上差异就不明显或甚至完全不存在。就我们所知，叶子不能“故意的” ，或者有意地搜寻（位置），也没进过学校学习计算“最佳”位置所需的相关科学或数学原理，更是无法从一个位置转到另一个位置，那么难道就可以就此断言该假说是不可接受的？很明显，以上假说不相符的所有列举无多大重要性可言。所涉及的现象也不在“假说意欲解释的”范围之内。假说并没有断言叶子就如此行事，毋宁说只是根据叶子厚度分布说叶子“仿佛”就是这般行为。尽管假说的“假设”明显不真实，但由于假说含义与实际观察一致，那么其就较为合理。我们倾向于在下述意义上“解释”该假说的

37、合理性：阳光促进叶子生长，所以阳光较多的地方叶子将生长的更加茂密，或者因此也可以说阳光充足的地方叶子将长得更加茂密也公认地更容易存活。最终，纯粹被动的响应外界环境的调整与根据环境有意识的适应，两者都得到相同的结果。后一种假说之所以比以上臆造的假说更有吸引力，并不是因为后者的“假设”更加“现实” ，而毋宁说是因为后者是更为一般化的理论应用在其他现象中也可以得到间接证明。所臆造的假说大体正确，也就是说，在预测叶子密度上“足够”准确，仅适用于某类特定现象。我不知道具体的适用范围，也不知道如何去定义它。然而，有一点似乎是明确的，那就是：上例中理论的假设在界定范围时并无多大作

38、用。树的种类，土地的性质等可能是界定理论适用范围的变量，但树叶做复杂的数学运算祸从一个地方移动到另一个地方的能力却与此无多大关系。我和萨维齐在别处用过一个类似的，但涉及人类行为的例子，即预测专业台球手击球情况的问题。通过如下假说，即认为该台球手击球活动“仿佛”他知晓最佳运动方向的复杂数学计算公式；可以通过眼睛准确估算击球角度、台球位置等；并且能够迅速的代入公式计算，并能够让球就按照计算结果运动，将可以得出有关击球的出色预测，这也似乎并非毫无道理。我们之所以相信上述假说，并不是因为我们认为台球手，即使是台球行家，能够也确实身体力行如上描述的过程；毋宁说是因为我们是意识到，

39、除非台球手可以这样或那样的取得上述相同结果，否则他们实际上就不能算是台球“行家” 。这些例子离以下假说仅仅只有一步之遥。该假说认为，许多情况下单一厂商“仿佛”是理性地追求预期收益最大化（一般也使用颇具误导性的“利润”一词），并且拥有实现该目的所需的完备数据知识；也就是说，他们仿佛知晓相关的成本函数与需求函数，能够计算所有行为的边际成本与边际收益，并且在所有行为决策上都恰好作到边际成本等于边际收益。当然，商人当中并非逐一求解经济数学家用以方便表述以上假说而是用的联立方程体系。如果相反，将无疑于让台球手在击球时做复杂的计算问题，或者让落体运动严格依赖于真空条件。如果问台

40、球手他是如何确定击球点，那么他可能回答说他自己“恰恰就发现”那个合适击球点，最后多半也只能认为是“幸运神”的眷顾了。商人可能会说自己是根据平均成本来定价，当然市场条件变化时，可能还会做一些必要地微小偏差调整。这两个说法都有一定见地，但是两者与相关假说的检验都毫无干系。受益最大化假说可信度赖以验证的那些经验证据特征，与以上的列举有相当的差异。某种程度上说，该证据与台球手假说检验所援引的证据类型很相似也就是说，除非上人行为或者或那与收益最大化行为大体相似，否则其似乎不大可能在该行业中持久存在。不论商人行为直白、直接的决定因素是什么，习惯性反应也好，随机性机遇也好，或什么都

41、不是也好，只要某关键因素恰使其碰巧与理性完全信息追求受益最大化厂商行为相一致，则厂商将趋于赔本，最终只有从外部注入新资源才能维持存活。这样一来， “自然选择”过程促进了假说的合理化，或者毋宁说给定自然选择，假说合宜性很大程度上有赖于其恰当的概括了生存条件的要求。有关收益最大化假说的另一类更为重要的证据，源自假说在无数次具体问题中的应用，其含义从未出现与现实结论相悖的情况。此类证据罕有正式书面文字版本，其主要散落于在无数的商业备忘录、论文及专著中；而这些备忘录、论文和专著讨论的主要都是一些具有问题，相反很少旨在检验某一假说。然而，假说在相当长时段内一直被接受、使用，同

42、时未能提出更广泛接受、连贯、自洽的替代假说，这一事实也间接有力的证明了该假说的内在价值。假说的证据应当总是包括其能够反复经受住矛盾的检验，而且只要该假说仍在继续使用，那么这类证据就会继续增加。但是，从根本上说，此类证据却又难以全面完整的使用文字记载下来。这也倾向于成为科学传统和习惯的一部分，即其韧性根植于未能被驳倒的一系列具体主题假说体系，而非教科书上事例的简单罗列。 4.理论“假设”的重要性与作用理论“假设”的重要性与作用至此，我们有关理论“假设”的重要性的所有结论几乎全都是否定的：我们已经看到无法通过“假设”的真实性来检验理论，而且理论“假设”概念本身也含糊不清

43、。但是，如果以上就是问题的全部，那么我们将很难解释为何理论假设概念使用却如此之广，同样也很难解释如下强烈倾向，即每个人都需要演说自己的假设，并且还时不时地对不同理论的假设进行对比，怎么可能无风起浪呢？实证科学方法论当中，一般而言否定性论断通常要比肯定行论断可行度更高。因此，相比与前文的论述，下文有关“假设”重要性及其作用的评述我的把握性就没那么大了。据我所知，理论的“假设”具有以下三种相关但不相同的积极作用：（1）它们通常能够简洁、经济地表述和呈现理论；（2）它们有时还可以便利的假说的含义做简洁的检验；而且（3）正如前文提到的，它们有时能够方便的界定理论的预期适用

44、范围。前俩者还需作进一步的详尽讨论。 4.1 用“假设”阐述理论用“假设”阐述理论树叶的例子可以说明假设的第一个作用。不说树叶是追求吸收阳光的做大化，不使用任何明显的假设，而只借用一系列用以预测树叶厚度分布的原则，我们同样可以表达完全相同的假说：如果一棵树生长在一块平地上，且没有别的树木或物体阻挡阳光照射，那么，树叶的密度将倾向于这样那样；如果一棵树是生长在山的北坡，处于同种树群之中，那么显然，相比于树叶追求所得阳光最大化的表述相比，此种假说的表述大大不经济。由于已给出就特定问题而言，哪些环境因素至关重要并且如何估计其影响，所以第二种假说表述已经简洁但又不乏有效的

45、概括了以上提到的一系列原则，即使可能的原则有无限多，因而也更加精炼同时又不失全面性。更一般地，假说或理论通常都包括如下断言，即就某类特定的现象而言，某些因素而非其他因素是重要的，并且也还给出关键要素的具体作用方式。我们可以把假说看作是由以下两部分组成：第一部分是概念体系世界，或者是远比“真实世界”简单的抽象模型，其中只涵盖假说认为重要的各因素；第二部分是界定假说适用某类现象的一系列原则，并且具体规定抽象模型中的变量与可观察的现象个体之间的对应关系；就假说适用的某类现象而言，抽象模型足以代表“真实世界” 。和两个部分的性质截然不同。模型是抽象、完备的，是“代数”或

46、“逻辑” 。模型一致性、完备性及其含义的检验，则必须回到数学与正规的逻辑学中进行。诸如“含糊不清” 、 “大概可能”和“大体相似”在模型中无处容身，同时也毫无作用。真空气压就是零，而不是“较小” 。完全竞争厂商产品的需求曲线就是水平（斜率为零），而不是“几乎水平” 。另一方面，界定模型使用的一些原则就不可能抽象又完备。它们必须是具体实在，进而也就是必然不完备。完备只存在于概念世界中，待解释的真实世界里没有完备一说。 “太阳底下无新鲜事物” ，模型充其量只是逻辑上具体讲述了一般的真理；界定模型适用范围的原则时同样也不能忽略真理的另一半，即“历史永远不会重演” 。当理论明显是更为一般

47、理论的一部分时，正如落体真空理论的例子一样，很大程度上我们可以异常清楚或也是再简单不过地给出模型使用的原则，尽管此时的原则阐述很不完备。在追求科学尽可能“客观”的过程中，我们的目标应当是竭尽所能的扩展理论适用的范围，并尽量做到原则体系清晰连续。但是，不论在此方向上我们有多么成功，有关理论适用与否的判断总是不可避免的存在。每每出现的问题都有其独特之处，而这又是文明规定所不能一一囊括的。判断新现象的影响能否忽略，以及观察到的现象是否可以和模型中的个体相对应的能力，不能指望别人能教你，它只能通过自己的实践经验并置身于“适当的”科学氛围中掌握体会，无法机械照搬。这一点区分了所有

48、科学中的“业余”与“专业” ，也称为怪诞、狂想分子与科学家之间的分水岭。一个简单的例子可能有助于弄清这一点。欧几里得几何学是一个抽象模型，一个逻辑完备、前后一致的逻辑体系，其中的各个元素都有严格定义。如定义直线时，就不说其是长度比其宽度或高度 “大得多的” 几何图形，而是说直线是宽度与高度为零的图形。这显然是 “不现实的” 。 “实际生活”中不存在诸如欧几里得点、线或面一样的东西。将此抽象模型应用与黑板上的粉笔记号，此记号可以被视为欧几里得线、欧几里得面抑或是欧几里得体呢？显然，假使该记号用以表示一条需求曲线、那么将其视为一直线将是合适的。但是，如若该记号正被用与地图上的

49、国家着色，那么就不能认为其还是一直线了，否则将意味着地图上的国家是无法适当着色的，在这种情况下必须将此粉笔记号视为欧几里得面。然而，对粉笔的生产者而言，则情况亦不复如此，否则将意味着粉笔永远也用不完。出于此种考虑，原粉笔记号此时必须对应欧几里得体。在这一简单例子中，如上判断估计大家不会有异议。然而，似乎很明显，虽然只需大致粗略思量就足以得出以上判断，但却永远也不会真正做到包罗万象，囊括所有可能情况。它们并不具有欧几里得几何学本身所具有的自圆其说、自成体系的特点。我认为，在谈到理论的“关键假设”时，我们是试图给出抽象模型的关键因素。通常完整表述一模型的有许多不同方法。也就是，作为一个整体模型中可能存在各种各样暗含的或被暗含的不同“假设”体系，这些（假设体系）在逻辑上是等价的：从某一角度看是模型公理或假设的内容，从另一角度看可以视为模型的定理；反之亦然。具体哪些“假设”是“关键”假设的重要依据在于其在模型描述中的简洁、经济，直观合理，或者能够得出一些相关引理、推断用于模型的判断和应用。 4.2 用“假设”间接检验理论用“假设”间接检验理论在表述任何假说时，通常假说的假设部分内容与假说的具体含义内容，似乎再明显不过了。然而，两者之间的界线却不容易定泾渭分明。我认为，这并非就是假说本身的特点，毋宁说它是由假说承

展开阅读全文