理解与理论
课堂上,老师讲完一段后会问台下的学生,“是否理解了?”学生们回答说理解了。但聪明的教师知道,学生们可能是各尽其解,在他们真正理解的意义上是这样;在他们不是真正理解的意义上,他们所拥有的只是和教师共同的语词,而不是理论。就第二种情况而言,我们可以共享共同的语词及其组合但并不共享一种理解,这样说至少是不够严格的。一个语词或者任意一个表达式不只是一个音素,而是在特定语言内部拥有了某种意义。就第一种情况而言,所谓各尽理解,就是说,教师当前所传达的语词并不构成所有学生自己所拥有的全部语词,学生们将老师传达的语词放入自己的语词系统中,由于这些语词系统不尽相同,新加入的语词(我们假设它们都是全新的)被放入的系统及其位置因而不同。至于这些学生拥有的所谓语词系统,不过是他们能够自己清楚明白说出的相关语句集合,通常情况下并不算作什么系统。尽管如此,对于个别学生来说,老师的教导的确更恰当的进入到他的语词系统之中,这些新进入的语词及其组合与已经拥有的语词及其组合发生了互动,就像一颗石头被投入到平静的水面而激起涟漪一样。这个学生尤其感到自己受到了启示,理解了某个问题,确切地说,理解了该问题所涉及的事物是什么以及它是怎么样的,但很遗憾,他的理解与教师的理解很大程度上可能还是迥然有异的。
有些读者感到莫名其妙。可能会有人对我把注意力集中到语词而感到奇怪。我的确是在谈论理解,理解是关于观念的事情,但只要我们准备澄清自己的观念,最好的办法就是清楚明白的表达出来。所以,探究我们的观念的最恰当的途径是语言。(这是蒯因在《经验主义的五个里程碑》中所提到的经验主义在过去两个世纪的发展中所经历的五个转折中的第一个转折,即把注意力从观念转向语言,“这就是在认识论中采取这样一种策略,即只要有可能就要用谈论语言表达式取代谈论观念”。)
我们说出相同的语词,但并这并不意味着有相同的理解,这看起来是个很平常的事实。这部分原因在于,还有许多我们并未说出的背景语言,它们构成我们各自的信念网络,而且它们在很大程度上是各不相同的。但是,什么是我们的信念网络呢?如果要能在可传达的意义上来将它呈现出来(也就是说不计较一些对于共同传达无关紧要的私人感觉和经验),我们还必须使用语言。这样,别人通过这些语言来了解我们的观念;而在这里,不同主体的语言再次遭遇在一起。当然,真诚和耐心的交流必定会把我们带向越来越相同的理解。在我们的日常中,这样的成就到处都是,是极为平常的。人们对某个问题的理解可能不能达到同一,但由于沟通的需要而尽可能在社会化中变得具有齐一性,而且也没有人会期望彼此一步到位地获得共同理解。
然而,离开日常生活,到了在我们谈论理论的场合,事情就不那么乐观了。(有意思的是,人们似乎倾向于把没有多少争议的领域划入常识,而把有争议的领域划入理论,而不是说常识和理论有其他实质差别。)在我们的理论研究经验中,对于很多人来说,我们不断被新的和被修正了内涵的语词所冲击,也在努力整合这些语词,我们很少时刻感到放松,觉得自己真正理解了。真正理解了什么呢?是理解了事物。那么事物在哪里呢?当我们觉得很难回答这些问题时,就以我们理论是抽象的为由轻易打发掉。因为理论中的许多语词所表达的概念都是抽象的,所以它们不能单独被理解,我们也不能直接到日常生活中寻找意义。我相信,就是在这样的局面下,许多学者仍然大胆前进着。你会发现,他们能够说出极为众多、复杂乃至系统的语句;如果有耐心,我们还可以通过检查发现这些表达式在逻辑上十分协调、一致(就是说,不会发现特定的语词明显或蕴涵有既是又不是什么东西的意思)。但是,当你将日常生活和实践中在你看来相关的问题来问他们时,他们会表现出不以为然,认为你是在错误地提问,或者说你问了一个幼稚的问题,又或者是说你提出了一个远离理论的问题。然后,他们只乐意在他们的那套语句系统中向你表明他们的思想;而且,如果你有足够耐心听,他会通过相当长的铺垫最后回答你那个来自日常生活的疑惑。
我们有两个例子来说明这一局面。首先想一下数学学习。我们是怎么学会数数,学会加法和乘法的呢?就我个人的经验而言,从来没有老师曾跟我们讨论过自然数到底是什么一种东西,简直可以说,莫名奇妙地就拥有了这些数不尽的自然数,好像这是不言而喻的。我们的第一堂数学课上,老师在黑板上写下阿拉伯数字“1”、“2”、“3”……,从此开启了漫长的数学学习旅程。之后我们开始学习加法和乘法。老师先教我们学会“1+1=?”、“1+2=?”这样的计算,我们在隐约感觉到至少在个位数以内的加法计算中,可以把所有的加法还原为“1+1=?”的计算。但是很快,我们很高兴掌握的是像“1+9=10”、“2+8=10”、“3+7=10”等这样的计算,当我们遇到“3+6=?”的计算时,我们就把它看成是“3+7=10”这个计算的某种变形,只是“6”比“7”少个“1”,所以很自然“3+6=9”。大量和重复的练习使我们把上面的计算背诵下来,并作为一系列的规则用到更复杂的运算,当我们计算“2763+985210=?”时,我们也不过是重复了在个位数内加法的一些规则,而这些规则在我们这些是已经被背诵下来的。它们就像一个个的无意义的符号,在我们看到这些独特的符合以某种我们熟悉的方式组合在一起的时候,就习惯性地给写下随后那个同样熟悉的符号。它们的确是没有意义的,随着数学学习之旅的推进,我们一再重复这些最基本的符号互动,犹如条件反射。
至于乘法,情况类似。在老师简单地告诉我们乘法是某种加法的便利计算方式后,就马上让我们背诵乘法口诀表了。这里的情况是显而易见的,在我们后来的无数次乘法计算中,无论题目多么复杂,我们一再重复的只是逐渐丧失意义(或者说它们在我们这里压根就没有获得过任何意义)的乘法规则:“1×1=1”、“1×2=2”、“3×7=21”。此后我们每开启一个新的数学领域或分支,就被教给一些最基本的定理、公式,聪明的学生会发现,所有的习题,无论它们多么复杂,都是这些最简单的定理或公式的变种,他们常常发现在解答最后几步时,情况变得和课本上的例题一样的简单,而那个例子就好像小学数学中学习的乘法口诀那样,被聪明的学生“有逻辑地”运用着。
数学成绩好的学生的确是有一个聪明的脑袋。他们在解答复杂的数学题时,会迅速锁定题目的数学领域,在这个领域内涉及到哪些定理、公式,它们各自是怎样的,以它们之间有何关联。他们心中所想到的是一个个复杂的符号组合,这些符号组合与当前题目的关系,犹如在“如果 p,那么 q”的逻辑蕴涵条件句中,学会把“a1”这个变项归入“p”这个条件中,从而得出相应的结果。
一种数学理论就是一个巨大的语句集合,聪明的数学学习者能够正确地调用这些语句,从而得出相应的结果。它似乎是演绎体系的最佳例证。在这里我们的问题时,对于大多数学生来说,他们在何种意义上是理解了当前摆在他们面前的这套他们已经解答了的数学题的呢?有一点可以肯定的是,他们的结论是有证明支持的,而证明是由许多数学公理、定理和推论所保证的:把 a 归入到某个公理中的某个部分,自然可以继续进行到由这个公理得出的定理以及推论所保证的证明步骤。此外,在整个证明中,就像我们在日常生活中说话时省略了大量的背景语句一样,我们也省略了大量的公理、定理和推论,是这些被省略的数学语句保证了我们的证明的合法有效。所谓数学的精确性就在于,严格说来,它的证明的确可以被递归还原到最基本的数论中去,还原到我们小学课本上的习题上去。(这是一个理想的描述,对于证明的有效性,数学家是有争议的,比如有的数学家就直言不讳地指出所谓的数学证明不过是给小孩子看的把戏,虽然我并十分不清楚其中的缘由,但至少可以想到,在形式化演绎中,再繁复的语句集合也是难以保证自动演绎的,这一点更表明我们在其他领域中所谓的证明或论证的假模假样了。)
那么,一个普通的高中优等生在何种意义上是理解了他所解答了的数学题呢?他所理解的是一个最融贯、一致和协调,并可以被递归地还原的语句集合。如果他不是一名数学理论家,对那些公理、定理和推论何以如此,对于自然数的本性是什么的问题没有任何感觉的话,那么相对于数学理论家来说,他就不是真正理解了他所解答的这道题。他的情况很像一只聪敏的狗,在一个偌大的森林中靠着主人在树上留下的标记走出了森林,这些标记对于它来说足够复杂了,因为它们分别表示方向、危险警示、速度要求等指示。狗被训练地按照这些标识行动(这是条件反射),并且最终从这个森林中走出。我们在何种意义上说,这只狗知道如何走出森林?
这个例子可能让一些人觉得更加莫名其妙,因为他们会迫不及待地告诉我,数学本来就可以是没有意义的,是我们所有语言中最特别的一类语言。但是,当我问他们什么是意义的时候,他们可能沉默不语。他们还可能会反对我将高中生与狗做对比,他们认为高中生在数学学习中所体现的是人类高度的智能水平和逻辑思维能力,与狗被条件反射训练以实施相对复杂的行为有本质的差别。对于这个问题,我希望在下一篇文章讨论。
现在再来看第二个例子。这个例子是词典学。奥斯汀曾建议我们,在研究哲学的时候随手带一本字典是很有帮助的。这大概是说语词的日常意义对哲学研究者是一种约束和提醒,与他的哲学旨趣有关。那么词典编纂者的工作究竟是什么呢?这是一件非常有趣的事情,让我们尝试描述一下它。我们首先发现,词典编纂者所做的工作主要是,对于待解释的词,用他觉得我们相对更熟悉的语词组成的句子来阐释它的意思,另外就是把待解释的词放入他觉得我们能够理解其整体意思的句子中来说明它的意思,这些例句甚至都是不是词典编纂者自己造的句子,而是他搜集来的实例。词典编纂者既不明确说明某个词的指称或意义,也不确切地给出它的同义词,毋宁说他更乐意给出近义词,并且他如果要对这些近义词进行辨析,也无非是用他认为我们相对熟悉的语词来各自说明一下这些近义词的意思,而后含糊其辞地说到它们在使用中的侧重点不同,这看起来就像是纯粹的语感,等待读者自己在实践中验证,词典编纂者所提供的只是他自己捕捉的有关这些近义词的用法上不同之处的一些未必真实和完整的线索。这告诉我们,词典编纂者主要不关心语词的指称,阐明语词对应的事物不是他的工作,毋宁说这对于他而言过于苛刻。不过,仍然可以说,一本优秀的词典从事着一种非常令人敬佩的工作,它通过交互的语境说明,即用某些语词说明某个语词的意思,而最终这些语词居然是互相说明了的,人们由此能够成功地使用这些这些语词进行交际(communicating)。使人们成功的进行交际是词典编纂者最恰当的目的,人们为了说明自己某句话的意思,会使用其他语句来告诉对方他原先那句话的意思,这个语句保留某个他认为可能被误解的语词;有时候,他也会试图通过其他他认为对方更容易理解的语词组成的句子来解释他被明确告知不被理解的语词的意思。
一本词典的成功标准是利用它可以成功顺畅的交际,而不至于感到困惑不解。但是,有意思的问题是,当一个人对我们所说的话表现出困惑不解的时候,我们并不清楚他是找不到更熟悉的句子或语词来替换我们的语句而获得一种理解,还是我们语句所表达的意思与他的某个实质性的理论相冲突。后一种情况是怎么回事呢?让我们再次回到一开头讲到的课堂上。那时候,学生对老师说,“我已经理解了您所说的话”;老师则对此表示怀疑,他怀疑学生只是将自己所熟悉的某些语句替换了老师的语句并以为理解了老师,更棘手的是,当学生表示不理解的时候,老师也不确定是学生没有成功拿自己熟悉的句子替换老师的语句,还是学生已经完成这个过程,但他由此而被发展或修正的理论与老师的语句所表达的理论是冲突的。我们在后面会看到,这一点几乎是不可检验的,如果老师讲授的理论并没有一组明确的来自经验的观察句构成它的经验内容的话。
我这里想说两个重要的问题。第一,我们很可能像字典读者那样以为通过相对熟悉的语句或语词的替换而觉得理解了某种理论,在这种情况下,这些用来替换理论语句的理论与旧有的语句集合中的其他语句的关系是协调、一致的;当替换成功,则可以尝试将被替换的理论语句嵌入这个语句集合的某个适当位置,它们仍然一道表达了某种实事,而且现在使有关这一实事的观念变得更加清晰(的确,清晰的观点是能够以明白的语言来说出的);但在很多情况下,我们获得可能只是表面上的语句和语词的协调,而不是理论上的融贯。第二,获得一个协调一致的语句集的确会让我们产生获得一种理论的幻觉,但一种理论绝不单纯是协调一致的语句集。然而,什么是理论呢?又为什么会造成上面所描述的那种情况呢?
有一个说法是,对事物的探究往往要克服一个困难,即穿过语言的迷雾,抵达事物。最简单的理论可以是一句话,比如“地上有被分别命名为 a、b、c、d 四个颜色各异的玻璃球”。这句话被认为是理论在于,它直接面向事物,而且是可观察的。用蒯因的话说,它是一个场合句,也是一个观察句。所谓观察句,就是对于某个主体而言,在特定的场合他总会对这句表示赞同或不赞同。如果老王的前面是一片湖水,此时你询问他“地上有被分别命名为 a、b、c、d 四个颜色各异的玻璃球”这句话,他会否定;对他来说,“地上有被分别命名为 a、b、c、d 四个颜色各异的玻璃球”,当且仅当地上有被分别命名为 a、b、c、d 四个颜色各异的玻璃球。观察句特别典型地表达了真,而一个真假确定的语句是意义明确的语句。可是当我们问他“这是 p 或不是 p”时,他会肯定地告诉我们说,这句话是真的,那么这话是否也是意义明确的语句呢?他的确很自然地肯定这句话的真,因为他可以用任何对象替换这句话中的 p,最后都会使他在任何场合都肯定这句话,比如“这是鸡或不是鸡”。像“这是 p 或不是 p”这类被称为逻辑上的重言式不是我们讨论的对象,它们在逻辑上的真值之确定不在于它们的意义明确,倒在于它们是没有意义的,或者说是意义空洞的,因为它们并不对经验有所述说,而我们的观察句作为典型的理论句,其之所以典型地表达了真,就在于它们有经验意义。
“经验意义”不是一个很严格的用语,因为这里有用语重复。观察句的意义正在于它所表达的可被我们经验到的事物或状态,所以它的意义就是这被经验到的。根据蒯因,还有一类句子,即固定句(standing sentence)乃至永恒句(eternal sentence)。固定句是不随场合改变而在较长时间确定地为真或为假的句子,比如“《华盛顿邮报》每天九点发售”,在相当一个时期是确定为真的,不论当前的场合是什么。观察句则不同,观察句一般是要特定的时刻和地点做状语的句子。至于永恒句,只是相对于固定句而言的,比如“太阳围绕地球转”在相当的历史时期曾可以算作永恒句。观察句、固定句和或者永恒句是相对而言的,一个固定句可因时间系数或空间范围的调整而变成观察句,反之亦然。
现在可以讨论什么是一种理论了。一种理论是一个这样的语句集合,其中有一些成员句子是观察句,有些是固定句乃至永恒句,它们都可以说是有直接经验意义的句子,特别是对于观察句而言,这些句子属于这个理论中的经验内容部分,是理论的经验检验点;除此之外的更大量的句子,对于一个尽可能掌握这个句子集合的人来说,它们可以被称之为理论句,它们是没有经验内容的,也就是说,它们的真假判定情形与观察句恰恰相反,没有某种特定场合能够让掌握这个句子集合的人总是赞同或否定,比如“法的本质是自由的实现”,以及你随意翻开书架上的书上所说的大多数话,如果它们是一些德国哲学家的写的话。这些理论句最典型的特征是与场合脱离的,而且可以被任意用到其他上下文当中,但却没法轻易判定它们的使用是否正确或恰当。尽管如此,我们所说的作为一种理论的语句集中的这些理论句的意义都是分析性的,也就是说这些句子的构成成分是可以被还原到观察句、固定句或永恒句的(严格说来,必须被还原到观察句)。随便写下的理论句之所以被叫做理论句而不是观察句恰恰是因为它们除了与观察句相联系之外并不是理论的,而只是随便你怎么理解怎么读写的表达式乃至音素。我提到音素是想说,两种语言可以恰巧拥有相同的音素,比如汉语的“假”的发音与日语的“じゃ”(“拜拜”)尽管相似,但意义并不相同,理论句能够获得意义,纯粹是因为组成它们的音素在有经验意义的观察句中出现过,而观察句根据特定的句法规则被分割成特定的音素从而创造了特定的表达式,表达式是有意义的,其意义决定于整个观察句。
这样,一种理论中的所有的那些观察句就构成了这个理论的经验内容,除此之外的部分是免于被经验检验的,而一种理论的经验内容就是其临界质量(critical mass),只有这部分句子的语义学才是清晰的,但同时它们也构成了作为整体的理论的负担。用蒯因的那个著名的比喻来说,如果理论是一张网,那么它的经验内容就处在这张网的边缘,像触角一样接触经验的土壤,它们时常受到经验的干扰,或者被修正,或者被废弃,而这些改变会会被传到到在这张网的靠近中间以至于最核心的地方。一种完美的理论是其语句集中的成员句子全部都不受经验的修正或废弃,也就是说是免于被经验检验的。这种理论或许很难实际遇到,但原则上我们是可以想象的,它是对世界的真的完整的述说。但是无论如何,我强调这样的语句集合的中那些理论句的构成成分都是可以被还原到与经验接触的观察句的,并且是如此完全、一致、融贯、统一。
这就是我所说的理论。它是一个如我所描述的特殊的语句集合。在这里我不能讨论太多细节。为了更有助于理解这一点,让我们再次考虑那个理论之网的比喻。对于主体来说,我们也可以说那是信念之网。在特定领域,我们有不同的理论,也就是有不同的信念之网,但我们还有统一这所有领域的整个一张巨大的信念之网。必须整体的看待我们的理论,它正像一张网一样,每条绳子都相互联系,其中还有许多纽节。这有两点提示:第一,我们真正的理论必须是关于信念的,而信念是关于事物(你可以按于自己的兴趣说实事、世界、真、事实都可以)的,它是关于特定领域的事物的系统的述说;第二,正如网那样,我们真正的理论内部是或者应当是协调、一致、融贯、统一的。如果我们能够拥有这样的理论,那我们可以理解我们的理论所述说的事物是什么以及它是怎么回事,同时因为我们的理论内部的融贯统一的,我们获得了对事物的清晰明白的理解。
到这里,似乎还不是很容易理解,我们在数学学习和词典学中所获得的教益。难道我一直在说的是,真正所谓理解,必须是拥有一个真正理论的理解;而拥有一个理论,必须是拥有对事物有融贯统一述说的信念?这当然没错,但不是我的全部意思,这个观点本来也并不新鲜。理论必须是关于真信念的,而真信念是关于事物的。看起来,一种理论的语句集合似乎有一些基础,而这些基础是经验的。这样理解对吗?不对。没有所谓基础,正如维特根斯坦在《论确实性》中所说的,“起点是找不到的”。我确实说理论必须是关于经验,至少现在看到的理论都还是这样的;但我也提到过蒯因的一个观点,即理论的经验内容是理论的负担,形象地说法是,它们是理论的临界质量,除此之外的的语句都是免于被经验检验的,它们在形式演绎中的正确的位置和关系规则所要求的除外。这个观点是一个相反的暗示,即经验尽管重要,但不能随意说它是理论的基础;经验本来是理论负载的,没有可能找到独立于理论的经验作为前者的基础。实际上,而不是原则上,我们一开始就是带着理论上路的,所谓经验是被理论塑造的经验。那么理论和经验之间的关系究竟是怎样的呢?我希望在下一篇文章中讨论这个问题。
2019/10/15 江湾