当然,哲学史不仅仅是教义学。理想情况下,哲学史应该辅以对人们所说的话的解释。在我的结论中,我将概述我们如何利用语义网技术的资源来描述哲学家(可能还有其他人)所说的话所暗示的概念层次结构。然而,重要的是要记住,根据本文第一部分的基础讨论,这样的本体论将永远是解释,如果我们试图捕捉文本的含义,那么争议和异议可能是不可避免的。无论我们使用何种媒介来表达我们的发现,情况都是如此。
2. 本体论、组合性、语境性
大致来说,本体可以定义为“领域术语及其相互关系的明确形式规范”。[5]这样的规范确定了“需要共享领域信息的研究人员的通用词汇表。它包括领域中基本概念及其相互关系的机器可解释定义”。[6]此外,这种规范对于“分析领域知识”来说是必不可少的。[7] OWL 知道两种概念:类,它“提供一种抽象机制来对具有相似特征的资源进行分组” [8],并在所谓的“类公理”中定义,属性,在所谓的“属性公理”中定义。[9] OWL 文档中的第三类陈述涉及个人的事实。[10]所有陈述都由类、属性和常量作为构建块组成。这些构建块必须事先定义:在构造陈述之前,必须知道它们的内涵。
这意味着本体工程牢固地扎根于基于弗雷格的“组合性原理”的意义理论:“[…]复杂表达式的意义由其结构及其成分的意义决定”。[11]这种联系引发了一些有趣的问题。那些相信本体可能能够对给定领域的知识进行建模,但又不坚持认为本体能够捕捉独立于心智的现实特征这一更强烈观点的人,可能满足于将组合性的范围限制在给定的语言中。[12]或者他们可以坚持认为它只适用于用于表达领域模型的形式语言,因为人工语言可以被解释为表现出组合性这一特征。那些赞同对本体论中的概念进行更现实主义解释的人,可能不得不接受更强的“跨语言组合性”论题:“对于 L 中的每个复杂表达式 e,L 中 e 的含义都是通过一个适用于所有可能的人类语言的单一函数由 L 中 e 的结构和 L 中 e 成分的含义在功能上确定的”。[13]
但即使人们可能对组合性的范围存在分歧,但“组合主义”偏见显然已经融入了本体论作为“研究者的共同词汇”这一概念之中。然而,弗雷格的第一个原则与第二个原则相冲突,后者也与他的语言哲学有关,即“语境性原则”(或“语境原则”):“表达式的意义由它作为组成部分出现的所有复杂表达式的意义决定。” [14]因此,组合主义者认为命题的意义是命题各部分的意义与命题结构的语义贡献的总和,而语境主义者则认为命题意义是第一位的,命题组成部分的意义取决于它们在所有其他包含它们的命题中的作用。[15]但同样,必须准确确定这一优先权要求的范围。在本文中,遵循斯坦顿的观点并区分对语境原则所表达的优先性的三种不同理解是有帮助的,即对命题意义优先于概念意义的这种优先性的方法论、元语义学和“心理学”解释。[16]
从方法论的角度来看,我们假设对子句表达式意义的分析必须考虑它们所出现的命题的语境。这种对命题优先性的理解甚至可能与组合性相兼容,因为我们可以理解,出现在我们理解的命题中的子句表达式的意义如何被分离出来并转移到新的语境中,使我们能够表达一个我们尚未理解的命题。换句话说,我们可能既需要意义的组合性也需要意义的语境性,才能解释语言的创造力,即通过重新组合我们已经理解的元素来表达新思想的能力。[17]
但这并不意味着我们必然会坚持更强有力的元语义论,即命题意义在某种实质意义上是子句表达式意义的唯一(或最相关的)来源。如果这一更强有力的论断适用于本体设计方法论,那么这个项目本身可能毫无希望,因为术语的重组总会导致设计者无法预见的意义突变。
心理学理论认为,自然语言的熟练使用者无法单独掌握句子子表达式的含义。支持这一观点的人可能对将句子子表达式应用于在线资源来表示在线资源的尝试持怀疑态度:对他们来说,标记本身不可能是一种有意义的语言活动。尽管这种激进的批评可能是错误的,但我们应该记住,语义网的愿景是围绕知识概念建立的。而且——尽管非命题形式的知识(如知识或基础感知信念)存在困难的哲学问题——本体只能编纂可以以命题形式阐明的知识。因此,即使我们不赞同强有力的心理学论点,即句子子表达式本身基本上毫无意义,我们仍然可以接受方法论指导方针,即本体设计关注的是可以以命题形式表达或阐明的知识。因此,对子句表达式含义的隐性认识应该始终以命题形式来阐述,不管有能力的说话者是否能够单独使用或理解这些表达式。[18]
因此,即使那些将组合性视为自我理解基本要素的本体设计者也面临着有趣的问题:我们是否应该假设本体反映了跨语言的普遍性,还是它们的实用性仅限于特定语言社区内的说话者?本体是否主要追踪扩展,即术语的指称,还是我们也应该给予它们内涵解释,同时考虑到它们的含义?我们是否接受这样的观点,即本体中的陈述完全没有上下文,因此它们的含义实际上只由子句含义的总和和句法的贡献组成?
在思考这些问题时,我们永远不应忽视这样一个事实:本体论本身并不是目的:它们是技术工具,因此其范围和效用首先由实用主义考虑决定。因此,认为为了构建本体论,必须在这些复杂且悬而未决的哲学争论中选择一方是不明智的。我们应该问问自己,我们对本体论设计的理解在多大程度上是由我们隐含的意义理论中未被承认的偏见决定的,以及是否有可能以不坚持任何明确立场的方式构建本体论。
至少在启发式层面上,对于给定领域的这种最低限度的理解将包括两个决定性的举措:
命题的含义(即其“命题内容”)被认为是不透明的,仅通过名称来指代。这使我们能够避免承诺在特定情况下命题的含义是否实际上可以通过组合来分析。
命题内容只有在能够与时空实体(通常是人或文件)联系起来时才是允许的,而该实体表达了对该内容的命题态度,即肯定、否定或反思相关内容。换句话说,名称“葡萄酒是由葡萄制成的”所指定的命题内容不能被分析为表示饮料的主语、表示水果的宾语和表示将水果变成饮料的过程的关系词。除非我们可以将该内容追溯到肯定、否定或反思命题内容“葡萄酒是由葡萄制成的”的人或文件,否则不能被接受。[19]
应该注意的是,命题意义的不透明性并不是绝对的。我们仍然可以也应该谈论主语、宾语和关系词对命题内容的构成所做的贡献。但我们这样做时,不必对单个词如何对其出现的命题的意义有所先入为主的观念。为了阐明这一点,我将把这里提出的方法与对陈述进行建模的标准程序进行比较,即物化。但首先讨论一个简化的例子会很有帮助,这个例子旨在证明,使用这里提出的方法,我们可以以简单透明的方式处理一个领域内不一致的陈述,以及与其他领域相关时可能存在问题的陈述。[20]
3. 合法葡萄酒
管理西弗吉尼亚州酒精饮料管理委员会活动的立法规则 175CSR 2 §175-2-2 规定,根据西弗吉尼亚州法律,葡萄酒是指
“任何通过发酵水果或其他农产品的天然成分而获得的含糖饮料,包括但不限于静止葡萄酒、香槟和其他起泡葡萄酒、碳酸葡萄酒、仿制葡萄酒、苦艾酒、苹果酒、梨酒、清酒或其他类似饮料,以葡萄酒形式出售或销售,且酒精含量按体积计不低于百分之七(7%)也不高于百分之二十四(24%)。” [21]
啤酒的定义是“任何通过大麦、麦芽、啤酒花或任何其他类似产品或替代品发酵而获得的饮料,其酒精含量比非醉人啤酒或非醉人精酿啤酒高”。[22] 酒类定义为“酒精、啤酒(包括大麦啤酒)、葡萄酒(包括大麦酒[重点是我强调的])和蒸馏酒,[…]”。[23]因此,在西弗吉尼亚州法律中,“葡萄酒”的概念包括以梨、苹果和大米为基础的产品,只要它们含有 7% 以上和 24% 以下的乙醇,也就是说,显然所有介于这两个限度之间的非啤酒酒精饮料,因为啤酒是在另一个标题下讨论的。但话又说回来,“大麦酒”被认定为一种葡萄酒。然而,除了酒精浓度外,它与啤酒具有相同的所有相关属性。
因此,该法律是自相矛盾的。如果我们想在西弗吉尼亚州法律中建立饮料分类模型,那么我们必须要么接受葡萄酒的概念,该概念确实包括由大麦制成的饮料,并且不要求其发酵基于糖。或者我们可以忽略大麦“葡萄酒”在葡萄酒概念下的包含,这样我们的模型就不完整了。
法律中的概念必然是模糊的:法院必须有自由将法律应用于立法时未知的新饮料。法律中规定的含义可能与我们的常识观念相矛盾,因此它们无法轻易映射到现有本体上,例如葡萄酒本体,将葡萄酒理解为由葡萄制成的可饮用液体。不同领域中概念之间矛盾、模糊和紧张的出现可能会导致怀疑论者得出这样的结论:由于概念只不过是不符合本体工程师严格要求的社会结构,因此以机器可读的方式建模知识的整个努力注定会失败。相反,现实主义者可能会指出,如果我们拥有功能齐全的文物和社会机构本体,那么西弗吉尼亚州“葡萄酒”的法律含义原则上可以重建。由此产生的决定可能非常复杂,但原则上是可行的。
或者我们可能想知道“具体化”是否是一种解决方案。RDF 是一种用于语义描述 Web 资源的 XML 方言,它支持这种技术,因此我将使用它的语法来解释这一概念。[24]
RDF 将一个具体化陈述表示为具有特定 RDF 属性和对象的四个陈述:由资源 R 具体化的陈述 (S, P, O) 表示为:
R rdf:类型 rdf:语句
R rdf:主题 S
R rdf:谓词
R rdf:对象 O [25]
第一个三元组 (R rdf:type rdf:Statement) 可用于引用由树术语 S、P 和 O 组成的语句。因此,我们可以通过简单地将语句命名为 »Sake_is_legal_wine_in_WV«(或 SLWWV),并将其由主语术语 »Sake«、关系 »is subclass of« 和宾语术语 »legal_wine_in_West_Virginia« 组成,来引用概念 »Sake is legal wine in West Virginia«。这样的 ›四元组‹ [26]确实允许我们将语句作为一个整体来引用。因此,我们可以通过形成第二个语句来表达西弗吉尼亚州立法者在制定立法规则时的意图,该语句以 »West Virginia legislators« 为主语术语、»stipulate« 为关系术语、»RLWWV« 为宾语术语:West Virginia legislators stipulate that Sake is legally wine in West Virginia。
但只有当要建模的领域不具有自相矛盾的概念时,物化才会对我们有所帮助。如果我们想将“大麦酒是酒”这一陈述物化,就会遇到问题。由于大麦酒实际上被规定为啤酒,而啤酒的规定与酒的规定相矛盾(啤酒基于谷物发酵,酒基于糖发酵),任何试图捕捉西弗吉尼亚立法者意图的本体论都注定会失败,因为这些意图相互矛盾:一个连贯的模型是不可能的。这与我们仅仅不确定陈述的事实真假的情况不同:物化陈述可以是假的,只要其假性纯粹是事实性的。[27]但物化不能将我们从逻辑或概念上的不一致中拯救出来。
»大麦酒是酒« 只是一个包含主语、关系词和宾语的语句的名称,但这些词都不是 RDF 三元组的一部分。[28]因此,它们在语句中的聚合并不构成 RDF 语句。这表明,作为资源描述(即某些东西 › 外面 ›),这三个词的状态是不确定的。由于语句的指称不明确,因此必须假定其含义(或缺乏含义)也同样不明确。即使我们可以指定语句中包含的词,语句的含义也是不透明的。但同样重要的是,无论内容是什么,都要将其描述为可以归因于此语句创建者的命题内容,即可能是西弗吉尼亚州的立法者。
与正式具体化相比,这种方法的主要优势在于它可以启发式地使用:我们不需要完整的本体论来以可进一步细化和发展的形式捕捉给定话语的内容。当我们对所说的内容和说这些话的人之间的联系感兴趣时,即在我们捕捉人们意见的所有领域,即在所有“教条主义”领域中,这种启发式方法特别有用。它可以适应概念内涵随时间的演变,因此有助于追踪概念、信仰和理论的历史。
4. 用例:以文献学的方式捕捉哲学论述
如果我们想将本文概述的方法浓缩为一个方便的口号,我们可以说它关注的是人 巴哈马电报数据 们对世界的看法,而不是世界上存在的东西。它记录的是观点,而不是事实。在哲学史上,记录观点的教条主义是一种可以追溯到古代的古老传统。[29]因此,用于捕捉他人观点的最小本体可以说是“教条主义地”进行的。它包括抽象和时空实体,即持有某种信念的人或表达某种信念的文本以及该信念的命题内容。命题态度可以理解为时空实体的属性,即肯定、否定或仅仅反映给定命题内容的属性。
因此,用于捕捉他人观点的最小本体可以说是“以教条主义的方式”进行的。它包括抽象和时空实体,即持有某种信念的人或表达某种信念的文本以及该信念的命题内容。命题态度可以理解为时空实体的属性,即断言、否定或仅仅反映给定命题内容的属性。
这种最小的文献本体可用来捕捉给定论述的内容,而无需对相应领域的概念结构作出任何假设。在EMTO Nanopub的一次概念验证中,我收集了关于如何定义早期现代伊比利亚哲学中“哲学”的辩论的“文献事实”,将加斯帕尔·卡迪略·德·维拉尔潘多、康普鲁顿斯派、科尼布里森斯派、迭戈·马斯、维森特·蒙塔内斯、安东尼奥·卢比奥、何塞·萨恩斯·德·阿吉雷和弗朗西斯库斯·托莱图斯的观点整理为“纳米出版物”。[30]即使没有对这些命题进行额外的概念分析,我们也可以从这种纯粹的文献“记录”中获得一些有趣的见解。