第1章: オントロジーの3つの顔 ─ 哲学・計算機科学・データ基盤
第1部の最初の章として、まず**「オントロジー」という言葉が指すものを整理する。なぜここから始めるか。それは、「オントロジーとは何か」と聞いて返ってくる答えが、人によって全く違う**からだ。話す相手と前提を揃えるところから始めないと、議論が空回りする。
語源と3文脈
オントロジー(Ontology)はギリシア語の on(存在)+ logos(学問) に由来する。「存在に関する学問」が直訳。
しかし2026年現在、この語は以下の3つの異なる文脈で使われる。
graph TB
Root((Ontology))
Root --> Phil[哲学のオントロジー<br/>存在論]
Root --> CS[計算機科学のオントロジー<br/>共有可能な概念モデル]
Root --> Data[データ基盤のオントロジー<br/>組織の操作可能な意味層]
Phil --> P1[アリストテレス『カテゴリー論』]
Phil --> P2[Quine: ontological commitment]
Phil --> P3[Stanford Encyclopedia: 'the science of what is']
CS --> C1[Tom Gruber 1993 / Studer 1998]
CS --> C2[RDF / OWL / SPARQL]
CS --> C3[BFO / DOLCE / SUMO / Cyc]
Data --> D1[Palantir Foundry Ontology]
Data --> D2[知識グラフ / Knowledge Graph]
Data --> D3[Semantic Layer]
style Phil fill:#1a2030,stroke:#ff4d6d
style CS fill:#1a2030,stroke:#b794f4
style Data fill:#1a2030,stroke:#4cc9f0
順に見ていく。
(1) 哲学のオントロジー(存在論)
「何が存在するか」を論じる学問。古代ギリシアのアリストテレス『カテゴリー論』に源流があり、現代分析哲学に至るまで議論が続いている。
| 主要な問い | 例 |
|---|---|
| どんな種類のものが存在するか | 物体、性質、関係、出来事、可能性、抽象的対象 |
| 存在するとはどういうことか | 「リンゴが存在する」と「2が存在する」は同じ意味か |
| 個体と普遍はどちらが先か | 「赤い」という性質は、赤いリンゴから独立して存在するか |
Stanford Encyclopedia of Philosophy は「the science of what is」と簡潔に定義する。20世紀の Quine は「存在するとは変項の値であること(To be is to be the value of a variable)」という有名なテーゼを残した ─ つまり「あるものを認めるとは、それを変数で指せると認めることだ」という、論理学に接続する現代的な定式化だ。
この文脈は本シリーズの主役ではない。しかし無視もできない。なぜなら、計算機科学のオントロジーがこの文脈から名前を借りてきたからだ。1990年代に Tom Gruber が哲学から「Ontology」という語を持ってきたとき、**「世界の構造を明示的に記述する」**という哲学的アイデアを情報科学に翻訳した。
(2) 計算機科学のオントロジー
1990年代初頭、DARPA の知識共有プロジェクト(Knowledge Sharing Effort)の中で、Tom Gruber が哲学から借用して再定義した。
Gruber 定義の二段階
| 年 | 主体 | 定義 |
|---|---|---|
| 1993 | Tom Gruber 単独 | ”an explicit specification of a conceptualization” |
| 1998 | Studer ら拡張 | ”a formal, explicit specification of a shared conceptualization” |
1998年の拡張版が標準。4つの形容詞それぞれに意味がある:
| 形容詞 | 意味 |
|---|---|
| explicit | 概念と制約を明示的に列挙(暗黙の慣習ではない) |
| formal | 機械可読で厳密なセマンティクス |
| shared | 個人ではなくコミュニティで合意された |
| conceptualization | 「ドメイン内の概念と関係の抽象モデル」 |
つまり計算機科学のオントロジーは、「ある分野の概念と関係を、機械が読めて、みんなで合意できる形で、明示的に書いたもの」だ。
何を解いているのか
これが扱う問題は:
- 異なるシステム間でデータの意味を揃える(A社の “Customer” と B社の “Customer” は同じか?)
- 暗黙の知識を明示化する(医師同士なら通じるが機械は読めない関係性をどう書くか)
- 推論可能にする(「X は哺乳類」「哺乳類は動物」と書いておけば「X は動物」を機械が導ける)
代表的な実装は本書の第3章で扱う RDF / OWL といった W3C 標準、ドメインオントロジーは SNOMED CT(医療)/ Gene Ontology(生物学)/ FIBO(金融)。上位オントロジーは BFO / DOLCE / SUMO / Cyc。
(3) データ基盤のオントロジー
21世紀のエンタープライズ文脈で、(2) の系譜に実装的な肉付けが加わって生まれた、**「組織の操作可能な意味層」**としてのオントロジー。
代表例は Palantir Foundry の Ontology。Palantir 公式は次のように位置づける:
The digital twin of an organization. (組織のデジタルツインそのもの)
ここでの「オントロジー」は、単なる概念の記述ではなく:
- Object Type / Link Type(名詞の定義)
- Action Type / Function(動詞の定義 ─ 第5章で深掘り)
- Permission / Lifecycle(規則の定義)
までを束ねた、動く意味層だ。これは(2)の伝統的な「定義書」と決定的に違う。本書の第2部(ch04〜06)が中心に扱う領域。
3 つは別物か、地続きか
「地続き」だ。同じ概念を異なる抽象度で扱っている。
graph LR
Phil[哲学<br/>'存在するとは何か'] -->|借用| CS[計算機科学<br/>'共有可能な概念モデル']
CS -->|実装と運用化| Data[データ基盤<br/>'組織の操作可能な意味層']
Phil -.-> Q[Quine: ontological commitment]
CS -.-> G[Gruber: formal explicit specification]
Data -.-> P[Palantir: digital twin]
style Phil fill:#1a2030,stroke:#ff4d6d
style CS fill:#1a2030,stroke:#b794f4
style Data fill:#1a2030,stroke:#4cc9f0
- 哲学 → 計算機科学:「世界の構造を明示する」というアイデアの借用
- 計算機科学 → データ基盤:定義のための言語(OWL等)から、定義と動作とガバナンスを束ねた実装へ
ただし「Palantir のオントロジー = OWL/RDF」ではないことに注意。Palantir Foundry は OWL/RDF を使わない実装で、独自のグラフモデルとアクションモデルを採用している。これは第4章で詳しく見る。
本シリーズの主戦場
3文脈のうち、本シリーズが扱うのは (2) と (3) だ。
| 章 | 主に扱う文脈 |
|---|---|
| 第1章(本章) | 3文脈の整理 |
| 第2-3章 | 計算機科学のオントロジー(基礎) |
| 第4-6章 | データ基盤のオントロジー(Palantir + 一般 Semantic Layer) |
| 第7-8章 | データ基盤 × LLM(GraphRAG、エージェント) |
| 第9章 | 設計と実装 |
哲学は出発点として軽く触れるだけで、Quine や Heidegger を深掘りすることはない。一方で、Gruber 定義の正確な理解と、Palantir の Operational Ontology の実装感覚は、何度も出てくる。
なぜ「3つに分けて理解する」価値があるか
ここで分けておかないと、会話の前提がずれる。たとえば:
- 「うちの会社にもオントロジーが必要では?」と PdM が言ったとき、それは(3)の意味(Palantir 風)
- 「オントロジーは難しい、OWL なんて使わない」とエンジニアが反論するとき、それは(2)の限定的なイメージ
- 「オントロジーは哲学の話でしょ」と部長が言ったとき、それは(1)の遠い記憶
3つを区別するだけで、議論が60%スムーズになる。本書の最初に置いた整理は、この「会話のすれ違い」を防ぐ装置だ。
4 つの根本原理との関係
「はじめに」で予告した4原理を、本章で扱った3文脈に当てはめる:
| 原理 | 哲学 | 計算機科学 | データ基盤 |
|---|---|---|---|
| #1 共通言語 | 存在の語彙 | RDF/OWL の標準 | Object Type の標準化 |
| #2 Semantic vs Kinetic | (該当なし) | (限定的) | Palantir の中核 |
| #3 構造 → 推論 | 論理学的伝統 | OWL Reasoner | KG クエリ |
| #4 LLM 橋渡し | (該当なし) | 抽出元としての OWL | GraphRAG / MCP |
3文脈でできることのカバー範囲が違う。これが本シリーズで「データ基盤」「LLM時代」を中心に扱う理由でもある。
本章の要点
| # | 要点 |
|---|---|
| 1 | オントロジーは語が同じでも、3つの異なる文脈で使われる:哲学 / 計算機科学 / データ基盤 |
| 2 | 哲学のオントロジー = 存在論。「何が存在するか」を論じる学問。古代から現代まで連綿 |
| 3 | 計算機科学のオントロジー = Gruber 定義(1993 → 1998 拡張)。「formal, explicit specification of a shared conceptualization」 |
| 4 | データ基盤のオントロジー = Palantir 風の「digital twin of an organization」。Object / Link / Action を束ねた動く意味層 |
| 5 | 3文脈は地続き:哲学から借用して計算機科学が成立、計算機科学を実装・運用化したものがデータ基盤 |
| 6 | 本シリーズは(2)と(3)が主戦場。哲学は出発点としてだけ触れる |
効いている根本原理
本章は 原理1(世界の構造を共通言語にする) を3文脈で確認した章だった。次章では(2)の計算機科学のオントロジーに焦点を絞り、その最も本質的な特徴である Closed World vs Open World Assumption を見ていく。