Odeuropa:歴史的文献から匂いを抽出するLinked Dataの世界
はじめに
Odeuropa(オデウロパ)は、ヨーロッパの歴史的文献から「匂い」に関する記述を抽出し、Linked Dataとして構造化したユニークなプロジェクトです。本記事では、SPARQLエンドポイントを通じて実際のデータを探索し、その構造と設計思想を明らかにしていきます。
Odeuropaとは
- プロジェクト名: Odeuropa(Odeurs d'Europe = ヨーロッパの匂い)
- データベースURL: https://data.odeuropa.eu/
- SPARQLエンドポイント: https://data.odeuropa.eu/repositories/odeuropa
- Webインターフェース: https://explorer.odeuropa.eu/
データモデルの全体像
OdeuropaはCIDOC-CRM(文化遺産のための概念参照モデル)をベースに、匂いに特化した拡張オントロジーを使用しています。
主要な概念と関係性
Source (文献)
↓ P106_is_composed_of
Fragment (テキスト断片)
↓ P67_refers_to
├─ Emission (放出イベント) ←── 中心的なハブ
│ ├─ F3_had_source → Object (発生源)
│ └─ F1_generated → Smell (匂い)
├─ Smell (匂い)
└─ Experience (体験イベント)
└─ F2_perceived → Smell (匂い)
重要なポイント:
- Fragmentは直接的にEmission、Smell、Experienceを参照
- ObjectへはEmission経由でアクセス(Fragment → Emission → Object)
- EmissionがObjectとSmellを因果的に接続する中心的な役割
実例で学ぶデータ構造
1810年にドイツで出版された農業書「Grundsätze der rationellen Landwirthschaft」(合理的農業の原理)を例に、データ構造を見ていきましょう。
1. Source(文献)
文献の基本情報を格納するエンティティです。
SELECT ?s ?author ?date ?language
WHERE {
?s a <http://erlangen-crm.org/current/E33_Linguistic_Object> ;
rdfs:label "Grundsätze der rationellen Landwirthschaft"@de ;
<https://schema.org/author> ?author ;
<https://schema.org/dateCreated> ?date ;
<https://schema.org/inLanguage> ?language .
}
主要プロパティ:
-
rdfs:label: タイトル -
schema:author: 著者(Albrecht Daniel Thaer) -
schema:dateCreated: 作成年(1810) -
schema:inLanguage: 言語(de) -
schema:genre: ジャンル(Household texts & recipes) -
schema:locationCreated: 作成地 -
P106_is_composed_of: 含まれるフラグメント
2. Fragment(テキスト断片)
匂いに関する記述を含むテキストの一部です。
<fragment/8d7c492a-c8f6-5b4e-a125-e940cd9d0f6c>
rdf:value "Sie ſind daher angefeuchtet ſchluͤpfrig und dehnbarer,
geben einen Thongeruch von ſich, und trocknen zu feſten
doch mehr zerreiblichen Klumpen zuſammen." ;
schema:position 4 ;
P106_is_composed_of "Sie", "Thongeruch" ;
P67_refers_to <emission/e85bf4b6>, <smell/24ffdb8b>, <experience/037de532> ;
P165i_is_incorporated_in <source/0039cf89> .
テキストの意味:
「それら(粘土)は湿らせると滑りやすく、より伸縮性があり、粘土の匂いを発し、乾燥すると固いが砕けやすい塊になる。」
主要プロパティ:
-
rdf:value: 実際のテキスト内容 -
schema:position: 文献内の位置(4番目のフラグメント) -
P106_is_composed_of: 含まれる重要な単語("Sie", "Thongeruch") -
P67_refers_to: 参照する概念(Emission, Smell, Experience) -
P165i_is_incorporated_in: 所属する文献(Source)
3. Emission(匂いの放出イベント)
匂いが発生する出来事を表します。EmissionはFragmentから参照され、ObjectとSmellを接続します。
<emission/e85bf4b6-e1a6-5272-b7f6-16e913012f1d>
a <http://data.odeuropa.eu/ontology/L12_Smell_Emission> ;
F3_had_source <object/26b79790> ;
F1_generated <smell/24ffdb8b> ;
P92_brought_into_existence <smell/24ffdb8b> ;
P12_occurred_in_the_presence_of <object/26b79790>, <smell/24ffdb8b> ;
time:hasTime <time/834d8a07> ;
P67i_is_referred_to_by <fragment/8d7c492a> .
主要プロパティ:
-
F3_had_source: 匂いの発生源(Object "Sie") -
F1_generated: 生成された匂い(Smell "Thongeruch") -
P92_brought_into_existence: 存在させた匂い -
P12_occurred_in_the_presence_of: イベント時に存在していたもの(ObjectとSmell) -
time:hasTime: 発生時期(1810年) -
P67i_is_referred_to_by: このEmissionを参照しているFragment
Emissionの役割:
Emissionは「どのObject(発生源)が、どのSmell(匂い)を、いつ生成したか」という因果関係を表現する中心的なイベントです。
4. Object(匂いの発生源)
匂いを発する物体や物質です。ObjectはEmissionから参照されます。
<object/26b79790-fad0-56f0-acd6-ab423a460dd3>
a <http://www.ics.forth.gr/isl/CRMsci/S10_Material_Substantial> ;
rdfs:label "Sie" ;
P12i_was_present_at <emission/e85bf4b6> .
この例では、"Sie"(それら)という代名詞で粘土や土壌を指しています。
タイプ:
-
S10_Material_Substantial: 物質的実体 -
S15_Observable_Entity: 観察可能な実体
主要プロパティ:
-
rdfs:label: オブジェクト名("Sie") -
P12i_was_present_at: このオブジェクトが存在していたイベント(Emission)
接続経路:
Fragment → (P67_refers_to) → Emission → (F3_had_source) → Object
5. Smell(匂い)
匂いそのものを表す中心的な概念です。
<smell/24ffdb8b-adcb-5c8b-8d3a-eb3c4533f93c>
rdfs:label "Thongeruch" ;
P92i_was_brought_into_existence_by <emission/e85bf4b6> ;
P140i_was_attributed_by <experience/037de532> .
主要プロパティ:
-
rdfs:label: 匂いの名称(Thongeruch = 粘土の匂い) -
P92i_was_brought_into_existence_by: この匂いを生成したEmission -
P140i_was_attributed_by: この匂いを認識したExperience
6. Experience(匂いの体験イベント)
人間が匂いを知覚・体験する出来事です。
<experience/037de532-9577-504f-9044-fcb759459ba2>
F2_perceived <smell/24ffdb8b> ;
O8_observed <smell/24ffdb8b> ;
P140_assigned_attribute_to <smell/24ffdb8b> ;
time:hasTime <time/834d8a07> .
主要プロパティ:
-
F2_perceived: 知覚された匂い -
O8_observed: 観察された匂い -
P140_assigned_attribute_to: 属性が割り当てられた対象 -
P14_carried_out_by: 体験者(Actor)
データの流れ:完全なストーリー
1810年、ドイツ
📖 文献「合理的農業の原理」(Source)
↓ P106_is_composed_of
📄 テキスト断片 (Fragment)
"Sie...geben einen Thongeruch von sich..."
↓ P67_refers_to
├─────────────┬─────────────┐
↓ ↓ ↓
💨 放出 👃 匂い 👁️ 体験
(Emission) (Smell) (Experience)
│
├─ F3_had_source ─→ 🏺 物質 (Object): "Sie" = 粘土
│
└─ F1_generated ──→ 👃 匂い (Smell): "Thongeruch"
↑
│ F2_perceived
│
👁️ 体験 (Experience)
↓
👨🌾 観察者: Thaer
データフロー解説:
- Fragmentが3つの概念(Emission、Smell、Experience)を直接参照
-
Emissionが因果関係の中心:
- Object(発生源)から
- Smell(匂い)を生成
- ExperienceがSmellを知覚
- ObjectはEmission経由でFragmentと間接的に接続
SPARQLクエリ実例
言語指定での検索
ドイツ語のラベルで検索する場合:
SELECT ?s ?label
WHERE {
?s rdfs:label "Grundsätze der rationellen Landwirthschaft"@de ;
rdfs:label ?label .
}
画像付きビジュアルアイテムの取得
複数の画像がある場合に重複を避ける:
SELECT ?s ?label ?image
WHERE {
?s a <http://erlangen-crm.org/current/E36_Visual_Item> ;
<https://schema.org/image> ?image ;
rdfs:label ?label .
}
LIMIT 100
匂いとその発生源を取得
PREFIX od: <http://data.odeuropa.eu/ontology/>
SELECT ?smell ?smellLabel ?object ?objectLabel
WHERE {
?emission a od:L12_Smell_Emission ;
od:F3_had_source ?object ;
od:F1_generated ?smell .
?smell rdfs:label ?smellLabel .
?object rdfs:label ?objectLabel .
}
LIMIT 100
使用されているオントロジー
CIDOC-CRM
-
E33_Linguistic_Object: 言語的オブジェクト(文献) -
E36_Visual_Item: 視覚的アイテム -
E39_Actor: 人物(著者、観察者) -
E53_Place: 場所 -
E77_Persistent_Item: 持続的アイテム -
P67_refers_to: 参照する -
P106_is_composed_of: 構成される -
P140_assigned_attribute_to: 属性を割り当てる
CRMsci(科学観察の拡張)
-
S10_Material_Substantial: 物質的実体 -
S15_Observable_Entity: 観察可能な実体 -
O8_observed: 観察した
Odeuropa独自の拡張
-
L12_Smell_Emission: 匂いの放出 -
F1_generated: 生成した -
F2_perceived: 知覚した -
F3_had_source: 発生源を持つ
Schema.org
-
schema:author: 著者 -
schema:dateCreated: 作成日 -
schema:inLanguage: 言語 -
schema:genre: ジャンル -
schema:image: 画像 -
schema:position: 位置
プロジェクトの意義
Odeuropaプロジェクトは以下の点で画期的です:
- 感覚データのデジタル化: 従来デジタル化が困難だった「匂い」という感覚情報を構造化
- 歴史研究への応用: 過去の人々が何をどう匂いと感じていたかを分析可能に
- Linked Dataの実践: CIDOC-CRMを用いた高度なセマンティックWeb技術の実装
- 学際的アプローチ: 歴史学、情報学、感覚研究の融合
まとめ
Odeuropaデータベースは、テキストマイニング、オントロジー設計、Linked Data技術を駆使して、歴史的文献から「匂い」という抽象的な概念を抽出・構造化した野心的なプロジェクトです。
CIDOC-CRMという確立された文化遺産オントロジーをベースにしながら、匂い特有の概念(Emission、Experience)を追加することで、再利用可能で拡張性の高いデータモデルを実現しています。
このようなアプローチは、他の感覚情報(音、味、触感など)のデジタル化にも応用可能であり、デジタルヒューマニティーズの新しい可能性を示しています。
参考リンク
- Odeuropa Explorer: https://explorer.odeuropa.eu/
- SPARQL Endpoint: https://data.odeuropa.eu/repositories/odeuropa
- CIDOC-CRM: http://www.cidoc-crm.org/
- 例として使用した文献: https://www.deutschestextarchiv.de/book/show/thaer_landwirthschaft02_1810
Discussion