💭

Odeuropa:歴史的文献から匂いを抽出するLinked Dataの世界

に公開

はじめに

Odeuropa(オデウロパ)は、ヨーロッパの歴史的文献から「匂い」に関する記述を抽出し、Linked Dataとして構造化したユニークなプロジェクトです。本記事では、SPARQLエンドポイントを通じて実際のデータを探索し、その構造と設計思想を明らかにしていきます。

Odeuropaとは

データモデルの全体像

OdeuropaはCIDOC-CRM(文化遺産のための概念参照モデル)をベースに、匂いに特化した拡張オントロジーを使用しています。

主要な概念と関係性

Source (文献)
  ↓ P106_is_composed_of
Fragment (テキスト断片)
  ↓ P67_refers_to
  ├─ Emission (放出イベント) ←── 中心的なハブ
  │    ├─ F3_had_source → Object (発生源)
  │    └─ F1_generated → Smell (匂い)
  ├─ Smell (匂い)
  └─ Experience (体験イベント)
       └─ F2_perceived → Smell (匂い)

重要なポイント:

  • Fragmentは直接的にEmission、Smell、Experienceを参照
  • ObjectへはEmission経由でアクセス(Fragment → Emission → Object)
  • EmissionがObjectとSmellを因果的に接続する中心的な役割

実例で学ぶデータ構造

1810年にドイツで出版された農業書「Grundsätze der rationellen Landwirthschaft」(合理的農業の原理)を例に、データ構造を見ていきましょう。

1. Source(文献)

文献の基本情報を格納するエンティティです。

SELECT ?s ?author ?date ?language
WHERE {
  ?s a <http://erlangen-crm.org/current/E33_Linguistic_Object> ;
     rdfs:label "Grundsätze der rationellen Landwirthschaft"@de ;
     <https://schema.org/author> ?author ;
     <https://schema.org/dateCreated> ?date ;
     <https://schema.org/inLanguage> ?language .
}

クエリを実行

主要プロパティ:

  • rdfs:label: タイトル
  • schema:author: 著者(Albrecht Daniel Thaer)
  • schema:dateCreated: 作成年(1810)
  • schema:inLanguage: 言語(de)
  • schema:genre: ジャンル(Household texts & recipes)
  • schema:locationCreated: 作成地
  • P106_is_composed_of: 含まれるフラグメント

2. Fragment(テキスト断片)

匂いに関する記述を含むテキストの一部です。

<fragment/8d7c492a-c8f6-5b4e-a125-e940cd9d0f6c>
  rdf:value "Sie ſind daher angefeuchtet ſchluͤpfrig und dehnbarer, 
             geben einen Thongeruch von ſich, und trocknen zu feſten 
             doch mehr zerreiblichen Klumpen zuſammen." ;
  schema:position 4 ;
  P106_is_composed_of "Sie", "Thongeruch" ;
  P67_refers_to <emission/e85bf4b6>, <smell/24ffdb8b>, <experience/037de532> ;
  P165i_is_incorporated_in <source/0039cf89> .

データを参照

テキストの意味:
「それら(粘土)は湿らせると滑りやすく、より伸縮性があり、粘土の匂いを発し、乾燥すると固いが砕けやすい塊になる。」

主要プロパティ:

  • rdf:value: 実際のテキスト内容
  • schema:position: 文献内の位置(4番目のフラグメント)
  • P106_is_composed_of: 含まれる重要な単語("Sie", "Thongeruch")
  • P67_refers_to: 参照する概念(Emission, Smell, Experience)
  • P165i_is_incorporated_in: 所属する文献(Source)

3. Emission(匂いの放出イベント)

匂いが発生する出来事を表します。EmissionはFragmentから参照され、ObjectとSmellを接続します

<emission/e85bf4b6-e1a6-5272-b7f6-16e913012f1d>
  a <http://data.odeuropa.eu/ontology/L12_Smell_Emission> ;
  F3_had_source <object/26b79790> ;
  F1_generated <smell/24ffdb8b> ;
  P92_brought_into_existence <smell/24ffdb8b> ;
  P12_occurred_in_the_presence_of <object/26b79790>, <smell/24ffdb8b> ;
  time:hasTime <time/834d8a07> ;
  P67i_is_referred_to_by <fragment/8d7c492a> .

データを参照

主要プロパティ:

  • F3_had_source: 匂いの発生源(Object "Sie")
  • F1_generated: 生成された匂い(Smell "Thongeruch")
  • P92_brought_into_existence: 存在させた匂い
  • P12_occurred_in_the_presence_of: イベント時に存在していたもの(ObjectとSmell)
  • time:hasTime: 発生時期(1810年)
  • P67i_is_referred_to_by: このEmissionを参照しているFragment

Emissionの役割:
Emissionは「どのObject(発生源)が、どのSmell(匂い)を、いつ生成したか」という因果関係を表現する中心的なイベントです。

4. Object(匂いの発生源)

匂いを発する物体や物質です。ObjectはEmissionから参照されます

<object/26b79790-fad0-56f0-acd6-ab423a460dd3>
  a <http://www.ics.forth.gr/isl/CRMsci/S10_Material_Substantial> ;
  rdfs:label "Sie" ;
  P12i_was_present_at <emission/e85bf4b6> .

この例では、"Sie"(それら)という代名詞で粘土や土壌を指しています。

タイプ:

  • S10_Material_Substantial: 物質的実体
  • S15_Observable_Entity: 観察可能な実体

主要プロパティ:

  • rdfs:label: オブジェクト名("Sie")
  • P12i_was_present_at: このオブジェクトが存在していたイベント(Emission)

接続経路:

Fragment → (P67_refers_to) → Emission → (F3_had_source) → Object

データを参照

5. Smell(匂い)

匂いそのものを表す中心的な概念です。

<smell/24ffdb8b-adcb-5c8b-8d3a-eb3c4533f93c>
  rdfs:label "Thongeruch" ;
  P92i_was_brought_into_existence_by <emission/e85bf4b6> ;
  P140i_was_attributed_by <experience/037de532> .

主要プロパティ:

  • rdfs:label: 匂いの名称(Thongeruch = 粘土の匂い)
  • P92i_was_brought_into_existence_by: この匂いを生成したEmission
  • P140i_was_attributed_by: この匂いを認識したExperience

データを参照

6. Experience(匂いの体験イベント)

人間が匂いを知覚・体験する出来事です。

<experience/037de532-9577-504f-9044-fcb759459ba2>
  F2_perceived <smell/24ffdb8b> ;
  O8_observed <smell/24ffdb8b> ;
  P140_assigned_attribute_to <smell/24ffdb8b> ;
  time:hasTime <time/834d8a07> .

主要プロパティ:

  • F2_perceived: 知覚された匂い
  • O8_observed: 観察された匂い
  • P140_assigned_attribute_to: 属性が割り当てられた対象
  • P14_carried_out_by: 体験者(Actor)

データを参照

データの流れ:完全なストーリー

1810年、ドイツ

    📖 文献「合理的農業の原理」(Source)
         ↓ P106_is_composed_of
    📄 テキスト断片 (Fragment)
      "Sie...geben einen Thongeruch von sich..."
         ↓ P67_refers_to
         ├─────────────┬─────────────┐
         ↓             ↓             ↓
    💨 放出      👃 匂い       👁️ 体験
    (Emission)   (Smell)     (Experience)
         │
         ├─ F3_had_source ─→ 🏺 物質 (Object): "Sie" = 粘土
         │
         └─ F1_generated ──→ 👃 匂い (Smell): "Thongeruch"
                                     ↑
                                     │ F2_perceived
                                     │
                               👁️ 体験 (Experience)
                                     ↓
                               👨‍🌾 観察者: Thaer

データフロー解説:

  1. Fragmentが3つの概念(Emission、Smell、Experience)を直接参照
  2. Emissionが因果関係の中心:
    • Object(発生源)から
    • Smell(匂い)を生成
  3. ExperienceがSmellを知覚
  4. ObjectはEmission経由でFragmentと間接的に接続

SPARQLクエリ実例

言語指定での検索

ドイツ語のラベルで検索する場合:

SELECT ?s ?label
WHERE {
  ?s rdfs:label "Grundsätze der rationellen Landwirthschaft"@de ;
     rdfs:label ?label .
}

画像付きビジュアルアイテムの取得

複数の画像がある場合に重複を避ける:

SELECT ?s ?label ?image
WHERE {
  ?s a <http://erlangen-crm.org/current/E36_Visual_Item> ;
     <https://schema.org/image> ?image ;
     rdfs:label ?label .
}
LIMIT 100

匂いとその発生源を取得

PREFIX od: <http://data.odeuropa.eu/ontology/>

SELECT ?smell ?smellLabel ?object ?objectLabel
WHERE {
  ?emission a od:L12_Smell_Emission ;
            od:F3_had_source ?object ;
            od:F1_generated ?smell .
  ?smell rdfs:label ?smellLabel .
  ?object rdfs:label ?objectLabel .
}
LIMIT 100

使用されているオントロジー

CIDOC-CRM

  • E33_Linguistic_Object: 言語的オブジェクト(文献)
  • E36_Visual_Item: 視覚的アイテム
  • E39_Actor: 人物(著者、観察者)
  • E53_Place: 場所
  • E77_Persistent_Item: 持続的アイテム
  • P67_refers_to: 参照する
  • P106_is_composed_of: 構成される
  • P140_assigned_attribute_to: 属性を割り当てる

CRMsci(科学観察の拡張)

  • S10_Material_Substantial: 物質的実体
  • S15_Observable_Entity: 観察可能な実体
  • O8_observed: 観察した

Odeuropa独自の拡張

  • L12_Smell_Emission: 匂いの放出
  • F1_generated: 生成した
  • F2_perceived: 知覚した
  • F3_had_source: 発生源を持つ

Schema.org

  • schema:author: 著者
  • schema:dateCreated: 作成日
  • schema:inLanguage: 言語
  • schema:genre: ジャンル
  • schema:image: 画像
  • schema:position: 位置

プロジェクトの意義

Odeuropaプロジェクトは以下の点で画期的です:

  1. 感覚データのデジタル化: 従来デジタル化が困難だった「匂い」という感覚情報を構造化
  2. 歴史研究への応用: 過去の人々が何をどう匂いと感じていたかを分析可能に
  3. Linked Dataの実践: CIDOC-CRMを用いた高度なセマンティックWeb技術の実装
  4. 学際的アプローチ: 歴史学、情報学、感覚研究の融合

まとめ

Odeuropaデータベースは、テキストマイニング、オントロジー設計、Linked Data技術を駆使して、歴史的文献から「匂い」という抽象的な概念を抽出・構造化した野心的なプロジェクトです。

CIDOC-CRMという確立された文化遺産オントロジーをベースにしながら、匂い特有の概念(Emission、Experience)を追加することで、再利用可能で拡張性の高いデータモデルを実現しています。

このようなアプローチは、他の感覚情報(音、味、触感など)のデジタル化にも応用可能であり、デジタルヒューマニティーズの新しい可能性を示しています。

参考リンク

Discussion