🗂️

ボイスコッド正規形、第4正規形、第5正規形をざっくり理解しよう

2024/10/05に公開

はじめに

データベース設計において、データの正規化は非常に重要です。特にボイスコッド正規形(BCNF)、第4正規形(4NF)、第5正規形(5NF)は、より高度な正規化を実現するための手法です。本記事では、それぞれの正規形について、具体例を交えてわかりやすく解説します。

ボイスコッド正規形 (BCNF)

ボイスコッド正規形(Boyce-Codd Normal Form、BCNF)は、第3正規形(3NF)の拡張であり、複雑な依存関係を持つテーブルに対して、さらなる正規化を行うための基準です。BCNFは、リレーションがすべての関数従属性において、決定項(キー候補)が部分的な決定項であることを禁止します。これにより、冗長性の排除とデータの整合性が確保されます。

BCNFの条件

リレーションがBCNFであるためには、すべての非自明な関数従属性において、決定項が候補キーである必要があります。

つまり、部分的なキーから他のデータが決まるような関係を無くすことで、すべての関係において、データを特定するためのキーが正しく設定されていること。

BCNFにする方法

  1. 関数従属性を見つける。
  2. 候補キーでない決定項を持つ従属性があれば、そのリレーションを分割して、新たなリレーションに移す。

以下のテーブルを考えてみましょう:

学生ID コース名 教授
1 数学 佐藤
2 英語 山田

ここで、1つの教授が複数のコースを教えることがあり、コース名から教授が一意に決まる関係があります。この場合、教授とコースに関する部分的な従属性が生じており、BCNFに適合していません。この関係を分割して、以下のようにします:

  1. 学生とコースのリレーション:
学生ID コース名
1 数学
2 英語
  1. コースと教授のリレーション:
コース名 教授
数学 佐藤
英語 山田

このように分割することで、冗長性が解消され、BCNFに適合します。

第4正規形 (4NF)

第4正規形は、マルチバリューデータの扱いにおいて冗長性を排除するために使用されます。4NFでは、多重従属性(Multivalued Dependency)が存在する場合、それらの独立した属性を別々のテーブルに分離します。これにより、データの重複や冗長性をなくし、整合性を保ちます。

4NFの条件

リレーションが4NFであるためには、非自明な多重従属性が存在しない必要があります。すべての多重従属性は、独立したリレーションに分割する必要があります。

つまり、異なる種類の情報を同じテーブルに詰め込まず、独立した情報ごとに分けることで、データの重複や混乱を防ぎます。

以下のテーブルを考えましょう:

学生ID スポーツ 楽器
1 サッカー ピアノ
1 バスケ ギター

このテーブルには多重従属性が存在しています。学生が複数のスポーツと楽器を楽しむ場合、それぞれの属性は独立しているため、以下のように分割します:

  1. 学生とスポーツのリレーション:
学生ID スポーツ
1 サッカー
1 バスケ
  1. 学生と楽器のリレーション:
学生ID 楽器
1 ピアノ
1 ギター

このようにすることで、各属性が独立し、4NFに適合します。

第5正規形 (5NF)

第5正規形は、ジョイント依存(Join Dependency)を解決するための正規形です。複数のリレーションに分割することで生じる依存関係を防ぎ、データの再結合時に元のリレーションを正確に再構築できることを保証します。5NFに分割されているテーブルは、再度結合しても情報の重複や欠損が発生しません。

5NFの条件

リレーションが5NFであるためには、リレーションが非自明なジョイント依存を持たないように分割されている必要があります。

つまり、情報を細かく分割して保存しても、それらを結合したときに元の状態に戻せることです。

例えば、以下の関係を持つテーブルがあるとします:

プロジェクト 従業員 役割
A 1 リーダー
A 2 メンバー
B 1 メンバー

このテーブルで「プロジェクト」、「従業員」、「役割」という3つの属性間にジョイント依存があります。これを5NFにするには、以下のように分割します:

  1. プロジェクトと従業員のリレーション:
プロジェクト 従業員
A 1
A 2
B 1
  1. プロジェクトと役割のリレーション:
プロジェクト 役割
A リーダー
A メンバー
B メンバー
  1. 従業員と役割のリレーション:
従業員 役割
1 リーダー
1 メンバー
2 メンバー

このように分割することで、データの結合時に元のリレーションを正確に再構築できるようになり、5NFに適合します。

まとめ

ボイスコッド正規形、第4正規形、第5正規形は、データベースの冗長性と不整合をさらに減らすための重要な手段です。それぞれの正規形を適切に理解し、データの正規化を行うことで、効率的で信頼性の高いデータベースを設計することが可能になります。データベース設計の際は、アプリケーションの要件に応じて、どの正規形まで適用すべきかを検討しましょう。

この記事が役に立ったと感じたら、他の記事もぜひご覧ください!ご質問や追加の解説が必要な場合は、気軽にコメントでお知らせください。

Discussion