<p>正規化は RDB を使用するときの一般的な設計方法のこと。<br>
正規化自体知ってはいたのだが、定義や手法をちゃんと調べたことがなかったので、<br>
個人的に整理をしてみた。</p>
<h2 id="%E6%AD%A3%E8%A6%8F%E5%8C%96(normalization)%E3%81%A8%E3%81%AF">
<a class="header-anchor-link" href="#%E6%AD%A3%E8%A6%8F%E5%8C%96(normalization)%E3%81%A8%E3%81%AF" aria-hidden="true"></a> 正規化(Normalization)とは</h2>
<p>データの重複をなくし、整合的にデータを取り扱えるようにデータベースを設計すること。<br>
正規化の段階にはいくつかあり、一般業務では第３正規形まで準拠すれば良しとされる。<br>
※第 3 正規形以上の正規形は「高次正規系」と呼ばれる</p>
<ul>
<li>非正規形</li>
<li>第 1 正規形</li>
<li>第 2 正規形</li>
<li>第 3 正規形</li>
<li>※ボイス・コッド正規形（第 3.5 正規形）</li>
<li>第 4 正規形</li>
<li>第 5 正規形</li>
</ul>
<h2 id="%E3%81%AA%E3%81%9C%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%8C%E5%BF%85%E8%A6%81%E3%81%AA%E3%81%AE%E3%81%8B">
<a class="header-anchor-link" href="#%E3%81%AA%E3%81%9C%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%8C%E5%BF%85%E8%A6%81%E3%81%AA%E3%81%AE%E3%81%8B" aria-hidden="true"></a> なぜ正規化が必要なのか</h2>
<p>なぜ正規化が必要なのかは以下のような理由がある。</p>
<h3 id="1.-%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E4%B8%80%E8%B2%AB%E6%80%A7%E3%82%92%E4%BF%9D%E6%8C%81%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#1.-%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E4%B8%80%E8%B2%AB%E6%80%A7%E3%82%92%E4%BF%9D%E6%8C%81%E3%81%99%E3%82%8B" aria-hidden="true"></a> 1. データの一貫性を保持する</h3>
<p>重複データを減らすことにより、データに一貫性を維持できる。<br>
重複しているデータ同士が少し違う値を持っていると整合性が取れなくなる場合がある。</p>
<p>ex)<br>
「山田太郎」と「山田 太郎」のどっちが正しいのか判断できない。<br>
RDB ではスペースが入るだけで別のデータとして扱われてしまう。</p>
<h3 id="2.-%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%86%97%E9%95%B7%E6%80%A7%E3%82%92%E6%8E%92%E9%99%A4%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#2.-%E3%83%87%E3%83%BC%E3%82%BF%E3%81%AE%E5%86%97%E9%95%B7%E6%80%A7%E3%82%92%E6%8E%92%E9%99%A4%E3%81%99%E3%82%8B" aria-hidden="true"></a> 2. データの冗長性を排除する</h3>
<p>無駄な重複データを減らすことにより、<br>
無駄なデータ領域を減らしたり、面倒な更新処理を短縮することができる。<br>
サービスやデータ量が大きくなればなるほど恩恵は大きくなる。</p>
<h3 id="3.-%E3%83%87%E3%83%BC%E3%82%BF%E6%9F%94%E8%BB%9F%E6%80%A7%E3%80%81%E6%8B%A1%E5%BC%B5%E6%80%A7%E3%81%AE%E5%90%91%E4%B8%8A">
<a class="header-anchor-link" href="#3.-%E3%83%87%E3%83%BC%E3%82%BF%E6%9F%94%E8%BB%9F%E6%80%A7%E3%80%81%E6%8B%A1%E5%BC%B5%E6%80%A7%E3%81%AE%E5%90%91%E4%B8%8A" aria-hidden="true"></a> 3. データ柔軟性、拡張性の向上</h3>
<p>テーブルが適切に分割されているため、データの拡張が容易になる。<br>
将来の追加や変更などにも柔軟に対応することができる。</p>
<h2 id="%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%99%E3%82%8B%E3%81%93%E3%81%A8%E3%81%AE%E3%83%87%E3%83%A1%E3%83%AA%E3%83%83%E3%83%88">
<a class="header-anchor-link" href="#%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%99%E3%82%8B%E3%81%93%E3%81%A8%E3%81%AE%E3%83%87%E3%83%A1%E3%83%AA%E3%83%83%E3%83%88" aria-hidden="true"></a> 正規化することのデメリット</h2>
<p>正規化することのデメリットもある。</p>
<h3 id="1.-%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E8%A8%AD%E8%A8%88%E3%81%AE%E8%A4%87%E9%9B%91%E5%8C%96">
<a class="header-anchor-link" href="#1.-%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E8%A8%AD%E8%A8%88%E3%81%AE%E8%A4%87%E9%9B%91%E5%8C%96" aria-hidden="true"></a> 1. データベース設計の複雑化</h3>
<p>正規化のプロセス自体が複雑なので、設計自体に専門的な知識が必要になる。<br>
そもそも開発者がデータベースへの知見を持っている必要がある。</p>
<h3 id="2.-%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%A4%87%E9%9B%91%E5%8C%96">
<a class="header-anchor-link" href="#2.-%E3%82%AF%E3%82%A8%E3%83%AA%E3%81%AE%E8%A4%87%E9%9B%91%E5%8C%96" aria-hidden="true"></a> 2. クエリの複雑化</h3>
<p>複数テーブルに分割されるため、関連テーブル同士を結合が前提となる。<br>
これによりクエリが複雑化し、クエリの実行時間が増加する可能性がある。<br>
大量のデータがある場合には、パフォーマンスの低下も引き起こしかねない。</p>
<h2 id="%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%AE%E6%89%8B%E6%B3%95">
<a class="header-anchor-link" href="#%E6%AD%A3%E8%A6%8F%E5%8C%96%E3%81%AE%E6%89%8B%E6%B3%95" aria-hidden="true"></a> 正規化の手法</h2>
<p>非正規形〜第三正規形までの正規化手法。</p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>例で使用するテーブルは「達人に学ぶ DB 設計」に記載しているテーブルを参考にしてます。</p>
</div></aside>
<h3 id="%E9%9D%9E%E6%AD%A3%E8%A6%8F%E5%BD%A2">
<a class="header-anchor-link" href="#%E9%9D%9E%E6%AD%A3%E8%A6%8F%E5%BD%A2" aria-hidden="true"></a> 非正規形</h3>
<p>正規化が行われていない状態。<br>
1 行の中に複数の折り返し項目が存在していると、非正規形となる。<br>
正規化をするにはまず、「1 つのフィールドに 1 つの値」の原則を守る必要がある。</p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/0b0669b99df4-20240218.png" width="400" loading="lazy" class="md-img"><br>
<em>社員テーブル</em></p>
<h3 id="%E7%AC%AC-1-%E6%AD%A3%E8%A6%8F%E5%BD%A2">
<a class="header-anchor-link" href="#%E7%AC%AC-1-%E6%AD%A3%E8%A6%8F%E5%BD%A2" aria-hidden="true"></a> 第 1 正規形</h3>
<p>「1 つのフィールドに 1 つの値」の原則が守られている状態。<br>
「1 つのフィールドに 1 つの値」の値のことを<strong>スカラ（Scalar）値</strong>という。</p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/a4ff1f0ae636-20240218.png" width="600" loading="lazy" class="md-img"><br>
<em>社員テーブル</em></p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>最低限スカラ値の状態ではないと、<strong>関数従属性</strong>がないとして RDB として認められない。<br>
関数従属性とは、関数「Y = f(X)」のように、X が決まると Y が決まる状態のこと。</p>
<p>RDB でいうと、以下のように書くことができる。<br>
{X} → {Y}</p>
<p>上記テーブルで言うと以下のような関数従属性になる。<br>
{会社 ID, 社員 ID} → {社員名}</p>
</div></aside>
<h3 id="%E7%AC%AC-2-%E6%AD%A3%E8%A6%8F%E5%BD%A2">
<a class="header-anchor-link" href="#%E7%AC%AC-2-%E6%AD%A3%E8%A6%8F%E5%BD%A2" aria-hidden="true"></a> 第 2 正規形</h3>
<p>主キーの一部にある関数従属性を解消した状態。<br>
<strong>≒ 部分関数従属を解消し、完全関数従属になっている状態。</strong></p>
<p>・主キーの一部の関数従属性 → <strong>部分関数従属</strong><br>
・部分関数従属を解消した状態 → <strong>完全関数従属</strong></p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/c80086688ce9-20240218.png" width="500" loading="lazy" class="md-img"><br>
<em>社員テーブル</em></p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/ce56bf0dbeb0-20240218.png" width="250" loading="lazy" class="md-img"><br>
<em>会社テーブル</em></p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>第 1 正規形の社員テーブルで以下の従属性があったのだが、<br>
{会社 ID, 社員 ID} → {社員名}</p>
<p>主キーの会社 ID にも関数従属性（部分関数従属）があった。<br>
{会社 ID} → {会社名}</p>
<p>この部分関数従属を解消するため、<br>
社員テーブルを分割して会社テーブルを作成した。</p>
</div></aside>
<h3 id="%E7%AC%AC-3-%E6%AD%A3%E8%A6%8F%E5%BD%A2">
<a class="header-anchor-link" href="#%E7%AC%AC-3-%E6%AD%A3%E8%A6%8F%E5%BD%A2" aria-hidden="true"></a> 第 3 正規形</h3>
<p>テーブル内に存在する段階的な関数従属性を解消した状態。<br>
<strong>≒ 推移的関数従属解消した状態。</strong></p>
<p>・テーブル内に存在する段階的な関数従属性　 → 　<strong>推移的関数従属</strong></p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/93e764702b22-20240218.png" width="500" loading="lazy" class="md-img"><br>
<em>社員テーブル</em></p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/217eb5b8afbc-20240218.png" width="250" loading="lazy" class="md-img"><br>
<em>会社テーブル</em></p>
<p><img src="https://storage.googleapis.com/zenn-user-upload/6ebd622a6ab3-20240218.png" width="250" loading="lazy" class="md-img"><br>
<em>部署テーブル</em></p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>第 2 正規形では部署 ID と部署名にも段階的な関数従属性（推移的関数従属）があった。<br>
{会社 ID, 社員 ID} → {部署 ID} → {部署名}</p>
<p>この推移的関数従属を切り出して部署テーブルとするのが、第 3 正規形。</p>
</div></aside>
<h2 id="%E5%8F%82%E8%80%83">
<a class="header-anchor-link" href="#%E5%8F%82%E8%80%83" aria-hidden="true"></a> 参考</h2>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__066d2f2dfcdc7" src="https://embed.zenn.studio/card#zenn-embedded__066d2f2dfcdc7" data-content="https%3A%2F%2Fwww.shoeisha.co.jp%2Fbook%2Fdetail%2F9784798124704" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://www.shoeisha.co.jp/book/detail/9784798124704" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://www.shoeisha.co.jp/book/detail/9784798124704</a></p>
<p><span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__c90d3f9e62bc8" src="https://embed.zenn.studio/card#zenn-embedded__c90d3f9e62bc8" data-content="https%3A%2F%2Foss-db.jp%2Fdojo%2Fdojo_info_04" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://oss-db.jp/dojo/dojo_info_04" style="display:none" target="_blank" rel="nofollow noopener noreferrer">https://oss-db.jp/dojo/dojo_info_04</a></p>


データベースの正規化

3. データ柔軟性、拡張性の向上

Discussion