🌳

データ構造入門:二分木の仕組みと実装

2023/03/21に公開

はじめに

二分木は、コンピューターサイエンスやプログラミングで頻繁に使用されるデータ構造の一つです。そのため、プログラミング初心者でデータ構造について勉強中の方々にとって、二分木の仕組みや実装方法を理解することは重要です。

本記事では、二分木の基本概念や特徴、種類、実装方法、および探索、挿入、削除のアルゴリズムについて詳しく解説します。また、実践的な二分木の応用例を紹介し、理解の深まりを助けます。

それでは、二分木の世界を一緒に学びましょう!

二分木の基本概念と特徴

二分木は、ノードと呼ばれる要素と、それらをつなぐエッジと呼ばれる線で構成されるデータ構造です。二分木は以下の特性を持っています。

  • 各ノードは、高々2つの子ノードを持つことができます(左の子と右の子)。
  • 各ノードは、1つの親ノードを持つことができます。ただし、根(ルート)ノードは親ノードを持ちません。

二分木にはいくつかの用語があります。

  • 根(ルート): 二分木の一番上にあるノードで、他のすべてのノードの祖先です。
  • : あるノードからエッジをたどって直接つながる上位のノードです。
  • : あるノードからエッジをたどって直接つながる下位のノードです。左の子と右の子があります。
  • 兄弟: 同じ親を持つノードです。
  • : 子ノードを持たないノードです。

二分木の基本的な概念と特徴について学びました。次の章では、二分木のさまざまな種類とそれぞれの違いについて解説します。

二分木の種類とそれぞれの違い

二分木にはいくつかの種類があり、それぞれ異なる特徴や用途があります。以下に、主要な二分木の種類とそれぞれの違いを紹介します。

二分探索木(Binary Search Tree)

二分探索木は、各ノードに対して以下の条件が満たされる二分木です。

  • 左の子ノードの値 < 親ノードの値 < 右の子ノードの値

この性質により、データの探索や挿入、削除が効率的に行えます。

AVL木(AVL Tree):

AVL木は、二分探索木の一種であり、以下の条件が満たされるようになっています。

  • すべてのノードにおいて、左部分木と右部分木の高さの差が最大でも1である。

この性質により、木が常にバランスが保たれ、データの操作が高速に行えます。

赤黒木(Red-Black Tree)

赤黒木も、二分探索木の一種であり、特定のルールに従ってノードに色(赤または黒)が割り当てられます。この色のルールにより、木のバランスが保たれ、データの操作が高速に行えます。

ヒープ(Heap)

ヒープは、二分木の一種であり、特定の順序を満たすようにデータが格納されます。最大ヒープでは、親ノードの値が子ノードの値よりも常に大きくなります。最小ヒープでは、親ノードの値が子ノードの値よりも常に小さくなります。ヒープは、優先度付きキューの実装などに用いられます。

これらの二分木の種類とそれぞれの違いについて学びました。次の章では、二分木の実装方法について解説します。

二分木の実装方法

基本構造

二分木を実装するには、まずノードクラスと二分木クラスを作成します。以下に、Pythonを用いた実装例を示します。

class TreeNode:
    def __init__(self, key):
        self.key = key
        self.left = None
        self.right = None

class BinaryTree:
    def __init__(self):
        self.root = None

    # TODO: その他のメソッド(挿入、検索、削除など)を実装

TreeNodeクラスは、各ノードが持つべき情報(値、左の子、右の子)を保持します。
BinaryTreeクラスは、二分木全体を表し、根ノードを保持します。

次にBinaryTreeクラスに、二分探索木による探索、挿入、削除メソッドを実装していきます。

探索アルゴリズム

二分探索木の探索は、根ノードから始めます。目的の値と現在のノードの値を比較して、以下のように進めます。

  1. 目的の値が現在のノードの値と等しければ、探索成功
  2. 目的の値が現在のノードの値より小さければ、左の子ノードへ移動
  3. 目的の値が現在のノードの値より大きければ、右の子ノードへ移動
  4. これを繰り返して、目的の値が見つかるか、ノードがなくなるまで実行します。

実装は以下の通りです。

class BinaryTree:
    # 既存のコードは省略
    def search(self, key):
        return self._search_recursive(self.root, key)

    def _search_recursive(self, node, key):
        if node is None or node.key == key:
            return node
        if key < node.key:
            return self._search_recursive(node.left, key)
        return self._search_recursive(node.right, key)

挿入アルゴリズム

二分探索木への挿入は、根ノードから始めます。挿入する値と現在のノードの値を比較して、以下のように進めます。

  1. 挿入する値が現在のノードの値より小さければ、左の子ノードへ移動。左の子ノードがなければ、ここに挿入。
  2. 挿入する値が現在のノードの値より大きければ、右の子ノードへ移動。右の子ノードがなければ、ここに挿入。
  3. これを繰り返して、適切な位置に新しいノードを挿入します。
class BinaryTree:
    # 既存のコードは省略
    def insert(self, key):
        if self.root is None:
            self.root = TreeNode(key)
        else:
            self._insert_recursive(self.root, key)

    def _insert_recursive(self, node, key):
        if key < node.key:
            if node.left is None:
                node.left = TreeNode(key)
            else:
                self._insert_recursive(node.left, key)
        else:
            if node.right is None:
                node.right = TreeNode(key)
            else:
                self._insert_recursive(node.right, key)

削除アルゴリズム

二分探索木からノードを削除する場合、以下の3つの状況が考えられます。

  1. 削除するノードが葉(子ノードを持たない)の場合:そのノードを直接削除。
  2. 削除するノードが1つの子ノードを持つ場合:そのノードを削除し、子ノードを親ノードにつなげる。
  3. 削除するノードが2つの子ノードを持つ場合:右部分木の最小値を持つノード(または左部分木の最大値を持つノード)を見つけ、削除するノードの値を置き換える。そして、見つけたノードを削除。
class BinaryTree:
    # 既存のコードは省略
    def delete(self, key):
        self.root = self._delete_recursive(self.root, key)

    def _delete_recursive(self, node, key):
        if node is None:
            return node
        if key < node.key:
            node.left = self._delete_recursive(node.left, key)
        elif key > node.key:
            node.right = self._delete_recursive(node.right, key)
        else:
            if node.left is None:
                return node.right
            elif node.right is None:
                return node.left
            temp = self._find_min(node.right)
            node.key = temp.key
            node.right = self._delete_recursive(node.right, temp.key)
        return node

    def _find_min(self, node):
        current = node
        while current.left is not None:
            current = current.left
        return current

動作確認

最後に、二分探索木に値を挿入し、探索および削除を試してみます。

まずは、木の状態を表示できるようにprint_treeメソッドを追加しておきます。

class BinaryTree:
    # 既存のコードは省略

    def print_tree(self):
        if self.root is None:
            print("Empty tree.")
        else:
            self._print_tree_recursive(self.root, 0)

    def _print_tree_recursive(self, node, level):
        if node is not None:
            self._print_tree_recursive(node.right, level + 1)
            print('   ' * level + str(node.key))
            self._print_tree_recursive(node.left, level + 1)

次に実際に、二分探索木の挿入、探索、削除を実行します。

# 二分探索木のインスタンスを作成
tree = BinaryTree()

# 値を挿入
tree.insert(50)
tree.print_tree()
tree.insert(30)
tree.print_tree()
tree.insert(20)
tree.print_tree()
tree.insert(40)
tree.print_tree()
tree.insert(70)
tree.print_tree()
tree.insert(60)
tree.print_tree()
tree.insert(80)
tree.print_tree()

# 探索の例
result = tree.search(30)
if result is not None:
    print("Found:", result.key)
else:
    print("Not found")

# 削除の例
tree.delete(30)
tree.print_tree()

# 削除後の探索
result = tree.search(30)
if result is not None:
    print("Found:", result.key)
else:
    print("Not found")

このコードを実行すると、二分探索木のノードがどのように挿入・削除されるのかがよくわかります。

実践的な二分木の応用例

二分木は、様々なアプリケーションで使用されます。以下に、実践的な二分木の応用例を紹介します。

データベース管理システム(DBMS)

データベースは、データの挿入、検索、削除を高速に行う必要があります。二分探索木やその派生型(AVL木、赤黒木など)は、データベースのインデックス構造として使用されることがあります。

コンパイラやインタプリタ

コンパイラやインタプリタは、プログラムのソースコードを解析し、実行可能な形式に変換します。二分木は、シンボルテーブル(変数名や関数名などの識別子とそれらの情報を格納するデータ構造)の実装に使用されることがあります。

グラフィックス

二分木は、空間パーティショニング(3D空間を分割してオブジェクトを効率的に管理する手法)に使用されることがあります。例えば、バウンディングボリューム階層(BVH)は、レイトレーシングにおいてオブジェクトと光線の交差判定を効率化するために使用されます。

機械学習

決定木は、機械学習の分類や回帰問題に使用される二分木の一種です。決定木は、データを分割するルールを学習し、新しいデータを予測するために使用されます。

これらの応用例からもわかるように、二分木は多くの分野で重要な役割を果たしています。二分木の仕組みや実装方法を理解することは、プログラミング初心者にとって価値あるスキルです。

まとめ

本記事では、二分木の基本概念、特徴、種類、実装方法、アルゴリズム、および応用例について解説しました。これらの知識を活かして、二分木を使用したプログラムを作成してみましょう。
また、データ構造を学ぶことで、より効率的で柔軟なプログラムを設計・実装する力が身につくでしょう。今回学んだ二分木以外にも、さまざまなデータ構造が存在し、それぞれが異なる問題や状況に適しています。今後も様々なデータ構造やアルゴリズムに挑戦して、スキルを磨いていきましょう。

Discussion