🐕

【新G検定対策_実践編(第7回)】AIの社会実装とは?

2024/11/09に公開

はじめに

G検定の学習を進めている皆さん、第7回ではAIの社会実装におけるプロジェクト計画、実装・運用・評価、そしてCRISP-DMといった手法について学びます。本記事では、AIが実際のプロジェクトでどのように活用され、社会に貢献するかを理解することを目指します。

予想問題を通じて、各プロセスの要点を把握し、プロジェクトの進め方や課題解決のアプローチを実践的に学びます。問題を解くだけでなく、キーワードを簡潔にまとめたり、具体的な事例を挙げて解説することで、知識の定着とアウトプット力の向上を図ります。

第1章では社会実装に関する予想問題に挑戦し、第2章で解答と解説を通じて各プロセスの理解を深めます。第3章では、各キーワードを一言で言い表すレッスンを行い、第4章では実際の応用事例を挙げるレッスンを行います。最後の第5章では、これらのプロセスを構造化して整理し、実務で役立つ知識として定着させるためのレッスンを行います。

このレッスンを通じて、1つの問題を解くことで10問分の価値があると考えています。社会実装の知識を深め、G検定合格への自信を持って前進しましょう。

1. 予想問題

1.1. 問題1

問題文

データマイニングのプロセスモデルである CRISP-DM の6つのフェーズを正しい順序で並べたものとして、最も適切な選択肢を1つ選べ。

選択肢

  • (A) ビジネス理解 → データ理解 → データ準備 → モデリング → 評価 → 展開
  • (B) データ理解 → ビジネス理解 → データ準備 → モデリング → 評価 → 展開
  • (C) ビジネス理解 → データ準備 → データ理解 → モデリング → 展開 → 評価
  • (D) モデリング → データ準備 → データ理解 → ビジネス理解 → 評価 → 展開

1.2. 問題2

問題文

AIプロジェクトにおける PoC(概念実証)に関する説明として、最も不適切なものを1つ選べ。

選択肢

  • (A) PoC はアイデアの実現可能性を検証するために行われる。
  • (B) PoC では本番環境と同じ規模・性能のシステムを構築する必要がある。
  • (C) PoC を通じてリスクや課題を事前に洗い出すことができる。
  • (D) PoC の結果をもとに本開発に進むかどうかを判断する。

1.3. 問題3

問題文

AI を業務に適用する際の検討事項として、最も不適切なものを1つ選べ。

選択肢

  • (A) AI の導入効果とコストを比較し、投資対効果を評価する。
  • (B) AI モデルの性能が初期段階で不十分でも、改善を続ける計画を立てる。
  • (C) AI の判断に依存しすぎないよう、人間の確認プロセスを設ける。
  • (D) AI は常に完璧な精度を持つため、エラー対策は不要である。

2. 解答と解説

2.1. 問題1

解答

  • (A) ビジネス理解 → データ理解 → データ準備 → モデリング → 評価 → 展開

解説

正答理由((A))

CRISP-DM(Cross-Industry Standard Process for Data Mining)は、データマイニングプロジェクトの標準的なプロセスモデルで、以下の6つのフェーズから構成されます。

  1. ビジネス理解:ビジネス目標と要件を明確にし、データ分析の目的を定義します。
  2. データ理解:利用可能なデータを収集し、その品質や特徴を把握します。
  3. データ準備:分析に適した形にデータを加工・整備します。
  4. モデリング:データマイニング手法を適用してモデルを構築します。
  5. 評価:モデルがビジネス目標を満たしているか評価します。
  6. 展開:モデルを実際の業務環境に適用します。

したがって、選択肢 (A) の順序が正しいです。

誤答理由

  • (B) データ理解 → ビジネス理解 → データ準備 → モデリング → 評価 → 展開

    ビジネス理解がデータ理解の後になっており、プロジェクトの目的を定める前にデータを分析してしまうため、順序が不適切です。

  • (C) ビジネス理解 → データ準備 → データ理解 → モデリング → 展開 → 評価

    データ準備がデータ理解の前に来ており、データの性質を理解せずに準備を進めてしまうため、効率的ではありません。また、評価が展開の後になっており、モデルの評価をせずに展開してしまうのも問題です。

  • (D) モデリング → データ準備 → データ理解 → ビジネス理解 → 評価 → 展開

    モデリングが最初に来ており、データの理解や準備をせずにモデル構築を始めてしまうため、適切ではありません。また、ビジネス理解が後回しになっている点も不適切です。


2.2. 問題2

解答

  • (B) PoC では本番環境と同じ規模・性能のシステムを構築する必要がある。

解説

正答理由((B))

PoC(Proof of Concept)は、アイデアや概念の実現可能性を検証するためのプロセスであり、本番環境と同じ規模・性能のシステムを構築する必要はありません。必要最小限のリソースで、コンセプトが実現可能かどうかを確認します。そのため、選択肢 (B) は不適切です。

誤答理由

  • (A) PoC はアイデアの実現可能性を検証するために行われる。

    正しい説明です。PoC は新しい技術やアイデアが期待通りに動作するかを確認するために行われます。

  • (C) PoC を通じてリスクや課題を事前に洗い出すことができる。

    正しい説明です。PoC により、本開発前に潜在的な問題点を発見し、リスクを低減できます。

  • (D) PoC の結果をもとに本開発に進むかどうかを判断する。

    正しい説明です。PoC の成果に基づいて、プロジェクトの継続可否を決定します。


2.3. 問題3

解答

  • (D) AI は常に完璧な精度を持つため、エラー対策は不要である。

解説

正答理由((D))

AI はデータに基づいて学習するため、常に完璧な精度を持つわけではありません。誤分類や誤検知などのエラーが発生する可能性があります。そのため、AI の判断に対するエラー対策や、誤作動時の対応策を検討する必要があります。選択肢 (D) は誤った前提に基づいており、不適切です。

誤答理由

  • (A) AI の導入効果とコストを比較し、投資対効果を評価する。

    正しい説明です。AI 導入の妥当性を判断するために、効果とコストのバランスを評価します。

  • (B) AI モデルの性能が初期段階で不十分でも、改善を続ける計画を立てる。

    正しい説明です。AI モデルは運用しながら性能を向上させることが多く、継続的な改善計画が重要です。

  • (C) AI の判断に依存しすぎないよう、人間の確認プロセスを設ける。

    正しい説明です。AI の誤判断によるリスクを低減するために、人間のチェックを組み込むことが推奨されます。


3. レッスン1(一言で言う)

3.1.

  • CRISP-DM
    • データマイニングプロジェクトのための標準的なプロセスモデル。

3.2.

  • PoC(Proof of Concept)
    • 概念実証として、アイデアの実現可能性を検証するプロセス。

3.3.

  • AI 適用の検討における留意点
    • AI 導入時に考慮すべき効果やリスク、改善計画などのポイント。

4. レッスン2(具体例を言う)

4.1.

  • CRISP-DM の具体例
    1. 小売業での売上予測モデル構築
      • ビジネス理解:売上予測による在庫最適化を目指す。
      • データ理解:過去の販売データや顧客データを分析。
      • データ準備:データクレンジングや特徴量エンジニアリングを実施。
      • モデリング:機械学習モデル(例:ランダムフォレスト)を構築。
      • 評価:モデルの精度を検証し、ビジネス要件を満たすか確認。
      • 展開:実店舗の在庫管理システムにモデルを組み込む。
    2. 医療分野での疾患予測モデル
      • ビジネス理解:早期診断による患者の負担軽減を目指す。
      • データ理解:電子カルテや検査データを分析。
      • データ準備:個人情報の匿名化やデータ統合を行う。
      • モデリング:ディープラーニングを用いてモデルを構築。
      • 評価:医師の診断と比較し、モデルの有用性を評価。
      • 展開:診療支援システムにモデルを導入。
    3. 金融業での不正取引検知
      • ビジネス理解:不正取引の早期発見による損失防止。
      • データ理解:取引履歴や顧客情報を分析。
      • データ準備:異常値検出のためのデータ整備。
      • モデリング:アノマリー検知アルゴリズムを適用。
      • 評価:検知率や誤検知率を評価。
      • 展開:リアルタイム監視システムにモデルを実装。

4.2.

  • PoC の具体例
    1. 新しいレコメンデーションシステムの検証
      • 目的:ユーザーの興味に合わせた商品推薦の実現可能性を検証。
      • 方法:一部のユーザーデータを使用し、簡易的なモデルを構築。
      • 結果:クリック率の向上が確認でき、本開発への足がかりとする。
    2. 自動運転車の画像認識技術の検証
      • 目的:カメラ映像から道路標識の認識が可能か確認。
      • 方法:限られたデータセットでディープラーニングモデルを試作。
      • 結果:一定の認識率が得られたため、開発を進める判断材料とする。
    3. 音声アシスタントの音声認識性能の検証
      • 目的:特定の方言に対応した音声認識が可能か検証。
      • 方法:方言データを収集し、モデルに学習させる。
      • 結果:認識率向上が確認でき、本格導入を検討。

4.3.

  • AI 適用の検討における留意点の具体例
    1. 製造業での品質検査の自動化
      • 効果:検査時間の短縮と人件費の削減。
      • リスク:初期の検出精度が低い可能性があり、人間の確認が必要。
      • 対策:AI の精度が向上するまで併用運用し、データを蓄積。
    2. コールセンターでのチャットボット導入
      • 効果:顧客対応の効率化と24時間対応の実現。
      • リスク:複雑な問い合わせに対応できない可能性。
      • 対策:重要な問い合わせはオペレーターに転送し、顧客満足度を維持。
    3. 物流業での需要予測による在庫管理
      • 効果:在庫の最適化によるコスト削減。
      • リスク:予測精度の誤差による欠品や過剰在庫の発生。
      • 対策:予測結果を人間が確認し、必要に応じて調整。

5. レッスン3(構造化して記憶する)

6. 参考記事(知識編)

https://zenn.dev/tasse/articles/98a1cf882b48f1

Discussion