🐡

機械学習エンジニア 技術面接 想定質問集

2025/03/05に公開

モデル・アルゴリズム関連

  1. 教師あり学習と教師なし学習の違いは?

    • データにラベルがあるかないかの違い
  2. 過学習とは何ですか?

    • モデルがトレーニングデータに過剰に適合し、汎化性能が低下する現象
  3. バイアス・バリアントトレードオフとは?

    • モデルの複雑さと予測精度のバランスを表す概念
  4. L1とL2正則化の違いは?

    • L1はスパース性、L2は全体的な重みの縮小を促進
  5. ランダムフォレストの利点は?

    • アンサンブル学習により、過学習を防ぎ、予測性能が高い
  6. サポートベクトルマシン(SVM)の主な特徴は?

    • マージン最大化による高い汎化性能
  7. K-meansクラスタリングの仕組みは?

    • データポイントを最も近い重心に割り当て、繰り返し重心を更新
  8. 勾配降下法の種類は?

    • バッチ、確率的(SGD)、ミニバッチ勾配降下法がある
  9. ディープラーニングと従来の機械学習の違いは?

    • 特徴量の自動抽出と多層ニューラルネットワーク
  10. 決定木の欠点は?

    • データに敏感で、過学習しやすい

データ関連

  1. データの前処理で重要なステップは?

    • 欠損値処理、特徴量スケーリング、エンコーディング
  2. データの次元削減手法は?

    • PCA、t-SNE、LDA
  3. アンダーサンプリングとオーバーサンプリングの違いは?

    • クラス不均衡を解消するためのデータ操作手法
  4. クロスバリデーションの目的は?

    • モデルの汎化性能を正確に評価すること
  5. 外れ値への対処方法は?

    • 削除、変換、ロバスト統計量の使用

評価指標関連

  1. 分類問題の評価指標は?

    • 正確度、精度、再現率、F1スコア、ROC曲線
  2. 回帰問題の評価指標は?

    • MAE、MSE、RMSE、R²スコア
  3. 混同行列とは?

    • 分類モデルの予測結果を表形式で表現

フレームワーク・ツール

  1. Scikit-learnの主な特徴は?

    • 統一的なAPIと豊富な機械学習アルゴリズム
  2. Kerasとの違いは?

    • TensorFlowやPyTorchと比較したニューラルネットワークの実装レベル

実践的質問

  1. モデル選択の基準は?

    • データの特性、計算コスト、解釈可能性
  2. 実務でよく直面する課題は?

    • データ品質、モデルの説明可能性、継続的な性能モニタリング

最新トレンド

  1. 転移学習とは?

    • 事前学習したモデルを別のタスクに適用する技術
  2. 生成系AIの現状は?

    • 大規模言語モデルと画像生成モデルの急速な発展

スキル関連

  1. GitHubでのポートフォリオの重要性は?
    • 実践的なプロジェクトと技術的スキルの証明

Discussion