🐡
機械学習エンジニア 技術面接 想定質問集
モデル・アルゴリズム関連
-
教師あり学習と教師なし学習の違いは?
- データにラベルがあるかないかの違い
-
過学習とは何ですか?
- モデルがトレーニングデータに過剰に適合し、汎化性能が低下する現象
-
バイアス・バリアントトレードオフとは?
- モデルの複雑さと予測精度のバランスを表す概念
-
L1とL2正則化の違いは?
- L1はスパース性、L2は全体的な重みの縮小を促進
-
ランダムフォレストの利点は?
- アンサンブル学習により、過学習を防ぎ、予測性能が高い
-
サポートベクトルマシン(SVM)の主な特徴は?
- マージン最大化による高い汎化性能
-
K-meansクラスタリングの仕組みは?
- データポイントを最も近い重心に割り当て、繰り返し重心を更新
-
勾配降下法の種類は?
- バッチ、確率的(SGD)、ミニバッチ勾配降下法がある
-
ディープラーニングと従来の機械学習の違いは?
- 特徴量の自動抽出と多層ニューラルネットワーク
-
決定木の欠点は?
- データに敏感で、過学習しやすい
データ関連
-
データの前処理で重要なステップは?
- 欠損値処理、特徴量スケーリング、エンコーディング
-
データの次元削減手法は?
- PCA、t-SNE、LDA
-
アンダーサンプリングとオーバーサンプリングの違いは?
- クラス不均衡を解消するためのデータ操作手法
-
クロスバリデーションの目的は?
- モデルの汎化性能を正確に評価すること
-
外れ値への対処方法は?
- 削除、変換、ロバスト統計量の使用
評価指標関連
-
分類問題の評価指標は?
- 正確度、精度、再現率、F1スコア、ROC曲線
-
回帰問題の評価指標は?
- MAE、MSE、RMSE、R²スコア
-
混同行列とは?
- 分類モデルの予測結果を表形式で表現
フレームワーク・ツール
-
Scikit-learnの主な特徴は?
- 統一的なAPIと豊富な機械学習アルゴリズム
-
Kerasとの違いは?
- TensorFlowやPyTorchと比較したニューラルネットワークの実装レベル
実践的質問
-
モデル選択の基準は?
- データの特性、計算コスト、解釈可能性
-
実務でよく直面する課題は?
- データ品質、モデルの説明可能性、継続的な性能モニタリング
最新トレンド
-
転移学習とは?
- 事前学習したモデルを別のタスクに適用する技術
-
生成系AIの現状は?
- 大規模言語モデルと画像生成モデルの急速な発展
スキル関連
- GitHubでのポートフォリオの重要性は?
- 実践的なプロジェクトと技術的スキルの証明
Discussion