ヘッドウォータース

🤖

Azure AI Studio の Benchmarks がすごい件

2024/05/11に公開

テクノロジー

Azure AI Studio

目的

Azure AI Studio の Benchmarks を使ってみたので、メモしておく
まずはサクッとAIモデルを評価したい人に呼んでほしい

事前準備

Azure AI Studioの予備知識を入れたい人はこちらを確認

Benchmarksで簡単にできること

モデルの性能を比較するテストや評価を行うことができる
AI モデルが特定のタスクやデータセットにおいてどのくらい機能するかを可視化できる

Benchmarksを触ってみる

Azure AI Studioはこちらからアクセス
「エクスプローラー」タブをクリック
タスクは「質疑応答」、コレクションは馴染みの深い「AzureOpenAI」を選択
モデルはこれまた馴染みの深い「Gpt-35」と「Gpt‐4」を選択
「リスト」をクリック、モデルを閉じてAverageで比較してみる
比較！
流暢性とGPTSimilarityとコヒーレンスも一応確認

データセット：gsm8kに絞って確認。（gsm8kは、文章問題を含む小学生レベルの算術演算を学習しているモデル）

感想

今回は、馴染みの深いGPT系で確認したので、予想通りの結果となった
モデル選定の第一歩目としては十分に使えそう

ヘッドウォータース

株式会社ヘッドウォータースのテックブログです。 AIエージェント、生成AI、LLM、Azureのサービスや資格、IoT、XR系などData&AIとApp modernizeに関して幅広く投稿します！

Discussion