😄

ChatGPT o1-previewを使ってみた

2024/09/18に公開2

はじめに

皆さんもご存じと思いますが、2024年9月12日にOpenAIから、ChatGPT-o1が発表されました!有料会員のみですが、利用可能な状態となっています。当初は1週間に5回しか使えなかったのが、現在は1週間に30回使えるようになったそうです。
ネットを見ると様々なデモが公開されていました。
https://x.com/OpenAI/status/1834278223775187374
概要から見ていきましょう。生成AIにもサポート頂いています。

概要

o1は、GPT-4oといった以前のモデルよりも優れた推論能力を持ち、科学、コーディング、数学の分野でより困難な問題を解決することができるそうです。

高度な推論能力:

o1モデルは、応答する前に問題についてじっくり考えるように訓練されており、複雑なタスクを論理的に処理し、以前のモデルよりも難しい問題を解決することができます。OpenAIのテストでは、次のモデルアップデートは、物理学、化学、生物学の難しいベンチマークタスクにおいて、博士課程の学生と同等の成績を収めています。また、数学とコーディングにも優れており、国際数学オリンピック(IMO)の予選では、GPT-4oが問題の13%しか正解できなかったのに対し、o1モデルは83%の正解率を達成しました。

思考の連鎖:

o1は、人間が難しい質問に答える前に長時間考えるのと同様に、「思考の連鎖」を用いて問題を解決します。強化学習を通じて、思考の連鎖を磨き、使用する戦略を洗練させていきます。

安全性:

新しい安全トレーニングアプローチにより、o1モデルは、安全性と整合性に関するガイドラインをより効果的に遵守することができます。安全性を測定する方法の1つは、ユーザーが安全ルールを回避しようとした場合(「脱獄」として知られる)に、モデルがどれだけうまくルールに従い続けるかをテストすることです。OpenAIの最も難しい脱獄テストの1つでは、GPT-4oは22点(0~100点満点)だったのに対し、o1プレビューモデルは84点を獲得しました。

ユースケース:

o1の強化された推論能力は、科学、コーディング、数学などの分野における複雑な問題に取り組む場合に特に役立ちます。例えば、o1は、医療研究者が細胞配列データを注釈付けしたり、物理学者が量子光学に必要な複雑な数式を生成したり、あらゆる分野の開発者が複数ステップのワークフローを構築・実行したりするために使用できます。

モデルのバリエーション:

o1-preview:

初期バージョンであり、ChatGPT Plus、Team、Enterprise、Eduユーザー、およびAPI usage tier 5の開発者が利用できます。

o1-mini:

開発者向けに、より高速で安価な推論モデル。コーディングに特に効果的です。

将来のモデル:

OpenAIは、新しいo1シリーズに加えて、GPTシリーズのモデルの開発とリリースも継続する予定です。

人間の嗜好評価:

o1-previewは、データ分析、コーディング、数学などの推論が重視される分野では、GPT-4oよりもはるかに好まれましたが、一部の自然言語タスクではGPT-4oの方が好まれました。

使ってみる

それでは使ってみましょう。
o1は細かくプロンプトを作りこむより、オープンに聞いた方が回答精度が高いようなので、ざっくり質問してみることにしました。
質問は、「人事業務のうち新卒採用の業務プロセスをより効率化したい。あるべき業務プロセスを検討してください。社員数60万人のIT企業です。」です。

人事業務のうち新卒採用の業務プロセスをより効率化したい。あるべき業務プロセスを検討してください。社員数60万人のIT企業です。

o1で聞いてみる

段階を踏んで思考しようとしている

下記スクリーンショットのように段階を踏んで思考しようとしています。最後の「仮想面接の導入」がなぜその思考になったのかは疑問ですが。。

出力結果は下記となりました。
採用プロセス意識した出力となっています。
ただし、内容が若干堅めというか論述のような文体でした。

o1の出力結果
新卒採用業務の効率化に向けて、以下のあるべきプロセスをご提案いたします。

採用ニーズの明確化と計画立案

人材要件の定義:必要なスキルセット、人数、配属先部門を明確化します。
採用スケジュールの策定:年間を通じた採用計画を立て、各プロセスの期限を設定します。
デジタルプラットフォームの活用

応募者管理システム(ATS)の導入:応募者情報の一元管理と進捗状況の可視化を行います。
オンライン求人媒体の最適化:自社ウェブサイト、SNS、就職情報サイトを効果的に活用します。
AI・自動化技術の導入

履歴書・エントリーシートの自動スクリーニング:AIを用いて応募者の適性を迅速に評価します。
チャットボットによる問い合わせ対応:よくある質問への自動応答で人事担当者の負担を軽減します。
オンライン選考プロセスの強化

ウェブ適性検査・技術試験:オンラインでのテスト実施により、時間とコストを削減します。
ビデオ面接の実施:場所にとらわれず、多くの候補者と接触できます。
データドリブンな意思決定

採用データの分析:選考プロセスの各段階でデータを収集・分析し、ボトルネックを特定します。
KPIの設定とモニタリング:応募者数、内定率、入社後の定着率などの指標を定期的にチェックします。
候補者エクスペリエンスの向上

迅速なコミュニケーション:応募から内定までの連絡をスピーディーに行い、候補者の満足度を高めます。
フィードバックの提供:選考結果に関する建設的なフィードバックを提供します。
大学・教育機関との連携強化

インターンシップの拡充:早期から優秀な学生と関係性を築きます。
共同プロジェクトの実施:大学との共同研究やイベントを通じて、企業の魅力を伝えます。
多様性とインクルージョンの推進

多様な採用チャネルの活用:国際的な人材や異なるバックグラウンドを持つ候補者を積極的に採用します。
公平・公正な選考プロセス:バイアスを排除し、客観的な評価基準を設けます。
継続的なプロセス改善

定期的なプロセスレビュー:関係者からのフィードバックを元に、プロセスを見直します。
最新テクノロジーの導入検討:RPAやブロックチェーンなど、新しい技術の活用を検討します。
法令遵守とコンプライアンスの徹底

個人情報保護の強化:応募者のデータを適切に管理します。
労働関連法規の遵守:最新の法令に基づいた採用活動を行います。
まとめ

上記のプロセスを導入することで、新卒採用業務の効率化だけでなく、採用の質向上や候補者満足度の向上が期待できます。テクノロジーの積極的な活用とデータに基づく意思決定により、社員数60万人という大規模な企業でも効果的な新卒採用が実現できます。

GPT-4oで聞いてみる

同じ質問をGPT-4oにしてみました。
o1より、個人的には頭にすっとはいる書き方な印象でした。

GPT-4oの出力結果
社員数60万人のIT企業における新卒採用の業務プロセスを効率化するためのポイントは、テクノロジーを活用しながら、大量の応募者を効率的かつ効果的に処理できる仕組みを整えることです。以下、あるべき業務プロセスを段階的に示します。

1. 採用計画の策定
戦略立案:年間の採用数、ターゲットとなる大学・学部、求めるスキルセットの定義を行い、採用戦略を立案します。
予算管理:採用プロセス全体にかかる費用(広告費、選考コスト、採用イベント費用など)を見積もり、計画します。
KPIの設定:応募者数、内定者数、リードタイムなどをKPIとして設定し、進捗を管理します。
2. 採用広報活動
ターゲティング:ターゲット層に適したメディアを選定し、SNSや求人サイト、大学キャリアセンターなどを活用します。
説明会・イベントの実施:オンライン説明会やリアルイベントを計画し、自社の魅力を伝えます。
AIを活用した広報管理:応募者の反応を分析し、どのメディアが最も効果的かをリアルタイムで把握、改善します。
3. 応募受付・書類選考
オンラインプラットフォームの整備:応募者はすべてオンラインシステムで応募可能とし、必要な情報を一元管理します。
AIを活用した初期選考:履歴書やエントリーシートの内容をAIで分析し、基準を満たす候補者を自動選別します。これにより、一次選考にかかる時間を短縮できます。
4. 選考プロセスの効率化
面接プロセスの自動化:ビデオ面接ツールや自動スケジューリングシステムを導入し、面接日程の調整や評価のデジタル化を行います。
AIによる面接分析:ビデオ面接時の表情や回答内容を分析するAIを活用し、面接官の主観を補完し、評価の公正さを確保します。
グループディスカッションやワークショップのオンライン化:大人数でのディスカッションや実技テストをオンラインで実施し、リソースの効率化を図ります。
5. 内定者フォロー
自動化されたフォローアップシステム:内定者に対して自動的に連絡を行い、内定承諾率を向上させます。これには定期的なメッセージ配信やQ&A機能を搭載したシステムが役立ちます。
内定者向けオンライン研修の実施:内定者向けに事前学習を促進するためのeラーニングを提供し、スムーズな入社準備をサポートします。
6. データの活用とフィードバック
採用データの統合管理:応募者の動向や選考の進捗をリアルタイムで管理できるダッシュボードを整備し、分析を自動化します。
フィードバックループの確立:選考プロセス全体の改善を図るため、データを基にしたフィードバックを定期的に行い、プロセスの最適化を図ります。
7. テクノロジーの活用
ATS(Applicant Tracking System)の導入:応募者管理システムを導入し、応募者の進捗状況を一元管理、リクルーターや面接官との情報共有をスムーズにします。
チャットボットの活用:応募者の質問対応を自動化し、エンゲージメントを高めるとともに、人的リソースを効率化します。
データ分析ツールの活用:応募者の履歴データ、選考データ、内定承諾データを分析し、今後の改善点や最適化のためのインサイトを得ます。
効果
このプロセスは、大規模な企業での新卒採用において、コスト削減と迅速な選考を実現し、より優れた人材を効率的に採用できるように設計されています。特に、AIやデジタルツールを活用することで、人的リソースの削減と選考精度の向上が期待されます。

比較した所感

o1とGPT-4oの比較をしてみましたが、内容的にはあまり差が見られないのと、むしろわかりやすさはGPT-4oといった印象でした。
1回の検証だったのでなんとも言えないところではありますが、o1とGPT-4oとで得意不得意がありそうで、o1をより活用できるユースケースを探していきたいと思いました。

Difyで早速つかえるようになっていた(が、使えず)

Difyでもo1とo1 miniが使えるようになっていました。

ただ、現時点でTier5のユーザではないと使えないようで、残念ながらエラーになってしました。

おわりに

いかがでしたか。今回o1については見ていきましたが、LLMの規模を広げて精度を上げるところから、アプローチを変えて自動的に段階的に考えて精度を上げる可能性が見えてきていると考えています。一方でまだまだ活用余地が見いだせておらず、o1を活用できるユースケースを探していければと思いました。
引き続き、生成AI界隈を追っていけたらと思います!

Accenture Japan (有志)

Discussion

shinoyamadashinoyamada

私も、Difyでo1の選択肢が見えて一瞬テンション上がったのですが、全然課金していないのでAPIから使うことができず…(ロジカルシンキングが必要になりそうなワークフローで使いたかったのですが)
一度解約したChatGPT Plusに入りなおすかどうか、非常に迷っています笑