🐕

🔰【無料】Claude3の始め方(ChatGPTを超えた生成AIの登場!)

2024/03/14に公開

はじめに

ChatGPTを超えたと話題のClaude3ですが、どんなものか試してみました。

ほんとうにChatGPTを超えたのでしょうか?

まずは始めるまでの方法をまとめておきました。

https://www.anthropic.com

Claude3とは?

Anthropic社がリリースしたLLMです。

ChatGPTのライバルと考えればわかりやすいと思います。

Claude3モデルファミリー

モデルは3種類あります。

  • Haiku
  • Sonnet
  • Opus

Opusが一番性能がよいモデルです。価格もその分一番高いです。

性能比較

当社の最もインテリジェントなモデルである Opus は、学部レベルの専門知識 (MMLU)、大学院レベルの専門推論 (GPQA)、基礎数学 (GSM8K) など、AI システムの一般的な評価ベンチマークのほとんどで他のモデルよりも優れています。複雑なタスクに関して人間に近いレベルの理解力と流暢さを示し、一般知能のフロンティアをリードします。
すべてのClaude 3モデルは、分析と予測、微妙なコンテンツの作成、コード生成、およびスペイン語、日本語、フランス語などの英語以外の言語での会話における機能の向上を示しています。
以下は、機能の複数のベンチマーク [1] における Claude 3 モデルと競合モデルの比較です。

Anthropicが公開した情報だけあって、すべての領域においてGPT-4を凌駕しています。

一番したのモデルHaikuでもGPT-3.5より性能は良さそうです。

GPTはいつも時点のモデルかまでは不明ですが、同等以上の性能はありそうです。

ビジョンモデル性能比較

Claude 3 モデルは、他の主要モデルと同等の高度なビジョン機能を備えています。写真、チャート、グラフ、技術図など、幅広いビジュアル形式を処理できます。私たちは、この新しいモダリティを企業顧客に提供できることに特に興奮しています。企業顧客の中には、ナレッジ ベースの最大 50% を PDF、フローチャート、プレゼンテーション スライドなどのさまざまな形式でエンコードしている人もいます。

ビジョンモデルも軒並みGPT-4Vを超えています。

Claude3始め方

アカウント作成
以下にアクセスします。

https://www.anthropic.com/api

「Get started now」をクリック

任意の方法でアカウントを作成します。

必要な情報を入力して「Continue」を押します。

ログインすると以下の画面が表示されます。

「Get started testing Claude with $5 in free credits」の「Claim」をクリックします。

5ドル分は無料で使えるようですね。

電話番号を聞かれるので入力します。

その後、また最初の画面に戻りますので、「Start Prompting with Claude」をクリックします。

すると以下のような画面が出力されます。

とりあえず挨拶してみましょう。

「こんにちは」とチャットしてみました。

モデルは左側のプルダウンメニューから選択できます。

Usageの確認

「Usage」メニューを見てみましょう。

さきほど挨拶した分がカウントされていました。
なんとなく、ChatGPTのOpenAIと同じようなメニュー構成ですね。

「Plans & Billing」メニューを見てみます。
さきほどの5ドル分が表示されます。

1回使った程度では変化ないようですね。

APIキー作成

さて、本命のAPIを見てみましょう。
「API Keys」メニューからAPIキーが作成できます。

キーの名前を入力して「Create Key」をクリックします。

その後、画面にAPIキーが表示されますのでコピーして保管しておきましょう。

APIの利用

以下のドキュメントを参考にします。

https://docs.anthropic.com

インストール

pip install anthropic

コード

import anthropic

client = anthropic.Anthropic(
      api_key="ここにAPIキーを貼り付けてください",
)

message = client.messages.create(
        model="claude-3-opus-20240229",
        max_tokens=1024,
        messages=[
            {"role": "user", "content": "hello, Claude"}
        ]
)
print(message.content)

messagesの形式もOpenAIと同じなので違和感なく使えます。

実行

[ContentBlock(text='Hello! How can I assist you today?', type='text')]

無事回答が得られました。

ログの確認

「Logs」メニューをクリックすると、実行したときのトークン数などのログが確認できます。

Meamaid出力

挨拶だけでは面白くないのでMermaid出力でも試してみましょう。

コード

import anthropic

client = anthropic.Anthropic(
        api_key="APIキー",
)


prompt="""
日本の未来のロードマップをMermaidでマインドマップで教えてください
"""

message = client.messages.create(
        model="claude-3-opus-20240229",
        max_tokens=1024,
        messages=[
            {"role": "user", "content": prompt}
        ]
)
print(message.content)

実行

[ContentBlock(text='```mermaid\nmindmap\n  日本の未来ロードマップ\n    少子高齢化への対応\n      労 働力の確保\n        女性の社会進出支援\n        高齢者の就労支援\n        外国人労働者の受け入れ\n      社会保障制度の改革\n        年金制度の持続可能性確保\n        医療・介護の効率化\n    技術革新の推進\n      Society 5.0の実現\n        AI・IoTの活用\n        スマートシティの構築\n      研究開発投資の拡大\n        基礎研究の強化\n        産学連携の促進\n    グローバル化への対応\n      貿易・投資の自由化\n        TPP・RCEPの活用\n        対外直接投資の促進\n      国際協調の推進\n        SDGsの 達成に向けた取り組み\n        国際機関での役割強化\n    地方創生の推進\n      地域経済の活性化\n        観光資源の活用\n        地場産業の振興\n      地方への人材還流\n        テレワークの推進\n        UIJターンの支援\n    教育改革の推進\n      グローバル人材の育成\n        英語教育の強化\n         海外留学の促進\n      ICT教育の充実\n        プログラミング教育の必修化\n        EdTechの活用\n     環境・エネルギー政策の推進\n      脱炭素社会の実現\n        再生可能エネルギーの普及\n        原子力発電の段階的廃止\n      循環型経済の構築\n        リサイクルの推進\n        食品ロス削減の取り組み\n```\n\nこのマインドマップは、日本の未来に向けた主要な課題と取り組みを示しています。少子高齢化への対 応、技術革新の推進、グローバル化への対応、地方創生の推進、教育改革の推進、環境・エネルギー政策の推進といった大きなテーマを設定し、それぞれの下に具体的な施策を配置しました。\n\nもちろん、これはあくまで一例であり、他にも重要な課題や取り組みがあるかもしれません。また、実際の政策立案においては、各テーマ間の優先順位付けや、具体的な数値目標の設定なども必要になるでしょう。しかし、このマインドマップが、日本の未来を考える上での一助になれば幸いです。', type='text')]

ん、何かおかしいですね・・・

NotionのMermaidビューで見てもちゃんと表示されませんでした。

ClaudeはMermaid苦手なのかな。

ChatGPTでも試してみました。

ChatGPTの結果

画像が小さくなってしまいましたが、いちおう出力されました。
ChatGPTを超えたと噂のClaude3ですが、得意不得意はあるのかもしれませんね。

まとめ

今回は始め方ということでAPIが使えるところまで試してみました。
噂のChatGPT超えの性能はまだ試せていませんが、情報集めながら検証していこうと思います。

Discussion