🫠
CAIOを目指すための日次習慣 - 2025年10月2日
対象曜日:月曜〜土曜(平日ルーティン)
ねらい:毎日のフローを確実に回し、最小アウトプットをストックに変換する。
今日のハイライト(3行で)
- トピック1:Anthropic、次世代 AI コーディングモデル『Claude Sonnet 4.5』を発表 — 30時間集中モードが復活、強化されたエージェント性能
- トピック2:SWE-bench Verified
- トピック3:OpenAI、次世代動画生成モデル「Sora 2」を発表──自分や友人が出演する動画を生成できるiOSアプリ「Sora」も米国とカナダで同時公開
クイックチェック(5分)
AIニュースの重要トピック1件をキャッチ
- トピック:Anthropic、次世代 AI コーディングモデル『Claude Sonnet 4.5』を発表 — 30時間集中モードが復活、強化されたエージェント性能
- 示唆(1行):Claude Code、Codex CLI、Gemini CLIとAIコーディングモデルの競争は、一強を生み出すためにこの先も続きく。この競争にエンジニアが巻き込まれないために、単一のAIコーディングモデルに絞るか、全てのAIコーディングモデルに広く構えるか悩ましい。予算の取り方をサービスを固定にして用意しておくと後から環境が激変した時に追いつけなくなる可能性があるので、AIコーディングの実現を目的としたAIコーディングモデルの利用を名目として予算を確保しておくと良さそう。(会社によってはできないかも?)
社内のAI関連課題を1件発見
- 課題:新しいAI機能・サービス(Sora2)をプロダクトへ反映するまでのプロセスがイメージできない。
- 対応案:新規性による導入は失敗しそうなので、ビジネスへのインパクトを考慮した導入提案を行い、プロセスを確立する。
AISaaS/ファウンデーションモデル動向をチェック
- 注目トピック:
- 示唆(1行):
ふりかえり(5分)
- できたこと / できなかったこと
- ニュースの取得がスムーズになったことで日課のスピードが上がった。
- 文章を書くときに言葉が出てこない。
- ニュースの書いてあることだけでなく、その内容を深掘りして本質を捉えたり、抽象化して他のニュースと繋げることができていない。
- 明日の最優先1つ
- チャエン | デジライズ CEO《重要AIニュースを毎日最速で発信⚡️》さんからニュースを探す。
実施ログ
トピック候補
トピック1: Anthropic、次世代 AI コーディングモデル『Claude Sonnet 4.5』を発表 — 30時間集中モードが復活、強化されたエージェント性能
- 「世界最高のコーディングモデル」
- 複雑なエージェントの構築
- コンピュータ操作能力で大幅な性能向上
- 内部テストでは30時間を超える自律的な作業継続が確認
- 推論や数学のベンチマークでも著しい改善
- 新機能
- Claude Codeへのチェックポイント機能
- VS Code拡張と刷新されたターミナル
- Claudeアプリでのコード実行・ファイル生成機能
- Chrome拡張の一般公開(Maxユーザー向け)
- コスト
- Claude Sonnet 4.5は即日利用可能
- 価格は従来のSonnet 4と同じく入力100万トークンあたり3ドル
- 出力100万トークンあたり15ドル。
- また研究プレビューとして「Imagine with Claude」も公開
- 期間限定でリアルタイムにコードを生成するデモを体験できる。
トピック2:SWE-bench Verified
- SWE-bench Verifiedは、OpenAIが開発したAIモデルのソフトウェアエンジニアリング能力を評価するための改良されたベンチマーク。
- コンテナ化されたDocker環境を使用
- 標準化された評価プロセス
- より正確なAI能力評価
トピック3:OpenAI、次世代動画生成モデル「Sora 2」を発表──自分や友人が出演する動画を生成できるiOSアプリ「Sora」も米国とカナダで同時公開
- 物理挙動の正確さや映像の写実性が大幅に向上し、音声を同期して生成できる点が特徴
- より正確な物理シミュレーション、長尺映像における一貫性、幅広いスタイルへの対応を実現。さらに音声生成を統合し、映像にナレーションや環境音を付与できる。
AISaaS/ファウンデーションモデル動向チェック(15分)
- 主要プロバイダー動向(OpenAI/Anthropic/Google/Meta/Microsoft/Amazon):
- AISaaS: Cursor
- チェックポイント
- 新モデルリリース
- API仕様変更
- 価格改定
- セキュリティ・コンプライアンス更新
- 企業向け機能追加
社内のAI関連課題を1件発見(10分)
- 事例カード名:
- 使える場面/部門:
Discussion