プログラミング雑記 2025/09/20
休むときには休む
私も休まずに働いて心がぶっ壊れた人です。ちゃんと休みましょう。
プログラミング
Flutter
カンファレンス情報。
Python
ふむ。
Effective Python第3版の翻訳が出ます。
Djangoの本が出ます。
JetBrains
多少混乱があった印象ですが、日本語でまとめてくれています。
AI
CheomeにGeminiアシスタントが追加される。USから順次展開。日本語環境で何時になるかは実際ところ良くわからない。Geminiのアシスタントは、今後ブラウザを操作するようなタスクもこなせるエージェントに機能向上していく予定。
GoogleのGemini「photo-to-video」機能では、写真やイラストから8秒の動画をAI生成できます。用途は「イラストをアニメ化」「写真を動画化」「アイデアのビジュアル化」の3通りで、プロンプト工夫でリアルな表現や演出が可能。Google AI Pro/Ultraでは1日最大5本作成できます。
Googleの研究者が提案する「Test-Time Diffusion Deep Researcher(TTD-DR)」は、人間のリサーチ手法を模倣した新しいAI研究フレームワークです。初稿を「ノイズ」と捉え、検索による情報を繰り返し取り込みながらレポートを段階的に洗練化します。構成要素ごとの自己進化や、検索結果を活用した逐次的なドラフト修正を特徴とし、長文レポート作成や複雑なマルチホップ推論で最先端の成果を達成しています。従来手法より高品質な結果と効率を両立し、Google Cloudのサービスとしても提供されています。
Microsoft
ゲーミングCopilot。
Azure OpenAI ServiceのSoraモデルで画像や動画から動画生成を行う方法について解説しています。API仕様や実装例、特にmultipart/form-dataの使い方やinpaint_itemsの設定方法を具体例付きで紹介。公式ドキュメントの不備や注意点も述べています。
論文・その他
クラウド
Azure
俺たちの焦げログ。
OS
Windows
週末恒例のWindows Insiderのアップデート。
macOS
そこまでいる?
Discussion