京都大学谷口研究室M1 人間の知能に興味があります.現在は特に,人間がどのように視覚と言語情報を統合しているのかを理解することで,Vision Language Mode (VLM) が人間による明示的な監視無しで画像とテキストのアライメントを強化するというような研究をしています.