re:Invent 2025: Sanofiが語る製薬業界におけるExplainable AIの実践とRAISEフレームワーク
はじめに
海外の様々な講演を日本語記事に書き起こすことで、隠れた良質な情報をもっと身近なものに。そんなコンセプトで進める本企画で今回取り上げるプレゼンテーションはこちら!
re:Invent 2025 の書き起こし記事については、こちらの Spreadsheet に情報をまとめています。合わせてご確認ください
📖 re:Invent 2025: AWS re:Invent 2025 - Can Your AI Show Its Work? Healthcare's Critical Imperative for Explainable AI
この動画では、DataikuのSVPであるJedとSanofiのKaoutarが、製薬業界におけるAI活用について議論しています。Sanofiは発見から治療までのタイムラインを15年から短縮することを目標に、R&D、製造、商業の全領域でAIを展開しています。古典的なAIとGen AIを使い分け、規制当局への申請にはGen AI、収率最適化には時系列MLを活用しています。説明可能性を重視し、RAISEフレームワークという責任あるAIの枠組みを構築。AWS、Dataiku、Snowflakeの3つのプロバイダーでAI Foundryを形成し、データのリネージ、バイアス監視、追跡可能性を確保しています。Dataikuは科学者とビジネスユーザーをつなぐ玄関口として機能し、AI対応データの実現に貢献しています。厳格なガバナンス体制のもと、Excomレベルの承認と3ヶ月での価値実証を必須とし、56のユースケースを2つに絞り込んだ事例も紹介されています。
※ こちらは既存の講演の内容を最大限維持しつつ自動生成した記事になります。誤字脱字や誤った内容が記載される可能性がありますのでご留意下さい。
本編
Sanofiにおける大規模AI活用の戦略:治療法発見までの距離を短縮する取り組み
皆さんこんにちは、私はJedです。DataikuでAIとプラットフォームのSVPを務めています。そして本日はSanofiのKaoutarと一緒に来ています。今日は説明可能性、データパイプライン、そして製薬業界が今日どのようにAIを活用しているかについて少しお話しします。では、まずSanofiが現在どのようにAIを使用しているか、そしてより一般的に、大手製薬会社であるということはどういうことなのか、この業界における目標は何なのかについて、教えていただけますか?
はい、まずSanofiの声明は、私たちはAIを大規模に活用するR&Dバイオ製薬会社であるということです。基本的に、私たちの野望は治療法と発見の間の距離、つまりタイムラインを短縮することです。なぜなら通常、分子の探索を始めてから市場に出るまで約15年かかるからです。ですから私たちにとってAIは、この距離を短縮するための技術であり機会の一つなのです。
つまり、平たく言えば、常にいくつかの分子に対して非常に大きな賭けをしなければならないということですよね。そして、その賭けが報われるかどうかを見極めるのに非常に長い時間がかかる。ラスベガスと賭けの話をしていますが、これは非常に賭けの要素が大きい業界です。では、AIはそのプロセス全体をどのように最適化できるのでしょうか?どこに適合するのでしょうか?
まず、バリューチェーンはもちろんR&Dから始まり、製造供給、それから商業側、そして従業員体験へと続きます。ですから私たちの賭けは、まずAIについてです。それはあらゆる場所にあります。R&Dや商業、製造のどこかに絞るという選択はしませんでした。すべてに適用しています。そしてもちろん、AIの成果をすぐに見ることができるクイックウィンもあります。研究のような他のものについては、長期的なものです。
あなたが見てきたクイックウィンの良い例は何ですか?クイックウィンは、例えば商業や製造で見られます。例を挙げると、収率最適化などがあります。これはAIを使用してリアルタイムで見ることができるもので、サプライチェーンをどのように最適化できるか、科学者と現場をどのように結びつけることができるかといったことです。このようなものがクイックウィンです。あるいは営業担当者が、どのようにより速く意思決定できるか、どのように適切なコンテンツを適切なHCPに届けることができるかといったことです。そして長期的には、分子の発見と研究により重点が置かれます。しかし、それについても、今日私たちは低分子の70%、基本的には化学的なものにAIを使用しています。
すごいですね。そしてAIと言うとき、私たちは古典的なAI、Gen AI、両方について話しているのでしょうか?そこの線引きはどこにあるのでしょうか?基本的にはすべてです。なぜなら、私たちにとってそれは誇大広告ではないからです。スケーラビリティ、整合性、そしてインパクトについてなのです。ですから、インパクトと成果のためにテクノロジーを活用できる場所であれば、両方です。古典的なAIがうまく機能するユースケースやドメインもあります。他のものでは、Gen AIが大きな機会であり、AIエージェントは他のユースケースにはより適しています。
例えば、Gen AIについて例を挙げることができます。今日の規制当局への申請に関連するすべてのことについて、Gen AIは大きな機会です。文書の記入を加速します。セクションに正しい情報を配置することを加速し、さらに今日の規制当局もそれに対してオープンです。他のもの、例えば歩留まり最適化のようなものでは、古典的なAIの時系列MLがうまく機能します。では、なぜGen AIに行く必要があるのでしょうか?コスト、労力、そして採用がより複雑だからです。
つまり、30年間古典的なAIに投資してきたのに、Gen AIが出てきたからといって、それをすべて捨てる理由はないということですね。その通りです。しかし、それはビジネスから要望が来ないという意味ではありません。ああ、Gen AIに機会が見えます。Gen AIを使えますか?Gen AIが最も適切なものなのか、古典的なAIなのか、あるいは単なる高度な分析なのかを判断するのに役立つ目標があるのです、よね?
製薬業界における説明可能性とAI対応データの重要性:RAISEフレームワークとAI Foundry
そして説明可能性はここでどのように関わってくるのでしょうか?説明可能性は非常に話題になっている用語だと知っていますし、もちろん製薬では、成功だけでなく、なぜ成功が起こっているのかを本当に理解する必要があります。では、製薬における説明可能性とは何を意味し、あなたにとってどれほど重要なのでしょうか?
製薬の領域には根本的なことがあります。なぜなら、それは本当に規制された領域だからです。そしてその最初のステップはAI対応データです。データそのものから始まり、そして成果へと進みます。これらの成果は信頼され、安全で、倫理的で、公正で、環境的に持続可能で、そしてもちろん透明で説明可能である必要があります。
ここに説明可能性があります。これがSanofiで私たちが持っているもので、RAISEフレームワークと呼んでいます。基本的にはSanofiにおける責任あるAIで、全体的な柱の調整を尊重しています。そして、はい、説明可能性はその一部です。そして面白いことに、Gen AIについて話すとき、説明可能性とGen AIの間には矛盾があるんですよね?本質的にブラックボックスですよね?
ええ、その通りです。では、このGen AIのブラックボックスから説明可能性を引き出すために、どのようなツールやプロセスを使っていますか?私たちはAI Foundryと呼ぶものを構築しました。基本的にすべてのAI製品は、このAI Foundryにあるエコシステムを使用しています。3つの柱があります。もちろんAWSです。なぜならAWSに言及しなければ、私たち二人とも今日は退場だと思いますので。AWSがあり、Dataikuがあります。データに関するすべてのこと、データの取り込み、その説明可能性、データに存在しうるバイアス、そして私たちが使用しているMLや基盤モデルの監視について、あなた方を使っています。そしてSnowflakeがあります。つまり基本的に3つのプロバイダーで、先ほど述べたRAISEフレームワークの全体的な柱を構築しています。
では、その3つのプロバイダーを分けて説明してください。それぞれが何をするのか説明してください。インフラストラクチャにはAWS、データベースにはSnowflake、そしてDataiku。Dataikuは何に使っていますか?Dataikuは、科学者、データ担当者、ビジネスユーザーの間をつなぐために使っています。つまり基本的に、すべての科学者のペルソナ、製造サプライチェーンの専門家、商業の専門家、R&Dの専門家にとっての玄関口なんです。彼らはGen AIを使っているのか他の何かを使っているのかは気にしませんが、データにアクセスする必要があり、データを監視する必要があり、MLモデルを構築してそれを使用する必要があります。その分野の専門家でなくてもです。
なるほど。あなたのプロセスで私が理解していることの一部は、AI対応データを持ちたいという願望です。以前の会話で何度かそのフレーズをおっしゃっていました。必要なもの、それが何を意味するのか、もっと教えてください。AI対応データとは何ですか?AI対応データとは、まず、データはビジネスとITまたはデジタルチームの間の共有された責任です。次に、データは既知です。どこにあるかわかっていて、見つけることができます。また、データが共有可能であることも重要です。なぜなら、私たちは新しい時代に移行しており、自分のビジネスのために製品を構築するのではなく、製品の価値は部門横断的なので、意思決定を行うために他の製品と共有可能である必要があり、最終的にはすべての人が利用できる必要があるからです。
そして、データ自体に関連することがあります。それは、データが安全で、高品質で、バイアスがなく、信頼でき、安全であるということです。それが私の言うAI対応データです。安全で、高品質で、バイアスがなく、信頼でき、安全であることは非常に理にかなっています。そしてそれを行うために、私たちが使っているもの、あなた方を使って、データのリネージをエンドツーエンドで持っていることを示す必要があります。そして製品間で成果を共有でき、もちろんアクセス制御を伴ってデータを共有できますが、私たちが行っていることの追跡可能性と説明可能性、そしてなぜ、どのようにしてこの成果を得たのかを持つことができます。
明確なガバナンス体制の構築:価値実現と規制対応を両立させる仕組み
なるほど、基本的に自分たちの作業を示せるようにするということですね。では、製薬業界でこれらの新しいAI機能を実装する際の最大のリスクは何だと思いますか?本当に注意すべきことは何でしょうか?私たちには冒頭で述べた一つの目標があります。発見から治療までのタイムラインを短縮したいということです。そして、R&Dから商業化、従業員体験まで、それを実現するための多くの製品があります。そしてそれを実現するためには、明確なガバナンスが必要です。繰り返しになりますが、これは誇大宣伝の話ではありません。AIは確かにいくつかの目的に使用できますが、私たちには一つの目的があります。もし私たちが構築したい、展開したい製品が、この目標の達成に役立たないのであれば、それはガバナンスの対象外です。
だからこそ、私たちは明確なガバナンスを設定し、このエコシステムを中心に、AI Foundryという一つのプラットフォームを設定しているのです。そして繰り返しになりますが、AIは私たちにとって機会であり、効率的に加速し、より速く進むのを助けてくれる技術なのです。
わかりました。ええ、この生成AI段階の初期に、何らかの生成AIを持っている必要があったために、何かを出そうとする傾向があったのを私たちは早い段階で見てきたと思います。初期の典型的なものは、HRチャットボットのようなものでしたが、今では、より明確なROIを持つもの、おそらくあなたの非常に明確な指標を動かすより明白な方法を持つものに移行しています。価値実現までの時間を短縮することは非常に理にかなっています。
クライアントの間でよく耳にすることの一つは、明らかにこのガバナンスの概念に関するものです。一般的なガバナンスの考え方としてデータガバナンスがあると思います。つまり、基本的に誰がどのデータにアクセスできるかということですが、ワークフローガバナンスもありますよね?誰がこのプロジェクトの使用を承認したか、文書化されているか、リスク分析が行われているかということです。両方のタイプのガバナンスの必要性を感じていますか、それとも本当にどちらか一方がはるかに重要なのでしょうか?
私たちには基本的に二つのガバナンスがあります。一つはExcomメンバーによるトップレベルのものです。基本的に私たちのすべてのAI、生成AIイニシアチブは、このガバナンスを通過します。私たちが「フロントドア」と呼んでいるものがあります。これは最初のエントリーポイントで、Sanofiのすべての従業員が世界を変えられるAIについてのアイデアを持っている場合、私たちは彼らに、パイロットIDカードを準備するように伝えます。それは何を意味するかというと、彼らはビジネススポンサーシップ、Excomレベルの高いものが必要であり、デジタルスポンサーシップも必要です。なぜなら、価値が確実にそこにあること、具体的な価値があることを確認する必要があるからです。そして、実現可能性、技術的実現可能性の観点からも、それが実行可能であることを確認する必要があります。
私たちは彼らにコミットメントを求めています。短期的なコミットメント、3ヶ月です。価値の一部を示す必要があります。なぜなら、誰かがあなたに「4000万のROIが得られます」と言うかもしれないからです。いいですね、わかりました、では1年で?はい、1年でです、わかりました。私は少し愚かかもしれません。簡単な計算をするだけです。1年で、では3ヶ月に戻りましょう。すべてのツールが揃ったサンドボックスを提供しますので、その3ヶ月で価値を示してください。もちろん、私たちはExcomに対する説明責任を持っています。
そうすると人々は、ああ、わかった、自分を燃やすようなことはしないでおこう、なぜなら自分をExcomの前に、デジタル部門の高位のシニアリーダーであるスポンサーの前に置くことになるからだ、と言うでしょう。少なくともそれにおいて、私たちは移行しました。コマーシャルの例を挙げることができます。私たちは56のユースケースを受け取りましたが、最終的には2つに絞り込みました。私たちが彼らに求めたとき、彼らはすべてのユースケースを取り下げました。それがあなたのユースケースを推進する前の前提条件です。それがこのガバナンスです。これは必要なのです。なぜなら、そうでなければ、2010年を思い出してください。すべてのアドバイザーが、AIに1ドル投資すれば4ドル得られると言っていました。その1年後、彼らは投資した1ドルごとに4ドルを失いました。ですから、価値に関するこのガバナンスなしでは進めません。
それから、データとAIに関連する別のガバナンスがあります。これはより技術的なもので、AI対応データのすべての概念についてです。データを理解する必要があります。なぜなら、いくつかの問題があり、いくつかのリスクがあり、規制当局があり、患者データがあり、これらすべてのことがあるからです。この消化しやすいデータガバナンス、私たちがAI対応データと呼ぶものを持つ必要があります。基本的にはデータガバナンスです。
それは非常に理にかなっていますね。これらの規制について話すとき、製薬業界では、進出する国ごとに本当に異なる規制と異なるルールがあります。それをどのように管理しているのですか?それは非常に重い負担のように思えます。異なるチームや異なる方法を持っているのでしょうか、例えば米国の規制対EU規制をターゲットにするための、それともすべてを管理する中央のガバナンスチームがあるのでしょうか?
ガバナンスは中央集権的です、中央ガバナンスです。基本的には2つです。私が率いているデータチームと、Excomメンバーを含むgenerative AIボードとのガバナンスがあり、はい、それはグローバルレベルです。それから国レベルのサブチームがあります。なぜなら、それらが必要だからです。彼らはその領域のより専門家です。最終的に、規制全体を見ると、多くの共通点があり、はい、管理する必要があるいくつかの特殊性がありますが、だからこそ私たちはガバナンスのためのこのグローバル中央チームを持っており、ローカルチームがありますが、彼らはグローバルチームと協力しています。彼らは車輪を再発明しているのではなく、各国のガバナンスに特化しているのです。
共有された目的の重要性:流行に惑わされず患者のための説明可能な医療を目指して
ええ、なるほど、それは非常に理にかなっていますね。私はこうしたものが組織内で進化していく中で、ワーカーの名前、あるいは役職名がどのように変わっていくのかについてずっと考えてきました。そして、おそらく80%のワーカーがエージェンティックなコンシューマーやユーザーになり、15%がこれらのエージェンティックツールやコンポーネントのデザイナーになり、そして5%がガバナンスを担当するという分かれ方が見えてきています。
製薬組織の中でもそのような分布が反映されていると思われますか?
すべての製薬会社が同じというわけではありません。少なくともSanofiについてお話しすることができます。私たちには、世界中の患者さんの手に医薬品を届けるという目的があります。私たちにとって、患者さんとはアメリカの患者さんでもフランスの患者さんでもドイツの患者さんでも中国の患者さんでもなく、世界中の患者さんなのです。ですから、私たちはハイプを気にしません。私たちは追随しているわけではなく、見ていただければわかりますが、Sanofiだけでなくすべての製薬会社は、規制のため、制約のため、多くの理由により、AI領域を受け入れるのが少し遅れていました。なぜなら、結局のところ、これは単なるクイックウィンではないからです。冒頭でおっしゃったように、長期的な分子の研究があるので、役割を変えるからといってそれをやるわけにはいかないのです。
はい、エージェンティックAIスペシャリストになる、Gen AIスペシャリストになると言っているチームがあるのは見ています。しかし、Gen AIスペシャリストやエージェンティックAIスペシャリストとは何を意味するのでしょうか?もしあなたがAIエキスパートであれば、Gen AIを管理し、AIエージェントを管理するわけですから、その領域に専門家はいないのです。正直なところ、私たちは肩書きを気にしません。名前を気にしません。私たちにとって、それは目的に資する技術であり、それが特定の目的に対して意味があるかどうかを見ているのです。だからこそ、ガバナンスが、繰り返しになりますが、本当に鍵となるのです。
興味深いのは、単一の目的を持つこと、目標や一連の決定、North Star、目指すべきターゲットを持つことに繰り返し立ち戻っていることですね。他の業界を見ると、あなたにそれらの専門家になってほしいとは言いませんが、すべての業界やすべての企業が、AIを実装する際に単一の推進目的を持つ必要がある、あるいは持つべきだと思われますか?
これが重要だと思います。もし会社が共有の目標を持っていなければ、それはますます多くのサイロ、ますます多くの局所的な目標を持つことになります。しかし数学では、局所的な目標の合計は全体的な目標よりも小さいことがわかっています。ですから、もし会社として目標を達成したいのであれば、それは共有されたものである必要があります。だからこそ、私たちはAIとGen AIに関するこのガバナンスを経営委員会と共に設置しました。なぜなら、すべての部門に対する説明責任が必要だったからです。
すべての会社には製品の出発点があり、終着点があります。つまり最終的には、すべての会社が明確にすべき共有の目標を持っているのです。私たちにとって、それは治療と発見の間の距離です。分子は研究から始まりますが、研究者自身がそれを市場に出すことはできません。それを開発し、製造し、そして商業化する必要があります。ですから、データと目標のワークフローは同じですが、その目標にどのように貢献するかという方法は異なります。
私たちはバリューチェーン全体に触れています。それは理にかなっています。私たちはそのバリューチェーンの中で、実際に意味があり、その最終目標に向かって推進する場所にのみAIを注入する必要があります。そうですね、完璧です。さて、ちょうど時間になりました。説明可能性について、データの準備について、そして製薬業界内でのAIの展開について、最後に何か言いたいことはありますか?
2つあります。1つは、私たちは流行を追う必要はないということです。なぜなら、すべての会社には文脈があり、制約があり、歴史があるからです。私たちが持っているすべての遺産と共に前進する必要があります。遠くへ行くには、速く行くことではありません。なぜなら、一人では速く行けますが、一緒なら遠くへ行けるからです。それが1つです。もう1つは、私の領域である生物学についてです。すべてが説明可能なわけではありませんが、医療は患者にとって説明可能である必要があります。もし私がそれを自分の体に入れるなら、なぜそれが効くのかを知りたいのです。
その通りです。とても理にかなっています。本当にありがとうございました。そして、ここにいる皆さんが何かを学んでくれたことを願っています。ありがとうございました。
※ こちらの記事は Amazon Bedrock を利用し、元動画の情報をできる限り維持しつつ自動で作成しています。


Discussion