📖

re:Invent 2024: AWSとNVIDIAが語る量子コンピューティングの現在と未来

2024/01/01に公開

はじめに

海外の様々な講演を日本語記事に書き起こすことで、隠れた良質な情報をもっと身近なものに。そんなコンセプトで進める本企画で今回取り上げるプレゼンテーションはこちら!

📖 AWS re:Invent 2024 - Accelerate R&D in quantum computing with Amazon Braket & NVIDIA CUDA-Q (QTC202)

この動画では、AWSの量子コンピューティングサービスAmazon Braketのプロダクトチームを率いるStefan Natuが、量子コンピューティングの現状と将来像について解説しています。現在の量子コンピュータは1000回の演算に1回程度のエラーが発生する状態で、商業的な優位性はまだないものの、JPモルガンやAirbusなど多くの企業が研究開発に取り組んでいます。また、NVIDIAのQuantum Algorithm Engineering部門のDirectorであるElica Kyosevaが登壇し、CUDA-QとAmazon Braketの連携による新しいハイブリッド量子コンピューティングの可能性や、量子コンピュータのシミュレーション時間を1年から1時間に短縮できる技術革新について紹介しています。
https://www.youtube.com/watch?v=4gHzaKHdqMI
※ 動画から自動生成した記事になります。誤字脱字や誤った内容が記載される可能性がありますので、正確な情報は動画本編をご覧ください。
※ 画像をクリックすると、動画中の該当シーンに遷移します。

re:Invent 2024関連の書き起こし記事については、こちらのSpreadsheet に情報をまとめています。合わせてご確認ください!

本編

Amazon BraketとNVIDIAの量子コンピューティング戦略

Thumbnail 0

皆様、ご参加ありがとうございます。私はStefan Natuと申します。AWSの量子コンピューティングサービスであるAmazon Braketのプロダクトチームを率いています。この1時間で、私たちAWSが量子コンピューティングにとても期待を寄せている理由、お客様が非常に期待を寄せている理由、そしてBraketサービスを構築した背景にある長期的なビジョンについてお話ししたいと思います。また、現在の業界の状況や、私たちのロードマップがどのようになっているのか、そして長期的なビジョンに向けてどのように進んでいるのかについてもお話しします。

この講演の後半では、NVIDIAの量子アルゴリズムチームを率いるElica Kyosevaさんをお迎えして、量子コンピューティングがNVIDIAの戦略にとってなぜ不可欠なのかについてお話しいただく予定です。本日ステージでお話しする多くの課題は、AWSとNVIDIAに共通するものです。また、本日発表したばかりの新しいコラボレーションについても、後ほどご紹介させていただきます。

量子コンピューティングの基礎と潜在的応用

Thumbnail 80

まず、皆様に全体像をお示ししたいと思います。現在の古典的なコンピューティングを考えると、コンピューティングの基本単位は実際にはビット、つまり0と1です。古典的なコンピュータの動作は、ビットが1の状態か0の状態のどちらかにあると考えることができます。量子コンピューティングの面白い点は、電子、光子、原子、イオンなどの素粒子が従う量子力学の基本法則を活用している点です。量子コンピューティングにおける演算単位、つまりQubitは、0と1の間のどの状態にもなり得るという特性を持っています。

したがって、一つの見方として、Qubitは古典的なビットよりもはるかに多くの情報を符号化できるということです。もちろん、タダ飯はありません。量子力学は自然の統計的な理論なので、測定を行う際には、Qubitがどの状態にあるのかを判断するために多くの測定を行う必要があります。一方では、重ね合わせと呼ばれる現象により、多くの情報を符号化できます。他方では、実際に結果を得るためには多くの測定が必要になります。

Thumbnail 200

90年代以来、特定の種類の問題については、量子コンピュータが現在の古典的なコンピュータよりも指数関数的に速く解けるという理論的な証拠が数多く示されてきました。問題の複雑さが増すにつれて、古典的なコンピュータでは指数関数的に長い時間がかかりますが、量子コンピュータは原理的にその問題をはるかに速く解くことができます。これは本当に新しいコンピューティングのパラダイムです。この講演で何度も申し上げますが、量子コンピューティングは、より高速なコンピュータや別種のGPUを作ることではありません。これは根本的に異なるパラダイムであり、コンピューティングについて考え、実行する方法が異なるのです。

Thumbnail 230

Quantum Computingの潜在的な応用例と、企業や政府がなぜこれほど関心を持っているのかについてお話しさせていただきます。私の知る限り、世界中の約30カ国がQuantum Computingを戦略的な重要技術と位置づけ、地域レベルおよびグローバルレベルで、把握できているだけでも400億ドル以上を量子技術の開発に投資しています。Quantum Computingの応用には2つのアプローチがあります。1つは本質的に量子的な問題に対するもので、新しい物質の状態や原子・分子の研究、新素材の発見などの根本的に量子力学的な問題です。これらは農業分野での より良い肥料の開発、再生可能エネルギー産業でのエネルギー貯蔵や電池用の新素材設計、製薬産業などに応用できます。もう1つは、本質的には古典的な最適化問題で、金融サービスにおけるポートフォリオ最適化やデリバティブの価格設定、さらには研究者が活発に探求している機械学習分野での応用があり、より低コストで省エネルギーな可能性を秘めています。

これらは、現在の技術的限界に直面している問題のタイプです。例えば、大規模なMLモデルやLLMのトレーニングは、現代のスーパーコンピューティングの限界に達しつつあります。

Amazon Braketの長期ビジョンと現状

Thumbnail 340

私たちの最終目標と、そもそもなぜAmazon Braketを構築することを決めたのか、についてお話しします。 このサービスは2019年にローンチしました。AWSの目標は、Quantum Computingをインフラストラクチャファブリックの不可欠な一部とすることです。長期的なビジョンとして、私たちは量子コンピュータを他のインスタンスと同様に扱えるようにしたいと考えています。つまり、EC2コンソールにアクセスして、CPUやGPUの代わりにQPUを選択し、インスタンスタイプとして起動できるようにすることです。

Braketをローンチした理由は、Quantum Computingをそのファブリックの一部にするためです。私たちは、お客様が量子コンピュータで何をしようとしているのか、なぜ使用したいのか、必要なリソース要件は何か、そして量子コンピュータに隣接してどのような古典的なコンピュート機能が必要になるのかを理解したいと考えました。Quantum Computingは単独で存在するものではないと考えています。iPhoneやラップトップが突然、量子コンピュータで動作するようになるわけではありません。量子コンピュータは、今日のGPUがCPUと連携して動作しているように、古典的なコンピュータと連携して動作するアクセラレータなのです。

このビジネスに参入した理由は、これらの量子およびハイブリッドワークロードのネットワーク要件、セキュリティ要件、レイテンシー、スループット要件を理解するためです。私たちはよく冗談で、Quantum Computingをできる限り退屈なものにすることが私たちの仕事だと言っています。皆さんが新しいアルゴリズムやアプリケーションを発見している間、私たちは、これを現在のAWS環境で使用している他のインフラと同じように動作させることに注力しているのです。

Thumbnail 440

このような長期的な展望を念頭に置いて、業界は現時点で実際どのような状況にあるのでしょうか? 最初に現状を明確にしておきたいと思います:現在、ビジネスにおいてQuantum Advantageは存在していません。これはまだ発展途上の技術であり、研究者たちが新しいアルゴリズムを積極的に探求し発見している段階です。しかし、現時点の量子ハードウェアでは、商業的に実用的で意味のあるアプリケーションを解くことはできません。規模感をお伝えすると、先ほど話していたアルゴリズムの中には、商業的に有用な問題を解くために、10億回の演算に1回程度のエラー率の量子コンピュータが必要なものがあります。対して、現在最高の量子コンピュータでも1000回の演算に1回程度のエラーが発生します。私たちにはまだ、6桁のイノベーションの余地があるのです。

Thumbnail 510

ここまで長い道のりがあるのに、なぜ今ここにいるのかと疑問に思われるかもしれません。その理由は、これが単により優れた、より高速なGPU やコンピュータではなく、コンピューティング自体の根本的に新しい方法だからです。より速い馬を作ろうとしているのではなく、自動車を作っているのです。実用的な量子コンピュータが登場した時、これは単なる近代化の取り組みではありません。リフト&シフトではないのです - オンプレミスのワークロードを量子コンピュータに移行するためのCloud Formationテンプレートのようなものではありません。これは根本的に新しいIPを構築することなのです。

JP Morgan、Airbus、Vanguardなど、現在業界で積極的に参加している顧客は - QTC203で彼らの話を聞くことができますが - 根本的に新しいIPと新しいアルゴリズムを構築するためにこれを行っています。ビジネスロジックやビジネス上の問題を量子コンピュータにマッピングする基本的なアルゴリズムは、積極的に開発される必要があります。これらは今まさに研究されている最中です。まだ実用化までは長い道のりですが、たとえ投資規模が小さくても、早期に投資することが重要です。本番での使用事例がない量子コンピューティングにおいて、顧客のジャーニーがどのようなものかと言えば、それはR&Dのジャーニーです。では、量子コンピューティングにおけるこのR&Dジャーニーは実際にどのようなものでしょうか?

量子コンピューティングの研究開発ジャーニー

Thumbnail 610

私はこれを4つのステージまたはフェーズで考えるのが好きです。ジャーニーの最初のフェーズは、ユースケースを見つけることです。量子コンピューティングは自分のビジネスに本当に関連があるのでしょうか?もしあなたのビジネスがWebアプリケーションを構築することなら、量子コンピューティングはそれほど有用ではないかもしれません。早く分かれば分かるほど良いので、あなたのビジネスにおける量子コンピューティングのユースケースは何なのかを考える必要があります。

ユースケースを見つけたら、既存の技術と比較してベンチマークを取りたいと考えるでしょう。多くの顧客にとって、それが彼らの量子戦略となっています。Amazon Braketでは、新しいデバイスをローンチするたびに、顧客が自分たちのアルゴリズムをテストしにやってくるのをよく目にします。彼らは業界の進歩を追跡・測定し、改良されたハードウェアの進歩によって何ができるようになるかを見ています。まだ商業的な優位性はないと判断し、後で戻ってくると言います。これは完全に有効なアプローチです。

しかし、先ほどのスライドで触れた先駆者たちは、必ずしもそれだけでは満足していません。この破壊的な技術の限界に挑戦したいと考えているお客様が実際にいるのです。例えば、誰かが量子コンピュータの興味深い応用を発見し、競争優位性を維持・拡大するために、利用可能な量子ハードウェアをすべて購入するような世界が想像できます。最新かつ最高の技術にアクセスしたいと考えているお客様やエキスパートたちは、それを直接テストしたいがために、ユーザー体験面での妥協を受け入れる覚悟もあるのです。

Thumbnail 730

究極的には、これを本番環境で実現するために必要なすべての要件を把握することが重要です。それはどのようなものでしょうか?そのためのソフトウェアスタックはどうあるべきでしょうか?これが、本日の残りの時間で私が話したいことです。 もしあなたのビジネスで量子コンピューティングのユースケースを探っているのであれば、先週発表した新しいプログラム「Quantum Embark」をご紹介できることを嬉しく思います。このプログラムの目的は、お客様を「量子に興味がある」状態から「量子への準備ができている」状態へと導くことです。完全な従量課金制で長期的なコミットメントは不要であり、モジュール式になっています。

このプログラムは3つのモジュールで構成されており、すべてを実施することも、必要なものだけを選択することも可能です。最初のモジュールはユースケース発見で、お客様のビジネスに関連する可能性のある幅広い量子ユースケースの特定をサポートします。これは、経営陣やリーダーシップチームがこの技術の可能性と、それがビジネスに影響を与える可能性のあるタイミングを理解するためのものです。成果物として、お客様の業界に関連する量子ユースケースについての経営層向けホワイトペーパーを提供します。今週後半のセッションでは、このプログラムのプレビューカスタマーであるVanguardが、すでに価値を得始めている様子についてお聞きいただけます。

2番目のモジュールはトレーニングと実践に関するものです。ここでは実践的な内容に入り、Amazon Braketサービスを通じて、今日のお客様が実際の量子コンピュータをどのように使用しているかを体験していただきます。このモジュールの目的は実践的な経験を得ることであり、単なるHello Worldの例を実行するだけではありません。実行する例は、お客様の業種や業界に合わせてカスタマイズされます。

3番目のモジュールは深掘りモジュールで、今日の研究プロセスを垣間見ることに焦点を当てています。ユースケース発見で選択した特定のユースケースに影響を与える可能性のある最先端のアルゴリズムについて説明し、さまざまなハードウェアモダリティに対してそのユースケースをベンチマークする方法について説明します。現在、約50の量子ハードウェアスタートアップが、電子、光子、ダイヤモンド、超伝導体、イオン、中性原子などを使用してさまざまなモダリティのマシンを構築しています。これらの技術にはそれぞれ長所と短所があるため、アルゴリズムをこれらの異なる技術に対してベンチマークし、その特徴を理解することが重要です。

Thumbnail 890

最終的な目標は、実践的な意思決定ができる状態に到達していただくことです。Quantum computingは非常に抽象的で素晴らしく聞こえますが、お客様からよく耳にするのは、6桁もの規模での革新の可能性があるということです。お客様は、いつ始めるべきか、どの程度投資すべきかを知りたがっています。このプログラムの目的は、お客様がそのような判断を下せるようにすることです。

私たちの目標は、お客様にテクノロジーを押し付けることではありません - お客様が延期を決断されても、それで構いません。これは長い道のりですので、お客様がどのような決断を下すにしても、適切な情報とツールを確実に持っていただきたいと考えています。

Thumbnail 930

具体的な例として、ある引用をご紹介させていただきます。 Westpacは、このプログラムの設計段階から参加してくださったお客様の一つです。Westpacは新興テクノロジーに対して長期的な視点を持っています。Innovation部門のトップであるNick Munro氏は、このプログラムを立ち上げ、WestpacのリーダーシップチームにQuantum computingについての教育を行うことを推進してくださいました。

Thumbnail 960

Thumbnail 970

この journey の次のステップは、 現存するテクノロジーに対するベンチマーキングです。これこそがAmazon Braketサービス全体の目標です。 2019年にBraketを立ち上げた時、私たちはどのようにアプローチすべきか考えていました。ここで少し寄り道して、Generative AIについて触れたいと思います。というのも、今日のプレゼンテーションでGenerative AIに触れないわけにはいきませんから。Generative AIが注目を集めるようになった時、お客様からよく受けた質問の一つは、Foundation modelを構築している様々な企業の中からどれを選ぶべきかということでした。お客様は、自社のビジネスにどのFoundation modelを選ぶべきか、異なるモデルをどのように試すべきか、そしてモデル間の微妙な違いをどのように探るべきかを知りたがっていました。

NVIDIAの量子コンピューティング戦略とCUDA-Q

Amazon Bedrockサービスを立ち上げた目的は、それを簡素化し、可能な限り障壁を取り除くことでした。お客様が、FacebookのLlamaモデルやAnthropicのモデルなどを使用する際に、異なるユーザー体験を持つことがないようにしたかったのです。私たちは可能な限り、そのユーザー体験を統一したいと考えました。Braketを構築し、新興テクノロジーについて考える際も、同じような考え方をしています。現在、Quantum computingに取り組むスタートアップは50社ほどありますが、勝者を選ぶにはまだ早すぎます。お客様にとって最悪なのは、長期間にわたって単一のベンダーやハードウェアプロバイダーのプラットフォームにロックインされることです。

Braketの背景にある目的は、お客様が様々なハードウェアモダリティを従量課金制で実験できる選択肢を提供することです。従量課金制が非常に重要なのは、これが新興技術だからです。ハードウェアプロバイダーが新世代のデバイスを開発すると、お客様は多くの場合、前世代のものを使わなくなります。これはEC2とは異なります。EC2の場合、ニーズや価格を考慮して、C6が利用可能であってもC5インスタンスを使い続けたいと考えるお客様もいます。量子コンピューティングでは、現時点でコストパフォーマンスという概念はなく、すべてが実験的です。これらのマシンでお客様ができる興味深いことには限りがあるため、巨額の初期費用という障壁を作りたくないのです。

Thumbnail 1130

これらの多様なプラットフォームが存在する中で、当然ながら多様なアクセスモデル、ソフトウェアスタック、価格モデルが存在し、私たちはそれらを可能な限り標準化したいと考えました。これらが、私たちがBraketを構築した理由の背後にある原則です。すべては、お客様のリスク、技術リスクを軽減し、機会をより早く見出せるようにすることです。

Thumbnail 1140

現在、このサービスでは4つの異なるベンダーから4つの異なる量子コンピュータへのアクセスを提供しています。右側のIQueraは、中性原子ベースの量子コンピュータです。これはゲートベースの量子コンピュータではなく、特定のタイプのアプリケーションに適した特殊なデバイスです。いわゆるユニバーサル量子コンピュータではありません。新しい物質の状態、高エネルギー物理学の研究、最適化やグラフ問題の探索に興味のあるお客様が、特にこのデバイスの使用に関心を持っています。中央の2つは超伝導デバイスです。私たちの目標は、お客様に同じ技術の異なるフレーバーへのアクセスを提供することです。これは、各ベンダーが技術やロードマップについて独自のニュアンスを持っているためです。左側はIonQのトラップドイオンで、同じプロバイダーから2つの異なる世代のものがあります。これは進歩を追跡するという点に戻りますが、この技術における世代的な進歩がどのように行われ、どのように段階的に進化できるかを理解することができます。

これらの新しいデバイスが登場する際、私が強調したい重要なポイントは、これらがスライド上のロゴだけではないということです。私たちは、最終的に量子コンピューティングをAWSのインフラストラクチャファブリックの一部にするという長期的なビジョンについて話しましたが、これを非常に真剣に受け止めています。つまり、一貫したユーザーエクスペリエンス、単一の価格体系、単一のアクセスモデル、そしてこれらすべてのデバイスにアクセスするための単一のSDKを提供することに焦点を当てています。これは本当に、それらの障壁を減らすことに関するものです。

Thumbnail 1250

例を挙げたいと思います。IonQの場合、先週オンデマンドで提供を開始したデバイスでは、週5日、1日15時間のアクセスが可能になりました。私たちはこれを非常に真剣に受け止めています。実際、IonQ Forteデバイスは、週5日15時間お客様に提供できる運用状態ではなかったため、長期間予約のみで利用可能でした。ようやくデバイスがその状態に達したと判断し、そのため先週この発表ができたことを嬉しく思います。これはサービス上で最も高いFidelityを持つデバイスです。Fidelityが重要なのは、先ほど述べたように、これらのマシンは1000回の操作に1回エラーを起こすからです。ゲームの名前は「より少ないエラー」です - Fidelityが高ければ高いほど、より良い結果が得られます。All-to-all接続性は、これらのトラップドイオンシステムの興味深い特性です。これは、アルゴリズムを量子コンピュータのトポロジーにマッピングする際に、より少ないゲートを使用する必要があることを意味します。そして、より少ないゲートを使用するということは、再びより少ないエラーを意味し、より良い結果につながります。

Thumbnail 1310

Thumbnail 1320

第3のパートに移りましょう。オンデマンドのサービスは多くのお客様にとって適していますが、その境界を押し広げたいと考えているエキスパートの方々もいらっしゃいます。Amazon Braketを立ち上げた時の私たちの理念は、これはクラウドに関するものだということでした。クラウドとは民主化であり、お客様がイノベーションを起こすためのガードレールを作ることです。しかし、実際に学んだことは、長期的には量子コンピュータをEC2インスタンスのように互換性のあるものとして扱えるようになるかもしれませんが、現在の技術はそこからはまだ遠いということです。これらの量子コンピュータには、それぞれ個性や気分のようなものがあるのです。

Thumbnail 1400

研究者が本当に望んでいるのは、ハードウェアベンダーと直接やり取りすることで、これらのマシンから最大限の性能を引き出すことです。通常のBraketでは、サービス上で回路を実行する際、すべてのお客様のデータをハードウェアベンダーから見えないようにしています。しかし、Amazon Braket Directでは、お客様や研究者がハードウェアプロバイダーと直接関わることができるチャネルを作りました。これはエキスパートにとって素晴らしい機会です。なぜなら、ハードウェアベンダーも自社の最新かつ最高の技術を披露し、ロードマップのどこに注力すべきか、何を破棄すべきかを見極めたいと考えているからです。Braket Directの背後にある考え方は、お客様とハードウェアプロバイダーが出会い、この技術に関するイノベーションのペースを加速させるためのイノベーション・サンドボックスとして機能させることです。

先ほど申し上げたように、IonQ ForteはBraket Directを通じて長らく利用可能でしたが、現在ではオンデマンドでも提供しています。Directの背後にある考え方は、新しく登場するハードウェア機能やソフトウェア機能がここで公開されるということです。これらはエキスパート向けの機能であり、そのためエキスパートの方々は、私たちAWSが通常は不可侵のものとして扱うユーザーエクスペリエンスやクラウドの側面に関するガードレールを緩和することを許容できるかもしれません。業界は長期的にはそこに到達すると考えていますが、Braket Directは市場のニーズと現在の技術の実態に合わせて調整されています。これは、Oak Ridge National LabsがBraket Directを使用して行った研究の一例です。

Thumbnail 1440

Thumbnail 1450

次は、その未来がどのようなものになるのかについて少しお時間をいただきたいと思います。皆様はエキスパートとして、将来の本番ワークロードがどのようなものになるのか、その基盤を築きたいと考えているはずです。ここまでお話ししてきたことは、すべてが量子コンピュータに関することのように聞こえたかもしれません。この技術を試すためのプラットフォームを選ぶ際、最高のマシンを持っている所に行くべきだと考えたくなるかもしれません。しかし、実際にはそうではありません。なぜなら、これはリフト&シフトではなく、より大きく高速なスーパーコンピュータでもなく、新しいコンピューティングのパラダイムだからです。

Thumbnail 1490

つまり、機械学習でMLの部分が実際のワークフローの小さな要素に過ぎないのと同様に、量子ワークフローでも似たような状況です。量子スタック全体を開発する必要があります。これは、今日の通常のコンピュータでエラーを修正するために使用している従来のエラー修正アルゴリズムが、量子コンピューティングには適用できないということを意味します。

Thumbnail 1520

Thumbnail 1530

そのため、新しいエラー修正方式や、エラー修正アルゴリズム、エラー緩和方式、そして前処理・後処理のコンパイル技術を開発する必要があります。 また、量子コンピュータが古典的なコンピュータに対して指数関数的な高速化や優位性を持つ可能性のある、新しいオペレーティングシステムやアルゴリズムの開発も必要です。 さらに、ビジネスロジックをこれらの量子アルゴリズムにどのようにマッピングするかを理解する必要があります。機械学習では、K-meansや Logistic Regressionなどの標準的なアルゴリズムがありますが、クレジットカードの不正利用問題を解決しようとする場合、その不正検出の問題をこれらのアルゴリズムのいずれかにマッピングする方法を見出す必要があります。量子コンピューティングでも同じことが言えます。

Thumbnail 1570

業界で現在起きていることは、量子コンピューティングに関わる人々の種類が増加し始めているということです。以前は、より良い量子コンピュータを作りたいと考える物理学者たちだけでしたが、今では、ソフトウェア開発者やアルゴリズム開発者、そして最終的にはアプリケーション開発者のエコシステムが形成されつつあります。 その一例をご紹介します。現在 Amazon Braket上で開発を行っている約12社のスタートアップの1つである Q-CTRLは、Fire Opalというプロダクトを提供しています。このプロダクトは、コンパイルや前処理、後処理に関連する低レベルの詳細をすべて抽象化することで、研究者が最適化アルゴリズムに専念できるようにすることを目的としています。これは AWSの上に構築され、バックエンドで Braketのハードウェアを使用しています。

Thumbnail 1610

これは、Accenture Federal Servicesと Q-CTRLと共同で最近行った研究の例で、 ネットワーク内の悪意のある行為者を発見したり、不審な行動を特定したりする問題を探求したものです。この問題は最終的に、グラフ上で最も多く接続されたノードを見つけることにマッピングされ、これは MaxCut問題として知られる最適化問題です。これはさらに、QAOAと呼ばれる量子断熱近似アルゴリズムという量子問題にマッピングされました。Q-CTRLは IonQのハードウェア上でこの QAOAを実行し、この特定の小規模なグラフ問題において、古典的なベンチマークを上回ることができました。Accentureはこれを本番環境に投入するわけではありません。グラフが小さすぎて商業的な意味を持たないからです。しかし、この業界を前進させ発展させるために本当に必要なのは、AWS、ハードウェアプロバイダー、ソフトウェアベンダー、そして量子コンピューティングで探求したい潜在的なアプリケーションを持つアプリケーション開発者たちのエコシステムであることを示しています。

Thumbnail 1680

最後に皆さんに理解していただきたいのは、この全体像において、量子演算以外のすべてが古典的に行われているということです。つまり、すべての量子コンピューティングはハイブリッドなのです。私たちは、量子コンピュータが古典的なコンピュータに取って代わるという理論には賛同していません。私たちが考えているのは、量子コンピュータは GPUが CPUと連携して動作するのと同じように、古典的なコンピュータと連携して動作するということです。量子コンピューティングは、特定の種類の問題に対するアクセラレータなのです。将来のデータセンターについて考え始める際に、私たちが常に自問する重要な問題は、量子コンピュータと古典的なコンピュータを相互に接続する際にどのような課題が生じるかということです。

Thumbnail 1730

Thumbnail 1740

Thumbnail 1760

今日、私たちはこれを古典的なクラウドデータセンターとして考えており、サードパーティベンダー、つまり量子関連のすべてが行われる場所は、いわば量子データセンターです。しかし実際には将来的には、GPUデータセンターというものは存在せず、単なるデータセンターとなります。同じことが将来起こるでしょう。なぜなら、私たちが先ほど議論したアプリケーションは、今日の最新のスーパーコンピューティングや古典的なコンピューティングの限界に挑戦しているアプリケーションだからです。 これらが、量子コンピューティングが破壊的な影響を与える可能性のある潜在的なアプリケーションなのです。

Thumbnail 1770

最終的に、私たちが現在考え、取り組んでいる課題の一つは、レイテンシー要件やスループット要件がどうなるのか、Classical Computingをどこに配置するのか、というものです。エラー訂正アルゴリズムに必要な場合のようにClassical Computingをリアルタイムで実行する必要があるのか、それとも特定のアプリケーションでは数百ミリ秒のレイテンシーでも、あるいは1ミリ秒のレイテンシーが必要なのでしょうか。当然、これらは価格面やパフォーマンスに影響を与えます。これらは私たちが前進する中で解決しようとしている重要な課題の一部です。これらの課題に対する答えを見出そうとする中で、NVIDIAがこれをどのように捉え、どのような戦略を持っているのかについて、Elizaをステージにお招きしてお話しいただけることを大変嬉しく思います。

CUDA-Qの性能とAmazon Braketとの統合

では、お願いします。「こんにちは、Ron、そしてStefanありがとうございます。後ほど彼も再びステージに上がる予定です。本日、NVIDIAを代表してここに立ち、私たちのパートナーシップについて、そして両社のビジョンがいかにマッチしているかについてお話しできることを大変光栄に思います。Stefanがこれまでいくつかのポイントを説明してくれましたが、私からも改めて触れさせていただき、さらにAccelerated Quantum Supercomputerとは何か、そしてNVIDIAが実際にどのようにしてそれを構築しているのかについてお話ししたいと思います。私はNVIDIAのQuantum Algorithm Engineering部門のDirectorを務めているElica Kyosevaです。

Thumbnail 1860

量子コンピューティングが実現する未来を見据える前に、過去を振り返ることが非常に有益です。特に、NVIDIAがコンピューティング革命を加速させてきた歴史があるからこそ、これは重要なのです。すべては25年前、GPU(Graphics Processing Unit)の発明から始まりました。当初、GPUはグラフィックス処理や並列処理に非常に有用であることが認識され、グラフィックス処理に使用されていました。しかし、発明後まもなく、一部の優秀な研究者たちがGPUを行列演算や代数計算にも使用できることに気付きました。ただし、これは非常に困難な作業でした。そこでNVIDIAはCUDAをリリースし、これによって科学計算の変革が可能となり、科学計算における革命的な進歩をもたらしました。

2012年に話を進めると、GPUがグラフィックスや科学計算だけでなく、Deep Learningにも使用できることが認識されました。たった1台のGPUを使用した畳み込みニューラルネットワークのトレーニングで世界記録が樹立されました。この記録は、単一のGPUでのトレーニングだけで約30%のパフォーマンス向上を達成した世界記録でした。これによってDeep Learningにおける次のコンピューティング革命が実現しました。2016年には、GPUがGenerative AIにも非常に有用であることが認識されました。よく知られているエピソードですが、Jensenが当時まだ小さな無名のスタートアップだったOpenAIに、GPT言語モデルのトレーニング用の最初のDGXシステムを直接手渡したというものです。そして10年も経たない今、私たちは日常生活の一部としてGenerative AIを体験しており、このコンピューティング革命はNVIDIAのテクノロジーによって実現されました。

Thumbnail 1990

Thumbnail 2010

では、次は何が起こるのでしょうか?次のコンピューティング革命は量子コンピューティングで起こります。私たちはそれを確信しています。これまでのコンピューティング革命を実現してきたのと同じように、私たちはこれを実現します。Accelerated Quantum Supercomputerは次のような形になります。Stefanも何度か言及したように、量子コンピュータは単独のデバイスとしては存在しません。なぜなら、汎用コンピュータではないからです。特定のタスクには非常に優れていますが、他の多くのタスクには不向きです。そのため、常にClassical AIスーパーコンピュータと統合された形で存在することになります。

Thumbnail 2060

また、量子コンピュータには1つのタイプだけではないということも重要です。Stefanは、Quantum Processing Unit(QPU)向けに検討されているさまざまなアーキテクチャについて説明しましたが、それぞれに長所と短所があります。将来の量子スーパーコンピュータには、異なるタイプのQPUが搭載され、AIスーパーコンピューティングと緊密に統合されることでしょう。これらの間には異なるタイプのネットワーキングが必要になります。量子ハードウェア同士を接続する量子-量子接続、QPUとクラシカルコンピューティングシステムを緊密に結ぶ量子-クラシカルネットワーク、そしてNVIDIA Networkingを備えたクラシカルコンピューティングシステムが必要になります。

Thumbnail 2100

これが私たちのビジョンであり、将来の量子スーパーコンピューティングの姿です。しかし、現状はこのようになっています。数千の論理Qubitを持つ大規模な量子コンピュータの代わりに、現在は数百、あるいはそれ以下のQubitしかなく、それらもかなりノイズの多いもので、まだ産業界で実用的なアプリケーションを実行することはできません。

Thumbnail 2120

Thumbnail 2130

左側の、まだ研究者の研究業務のような段階から、将来の量子スーパーコンピュータに到達するために何が必要でしょうか?私たちはいくつかの課題を解決する必要があります。その1つがインフラストラクチャの課題で、これについては後ほど詳しくお話しします。本当に必要なのは、量子コンピュータとクラシカルコンピュータの緊密な統合です。

Thumbnail 2140

Thumbnail 2180

エラー訂正の進歩も必要です。新しいエラー訂正コードを開発し、数百、場合によっては数千の物理Qubitを扱える高速なデコーダーを開発することが非常に重要です。より優れた量子ハードウェアと、より優れたハイブリッドアルゴリズムも必要です。これらの課題すべて(ハードウェアだけでなく、4つすべて)を解決するために本当に必要なのは、AIスーパーコンピューティングです。NVIDIAの立場としては、これら4種類の問題すべてに対するソリューションを開発しています。私たちのアプローチは非常にオープンソース志向で、量子ハードウェアプロバイダー、ユースケースで量子アルゴリズムをテストしたい企業、アルゴリズム設計に取り組む学術機関や国立研究所の研究者など、量子コンピューティングコミュニティ全体を支援したいと考えています。

Thumbnail 2220

量子コンピューティングにおけるNVIDIAのポジションは、量子ハードウェアを構築しないということです。私たちが持っているのは、CUDA-Qと呼ばれるハイブリッド量子古典コンピューティングのプラットフォームです。このプラットフォームには異なるタイプのバックエンドがあり、QPUハードウェアバックエンドとシミュレータバックエンドをサポートしています。GPUが状態ベクトルシミュレーションやテンソルネットワークシミュレーションとして量子コンピュータのシミュレーションに非常に有用であることが早い段階で認識され、そこから始まりました。これが私たちの最初の提供でした。しかし、その後進化し、現在ではハイブリッドジョブ、つまりハイブリッドアルゴリズムのシームレスなプログラミングをサポートしています。アルゴリズムの量子部分にGPU上で動作するシミュレータを使用するか、実際の量子コンピュータで量子ハードウェアを実行するかを選択できます。すでに6台以上の量子コンピュータがサポートされ、CUDA-Qからジョブを実行できるようになっており、現在も追加を進めています。CUDA-Qプラットフォーム全体がエンドツーエンドでGPUアクセラレーションされており、私たちが提供するものはすべて性能面で最高クラスです。この主張を裏付けるベンチマーク結果を後ほどお示しします。

Thumbnail 2320

約10日前のSupercomputingで、いくつかの発表がありました。CUDA-Qでサポートされる最初のライブラリを発表しました。これらはCUDA-QXライブラリと呼ばれ、現在2つのライブラリがあります。1つはCUDA-Q QECで、量子エラー訂正のためのライブラリです。これには、研究者が物理的量子ビットと論理的量子ビットのエラーの交差点を見つけるために必要な、すべての量子エラー訂正のプリミティブが含まれています。もう1つのライブラリはCUDA-Q Solversで、VQE、Adapt VQE、QAOなどの一般的なソルバーを含むGPUアクセラレーテッドライブラリです。将来的にはさらに多くのソルバーを追加していく予定です。

Thumbnail 2380

Supercomputingでの私たちのもう1つの大きな発表は、CUDA-Qにおけるダイナミクスでした。これは、先ほど述べたNVIDIAが非常に関心を持っているハードウェアの設計改善という課題に対するソリューションです。量子コンピュータは、量子チップのエラーにより、まだ動作が制限されています。エラーが発生すると(これは頻繁に起こります。例えば、Googleの場合、単一量子ビットゲートで10のマイナス4乗、2量子ビットゲートで10のマイナス3乗程度です)、計算の過程でエラーが伝播し、残念ながらすぐに計算が扱えないものになるか、役に立たなくなってしまいます。現在のハードウェアプロバイダーは、個々の量子ビット空間または個々の量子ビットセルで、開放量子系としてそのビットセルを正確にモデル化するために、多くのシミュレーションを実行しています。彼らは実際に研究室で量子処理ユニットを構築する前に、これらのシミュレーションを何度も実行します。

Thumbnail 2460

Thumbnail 2480

量子処理ユニットまたは量子コンピュータは、入力状態を受け取り、最終状態を出力します。しかし、測定結果が異なる可能性があり、計算が確率的になるため、多くの測定を行う必要があります。異なる結果が得られるため、同じ操作を何度も行う必要があります。実行中は、実際にハードウェアを制御してゲートを実装する必要がありますが、これらのゲートにはエラーが含まれています。量子ビットはかなりノイズが多く、互いに干渉し合い、さまざまな種類のクロストークが発生します。

Thumbnail 2510

これらのエラーチャネルはすべて、より良いハードウェア設計によって改善できます。先ほど述べたように、ハードウェア企業が量子ハードウェアチップを設計する際、どのような設計にするかを正確に決定する前に、特定のチップ設計について約50回のシミュレーションを実行します。現在、このような設計には約1週間かかり、平均して約50の設計を行います。ハードウェアプロバイダーが研究室での構築に進む前に、量子チップの設計を確定するまでに約1年かかります。CUDA-Q Dynamicsを使用することで、この時間を1年から約1時間に短縮することができました。

Thumbnail 2560

ソフトウェア面、つまりアルゴリズムの面でも、非常によく似た状況です。典型的なMLワークフローを考えてみましょう。データサイエンティストがクレジットカードの不正検知モデルを開発する場合、通常は本番用のデータセットで実行する前に、異なるハイパーパラメータを使用して何百回もアルゴリズムの実験と反復を行います。量子コンピュータ向けの新しいアルゴリズムを開発しようとする量子研究者も、非常によく似たワークフローを行っています。唯一の違いは、量子コンピュータが従来型コンピュータの約1000倍も高価だということです。そのため、研究者に量子コンピュータをシミュレートするためのツールを提供することが非常に重要になってきます。

従来型と量子の相互作用を考えると、より大規模で優れたハードウェアをシミュレートしようとする際に、従来型のコンピューティング能力の限界に直面します。このグラフの青い曲線は、Qubit数を増やしていった場合の特定のアルゴリズムのシミュレーション実行時間を示しています。25 Qubitのデバイスから36 Qubitのデバイスに移行すると、かなり強力なc5.18.xlarge CPUインスタンスでも、20-25 Qubitのアルゴリズムをシミュレートするのに数百秒かかり始めます。この曲線は指数関数的に上昇するため、Qubit数が増えるにつれて、このハードウェアのシミュレーションは指数関数的に困難になります。しかし、同じアルゴリズムをGPUで実行すると、大幅に短い実行時間で、その境界をさらに少し押し広げることができます。もちろん、ある時点でこのハードウェアをシミュレートすることは不可能になりますが、研究者ができるだけ容易に作業できるようにし、CPUやGPUへのアクセスを提供することで、キャパシティを自分で管理する必要がないようにすることが重要です。これは特に米国のお客様にとって有益で、インフラストラクチャを管理する必要なくGPUを活用でき、アルゴリズム開発に集中できます。

Thumbnail 2720

このメリットはインフラストラクチャだけでなく、シミュレータ自体にも及びます。Elitsaが説明したように、CUDA-Qシミュレータは、GoogleのCIRQシミュレータやIBMのQiskitシミュレータなど、現在利用可能な一般的なオープンソースシミュレータよりも強力です。これらのシミュレーションはすべて同じハードウェアとインフラストラクチャで実行されますが、AWSで実行されるCUDA-Qシミュレータは大幅に高速で、場合によっては75倍以上速くなります。お客様がこれらのシミュレーションをより速く実行できれば、それだけ実験、反復、イノベーションのスピードを上げることができます。

ハイブリッド量子コンピューティングの未来と始め方

Thumbnail 2760

本日、CUDA-QがAmazon Braketのハイブリッドジョブ機能を通じてサポートされるようになったことを発表できることを嬉しく思います。お客様は今やAmazon Braket上でCPUとGPUにアクセスでき、CUDA-Qプログラムを Braket上で利用可能なシミュレータ、そしてBraket上のすべての量子コンピュータにわたる様々なハードウェアオプションで実行できます。私たちは、Elitsaが説明したCUDA-Qのメリットと、従量課金制、ハードウェアへの優先アクセス、様々なハードウェアモダリティの選択肢といったBraketのメリットを組み合わせることを目指しました。コードを1行変更するだけで、CPUやGPU上のシミュレータでCUDA-Qプログラムを実行することから、IQM、OQC、Qeraなどのプラットフォームでの実行に切り替えることができ、一貫したユーザー体験を維持できます。

Thumbnail 2830

今後については、Stefanが言及したように、すべての量子ジョブは実際にはハイブリッドであり、すべてのユースケースがハイブリッドになります。なぜなら、業界が直面するすべての問題には従来型のコンピューティングが必要だからです。これは、計算空間の削減、量子コンピュータの代わりに可能な限り従来型インフラストラクチャで処理を行うこと、量子コンピュータの前処理、あるいは量子ハードウェア制御の後処理のためかもしれません。従来型のコンピューティングは、量子コンピュータを含むワークフローの常に一部となっています。本日、私たちはNVIDIAとAWSの協力関係も発表しました。これにより、クラウド上のハイブリッド量子コンピューティングスタックを定義していきます。私たちは、様々なタイプのユースケースをハイブリッドユースケースとして分析し、従来型および量子コンピュータの要件を含むワークフローの特性を検討していきます。

Thumbnail 2940

Braket上でCUDA-Qを始めたい方向けに、1時間前にブログ記事を公開しました。先ほど触れたQuantum Embarkは、量子コンピューティングに興味を持つ段階から実践できる段階へと進んでいただくために先週立ち上げたプログラムです。実践的な経験を積みたい方、そしてBraket Directで新たな可能性に挑戦したい方は、Braketコンソールにアクセスして、様々なBraket Direct製品をご確認ください。皆様のご参加に感謝申し上げます。特にNVIDIAについてご説明いただいたElitsaに御礼申し上げます。ご清聴ありがとうございました。


※ こちらの記事は Amazon Bedrock を利用することで全て自動で作成しています。
※ 生成AI記事によるインターネット汚染の懸念を踏まえ、本記事ではセッション動画を情報量をほぼ変化させずに文字と画像に変換することで、できるだけオリジナルコンテンツそのものの価値を維持しつつ、多言語でのAccessibilityやGooglabilityを高められればと考えています。

Discussion