🤖

Numeraiのメカニズムを解説する

2023/12/16に公開

導入

ブロックチェーンもしくは機械学習に傾倒している方々なら一度は聞いたことがあると思われる分散型のクオンツファンド(コンピュータの計算によって投資戦略を策定するファンド)であるNumeraiについて、よりブロックチェーンに傾倒している方々がメカニズムを理解し、感動してもらえるような内容で記事を書いていきます。

メカニズム

粗く解説すると、Numeraiではプロトコル自身が秘匿化された訓練データを参加者に提供し、それを基にそれぞれ機械学習モデル(以下モデル)を訓練してもらい、それらの予測を集積して戦略を導出し、運用益を参加者にDistributeするというシステムです。以下で核となるメカニズムについて話します。

Stacking

モデルでは過学習という過剰にそれらのデータに適合してしまい、予測が偏ってしまうという現象が発生します。これを防止する為に正則化と呼ばれるより抽象的なデータのみで訓練を行うアプローチや、アンサンブル学習という複数のモデルの予測を集約し、集合知を発揮するアプローチの二つがあります。Numeraiのメカニズムには後者のアンサンブル学習の一手法であるStackingが用いられており、参加者のモデルの予測をメタモデルの訓練に活用しています。これにより過学習を抑制すると共に、より精度の高い予測を行います。

インセンティブ体系

インセンティブ体系が適切でないプロトコルはまず栄えることはありません。しかしNumeraiには参加者の提出した予測がどれだけプロトコル(メタモデル)に対して有用であったかを評価する定量的な指標である相関性と真の貢献度の二つが存在します。そしてこの指標を基にインセンティブが定まります。

そして、インセンティブはステーキング額に応じて±25%のレンジで決まり、より相関性と貢献度の低い予測を提出した場合には罰金が発生します。これはステーキング額に応じてメタモデルの学習において、その参加者の予測の重要度が高まる仕組みである為です。つまり高額Stakerが低レベルな予測データを提出するということはプロトコルのパフォーマンスを大きく低下させる要因となるのです。

Correlation(CORR)

相関係数はその予測と実際の相場の相関性を表す指標であり、相関分析によって算定されます。参加者の多くはこのCORRを最適化するようなモデルの作成に取り組んでいます。

True Contribution(TC)

この指標はメタモデルの訓練において、その予測がどれだけ有用であったか、またメタモデルの予測にどれだけ同期しているか因果推論によって算出された指標です。TCの算出方法はとても複雑で論文にまとめられています。

Meta Model Contribution(MMC)

メタモデルとそれに中和される予測との相関性を測る為に共分散を用いる指標です。TC以前のスコアリングに用いられていました。

報奨金制度

これはWebページの表示エラーやContractの脆弱性、Exploitの報告に対して支払われるインセンティブです。

Numerai Tournament

これら上記で解説したメカニズムはトーナメントという形式で実装されています。トーナメントはRoundにより構成され、週に5日(土火水木金)新規に開催されます。ここで提出された予測は一ヶ月に及ぶスコアリング期間を得て、インセンティブが決定されます。

Discussion