🎉

NumeraiのCrypto予測が始まったので、情報を整理しました

2024/06/22に公開

6月19日にNumeraiのXのアカウントで、次のようにCryptoの予測の開始がアナウンスがされていました。
https://x.com/numerai/status/1803097424157970658
そこで、アナウンスとどのようにサブミットするのかまとめておきました。

アナウンス

以下は、Mediumにポストされていたものを、まとめたものです。翻訳はこちらにあります。

Numerai Cryptoの紹介: 暗号通貨市場予測の未来

データサイエンスと分散型予測市場の最前線に立つNumeraiが、新たな暗号通貨予測プラットフォーム「Numerai Crypto Meta Model」を発表しました。この発表は、暗号通貨市場に対する新たなアプローチと、データサイエンティストコミュニティに新しい挑戦を提供することを目的としています。

Numeraiの歴史と実績

Numeraiは、2017年にトークンNumeraire(NMR)を発行して以来、世界中の優秀なデータサイエンティストを集め、毎日1,300万ドル相当のNMRをステークするプラットフォームを提供してきました。数千の機械学習モデルを毎日実行し、年間で100億以上のグローバルエクイティ予測を生成しています。さらに、MMCというアンサンブルモデルの貢献を評価するための高度なメトリクスを開発し、独自のシグナルパフォーマンスを特定する能力を提供しています。

暗号通貨市場への新たな挑戦

Numeraiはこれまで株式市場に焦点を当ててきましたが、今回は暗号通貨市場に進出します。Numerai Cryptoは、暗号通貨市場の予測可能性を高めることを目指し、以下の目標を掲げています:

  1. 新しい挑戦の提供:株式市場のシグナル探索は尽きていないものの、コミュニティが暗号通貨市場でどれだけのアルファを生成できるかを探求します。また、NMRの第三の利用ケースを提供することで、コミュニティの信頼と実用性を高めます。
  2. 暗号通貨市場の予測可能性の向上:暗号通貨市場は比較的未開拓で、信頼できるファクターモデルはまだ開発されていません。Numeraiはこの状況を改善し、市場の動向をより正確に予測できるようにします。
  3. 集団知性の力の共有:これまでNumeraiだけが活用していたクラウドソース型の予測力を、Numerai Crypto Meta Modelの公開を通じて世界と共有します。

新しい予測プラットフォームの利用方法

Numerai Cryptoでは、次のステップでプラットフォームを活用できます:

  1. サインアップ:Numerai Cryptoのサイトでアカウントを作成し、参加します。
  2. データのダウンロード:流動性のある暗号通貨のユニバースを基に、過去のリターンターゲットを生成しました。適切な予測データを見つけ、モデルを訓練します。
  3. 予測と提出:毎日、暗号通貨の未来のランク付けされたリターンを予測し、予測をアップロードします。APIを通じて提出物を検証します。

暗号通貨市場の未来を予測

Numeraiは、暗号通貨市場における予測能力をコミュニティと共有することで、参加者が自身のモデルを試し、学び、改良する機会を提供します。さらに、Numerai Crypto 2024シーズンがまもなく開始され、参加者はNumeraiグランドマスターのタイトルを競い合うことができます。

Numerai Cryptoは、情報提供およびエンターテイメントの目的で提供されており、投資アドバイスを意図したものではありません。Numeraiは、Numerai Crypto Meta Modelに基づいて行われる金融決定について責任を負いません。

結論

Numeraiの新しい暗号通貨予測プラットフォームは、データサイエンティストコミュニティに新たな挑戦と機会を提供し、暗号通貨市場の予測可能性を高めることを目指しています。この取り組みが、暗号通貨市場にどのような影響を与えるか、そしてNumeraiコミュニティがどれだけの成功を収めるかが楽しみです。

Numerai Cryptoの取り組み方

https://docs.numer.ai/numerai-crypto/crypto-overview に記載があります。

データのダウンロード

Dataにあるように次のコードで、データをダウンロードする

> pip install numerapi

from numerapi import NumerAPI
napi = NumerAPI()
napi.download_dataset(
	"crypto/v1.0/live_universe.parquet",
	"live_universe.parquet"
)
napi.download_dataset(
	"crypto/v1.0/train_targets.parquet",
	"train_targets.parquet"
)

サブミット

提出するのは次のように2列のデータ。
symbol列がBTCなどの銘柄であり、signal列が予測値となります。

submissionsタブから手動でアップロードすることもできますし、次のようにAPIからサブすることもできます。

from numerapi import NumerAPI
napi = NumerAPI(public_id, secret_key)
napi.upload_predictions("prediction.csv", model_id=model_id1, tournament=12)

APIでのサブミットでには、numeraiのdiscordコミュニティで共有されていました。

評価指標

現状の評価指標はターゲットとの相関(CORR)と、Meta Model Contribution (MMC)の2つで評価されまっす。
MMCについては、こちらのページに記載があります。

MMCは「モデルの予測をメタモデルに対して中立化(neutralize)した後の、ターゲットとの共分散を表す」、「メタモデルに含まれていない、モデルのユニークな部分がどれだけターゲットと相関しているかを示します。」ということですが、やや難しいです。

参考になるKaggleのコンペとか

コンペティション

  • M5 Forecasting - Accuracy
    • Targetが商品の売れ行きですが、時系列データで、このようなデータの特徴の作り方とかほぼ網羅されていると思う。

そのほか、金融データ系としてG-Research Crypto Forecastingとか、Optiver - Trading at the Closeなども参考になるかもしれない

データセット

DatasetsのページをBTCなどで検索すると、毎日更新されているデータがたくさんあるので、外部データとして使うのはありだと思います。

Discussion