  • 2024年8月13日に論文をLLMで生成する記事が公開されました。
  • 難易度の高いゴールを達成するための複雑な過程をLLMで扱うためのアプローチを紹介します。
  • AI Scientistのソースコードの重要部分を解説します。


私の中で、論文の執筆というのは豊富な専門知識とアイディアが必要なのでLLMでの代替は困難かと思っていました。 しかし、良く考えてみるれば、「アイディア=既存の事象の組み合わせ」という提言もあるのでLLMでの代替は可能かなと思い始めました。











チェーン・オブ・ソート (Chain of Thought)


ステップバイステップ推論 (Step-by-Step Reasoning)


反復的精緻化 (Iterative Refinement)


タスク分解 (Task Decomposition)


自己一貫性 (Self-Consistency)



AI Scientistを動かしてみる


AI Scientistの構成

AI Scientistの構成図を以下に引用します。

AI Scientistの中では、前述の4つのアプローチをすべて取り入れています。






wget https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Linux-x86_64.sh
bash Anaconda3-2024.06-1-Linux-x86_64.sh


source /home/matsu/anaconda3/etc/profile.d/conda.csh

AI Scientistの準備


conda create -n ai_scientist python=3.11
conda activate ai_scientist
pip install anthropic aider-chat backoff openai
pip install matplotlib pypdf pymupdf4llm
sudo apt-get install texlive-full -y
pip install torch numpy transformers datasets tiktoken wandb tqdm

API Keyの準備





python data/enwik8/prepare.py
python data/shakespeare_char/prepare.py
python data/text8/prepare.py



cd templates/nanoGPT_lite && python experiment.py --out_dir run_0 && python plot.py


git diff
diff --git a/templates/nanoGPT/experiment.py b/templates/nanoGPT/experiment.py
index 303aebd..747755e 100644
--- a/templates/nanoGPT/experiment.py
+++ b/templates/nanoGPT/experiment.py
@@ -348,7 +348,7 @@ def train(dataset="shakespeare_char", out_dir="run_0", seed_offset=0):
     # DDP settings
     backend = "nccl"  # 'nccl', 'gloo', etc.
     # system
-    device = "cuda"  # Always use CUDA
+    device = "cpu"  # Always use CUDA
     dtype = (
         if torch.cuda.is_available() and torch.cuda.is_bf16_supported()
diff --git a/templates/nanoGPT_lite/experiment.py b/templates/nanoGPT_lite/experiment.py
index 892ba72..f834b2f 100644
--- a/templates/nanoGPT_lite/experiment.py
+++ b/templates/nanoGPT_lite/experiment.py
@@ -348,7 +348,7 @@ def train(dataset="shakespeare_char", out_dir="run_0", seed_offset=0):
     # DDP settings
     backend = "nccl"  # 'nccl', 'gloo', etc.
     # system
-    device = "cuda"  # Always use CUDA
+    device = "cpu"  # Always use CUDA
     dtype = (
         if torch.cuda.is_available() and torch.cuda.is_bf16_supported()


git clone https://github.com/gregversteeg/NPEET.git
pip install .
pip install scikit-learn

NPEET(Non-parametric Entropy Estimation Toolbox)は、連続変数と離散変数の両方に対するエントロピー、相互情報量、条件付き相互情報量の推定を行うPythonライブラリです。このツールは、Kullback-Leibler分散や混合変数間の相互情報量の推定もサポートしています。


2D Diffusionの設定

cd templates/2d_diffusion && python experiment.py --out_dir run_0 && python plot.py


cd templates/grokking && python experiment.py --out_dir run_0 && python plot.py



python launch_scientist.py --model "gpt-4o-2024-05-13" --experiment nanoGPT_lite --num-ideas 1




    "Name": "adaptive_block_size",
    "Title": "Adaptive Block Size: Dynamic Context Window Adjustment for Efficient Training",
    "Experiment": "Modify the model to dynamically adjust its block size during training, starting with a smaller block size and gradually increasing it. This could potentially lead to faster initial training and better long-range dependency learning.",
    "Interestingness": 6,
    "Feasibility": 4,
    "Novelty": 4,
    "novel": true
    "Name": "layerwise_learning_rates",
    "Title": "Layer-wise Learning Rate Adaptation: Optimizing Training Dynamics in Transformer Models",
    "Experiment": "Implement layer-wise learning rates, where each transformer layer has its own learning rate. Modify the configure_optimizers function to assign different learning rates to different layers, with deeper layers having lower learning rates. Compare the training dynamics, convergence speed, and final performance with the baseline model.",
    "Interestingness": 4,
    "Feasibility": 6,
    "Novelty": 2,
    "novel": true
    "Name": "curriculum_learning",
    "Title": "Curriculum Learning: Incremental Difficulty for Efficient Language Model Training",
    "Experiment": "Implement curriculum learning by starting with shorter sequences and gradually increasing the sequence length during training. Modify the get_batch function to adjust the block_size based on the iteration number. For instance, start with block_size=64 and double it every 1000 iterations until the maximum block_size is reached. Compare the training dynamics, convergence speed, and final performance with the baseline model.",
    "Interestingness": 7,
    "Feasibility": 6,
    "Novelty": 5,
    "novel": false

novel というキーの部分が新規性があるかどうかという判断結果の値です。






You are an ambitious AI PhD student who is looking to publish a paper that will contribute significantly to the field.
You have an idea and you want to check if it is novel or not. I.e., not overlapping significantly with existing literature or already well explored.
Be a harsh critic for novelty, ensure there is a sufficient contribution in the idea for a new conference or workshop paper.
You will be given access to the Semantic Scholar API, which you may use to survey the literature and find relevant papers to help you make your decision.
The top 10 results for any search query will be presented to you with the abstracts.

You will be given {num_rounds} to decide on the paper, but you do not need to use them all.
At any round, you may exit early and decide on the novelty of the idea.
Decide a paper idea is novel if after sufficient searching, you have not found a paper that significantly overlaps with your idea.
Decide a paper idea is not novel, if you have found a paper that significantly overlaps with your idea.



あなたは、分野に大きく貢献する論文を発表したいと考えている野心的なAI博士課程の学生です。 あるアイデアがあり、それが新規性があるかどうか、すなわち既存の文献と大きく重複していないか、あるいはすでに十分に探究されていないかを確認したいと考えています。 新しい会議やワークショップの論文として十分な貢献があるかを確認するため、新規性について厳しく評価してください。

Semantic Scholar APIへのアクセスが与えられており、関連する文献を調査し、意思決定の支援を得ることができます。 検索クエリごとに上位10件の結果とその要旨が表示されます。

決定には{num_rounds}回のラウンドが与えられていますが、すべてを使用する必要はありません。 どのラウンドでも早めに終了して、アイデアの新規性について判断することができます。 十分な検索を行った後、あなたのアイデアと大きく重複する論文が見つからなければ、そのアイデアを新規であると判断してください。 逆に、アイデアと大きく重複する論文が見つかった場合、そのアイデアは新規でないと判断してください。


ideas = check_idea_novelty(ideas) にてそのアイディアの新規性をチェックしてます。

success = do_idea(idea) で各ideaを処理しています。

do_idea の中身を見ていきます。

perform_experiments(idea) で実験を実行


perform_writeup(idea) で論文を作成



perform_review(paper_text) で査読





  • 複雑なワークフローもブレイクダウンして適切なアプローチを踏むことでLLMでは解決不可能と思われていたことも実現可能になりそうです。
  • 論文を生成する際のフレームワークとかライブラリかと思いましたが、LLM領域の論文を生成するアプリケーションという位置付けでした。
  • ある程度モジュールに分けられていたのでソースコードが読みやすかったです。


  • 様々なプロンプトのテクニックが駆使されているのでとても勉強になりました。
  • 「AIではまだ不可能」と考えていた事象が、「このように作ればできそう」という考えができるようになりました。
  • 自分のやってほしいタスクを正確にLLMへ伝達するスキルが重要になると思いました。具体的には、テクニカルライティングスキルプロンプトの手法です。
  • LLMを高校生、大学生の思考力、格段に高い外部記容量を備えている人として捉えると、その人に対して丁寧に何をすればよいか説明することに作業がにてます。新人教育と同じ感じです。
  • 今回はPythonで書かれたソースコードですが、同様の事をDifyで作れると思います。
