まさぴょん🐱

<h2 id="%E9%99%90%E3%82%89%E3%82%8C%E3%81%9F%E8%A8%88%E7%AE%97%E8%B3%87%E6%BA%90%E3%81%A7%E9%AB%98%E3%81%84%E7%B2%BE%E5%BA%A6%E3%82%92%E5%87%BA%E3%81%99%E3%81%9F%E3%82%81%E3%81%AB%E4%BD%BF%E3%81%88%E3%82%8B%E3%82%A2%E3%83%97%E3%83%AD%E3%83%BC%E3%83%81%F0%9F%93%9D" data-line="0" class="code-line">
<a class="header-anchor-link" href="#%E9%99%90%E3%82%89%E3%82%8C%E3%81%9F%E8%A8%88%E7%AE%97%E8%B3%87%E6%BA%90%E3%81%A7%E9%AB%98%E3%81%84%E7%B2%BE%E5%BA%A6%E3%82%92%E5%87%BA%E3%81%99%E3%81%9F%E3%82%81%E3%81%AB%E4%BD%BF%E3%81%88%E3%82%8B%E3%82%A2%E3%83%97%E3%83%AD%E3%83%BC%E3%83%81%F0%9F%93%9D" aria-hidden="true"></a> 限られた計算資源で高い精度を出すために使えるアプローチ📝</h2>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p data-line="3" class="code-line">限られた計算資源で高い精度を出すために、</p>
<ol data-line="4" class="code-line">
<li data-line="4" class="code-line">大きなモデルをLoRA(一部だけ学習)</li>
<li data-line="5" class="code-line">小さなモデルをSFT（全体を学習）</li>
</ol>
<p data-line="7" class="code-line">どっちをやるか？</p>
</div></aside>


<h2 id="%E3%83%88%E3%83%AC%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E3%81%AEsft--%3E-rl%E3%81%AE%E9%A0%86%E5%BA%8F%F0%9F%93%9D" data-line="0" class="code-line">
<a class="header-anchor-link" href="#%E3%83%88%E3%83%AC%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E3%81%AEsft--%3E-rl%E3%81%AE%E9%A0%86%E5%BA%8F%F0%9F%93%9D" aria-hidden="true"></a> トレーニングのSFT -&gt; RLの順序📝</h2>
<p data-line="2" class="code-line">SFTでできるだけいい点数を取ってからRLをする方がいいかも。<br>
RLのトレーニングでマイナスになるケースが多いです。</p>


【LLM Tips/ML Tips】LLMモデルの精度向上 / 高い精度を出すために使えるアプローチ📝

lora

llmtips

mltips

llmモデルの精度向上tips

パラメーター調整

【生成AI】就活・転職のサポートをしてくれるAI AgentをGoogle✖️Zennハッカソンで開発しました🌟

AI Agent Hackathon with Google Cloud

GIFTech 2024 春ハッカソンで、ゆうちゃみさんの充電を支援するiOS App「#ゆーちゃーじぃ」を開発して優勝しました！

記事投稿コンテスト「今年の最も大きなチャレンジ」