🐡

chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話

2023/04/24に公開
1

先日、データ解析のセミナーを開催しました。
未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。

好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。
https://www.youtube.com/watch?v=OGELZUzBFL0&t=1414s

このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサイエンスのコンペティションサイトに応募したところ、上位6.5%に入ることができたという報告を受け、驚愕しました。

chatGPTを上手く使えば素人がプロに勝つことも十分できるのだなと実感しました。

友人が参加したデータサイエンスのコンペは、SIGNATEの糖尿病予測問題でした。


以下のような進め方をしたとのことでした。

まず、問題の概要を説明して、どのように進めていけば良いかを確認したそうです。

そうすると、chatGPTからデータサイエンスの問題を解くための手順を一覧化してくれて、それに沿って行っていけば良いと回答をもらえました。サンプルコードまで出してもらうことができます。

教えられた手順を進める中で、コードの意味が分からない時は、そのままコードを貼り付け、コードの意味の説明をもらっていました。

コードでは相関分析をしているということがわかったのですが、そもそも相関分析とはどういう分析なのかを聞いたら丁寧に回答してくれています。

データを分析していく中でmatplotlibというパッケージを使って、グラフを作成していくことがよくありますが、このパッケージの使い方から教えてくれます。

作成したグラフの読み取り方についてもchatGPTは丁寧に教えてくれます。
短期記憶を保持しているので、matplotlibのコードであることを踏まえて、これはどういうグラフなのかを解説してくれます。

それぞれの説明変数である体重や年齢と目的変数である糖尿病であるかどうかの相関係数を算出したら、
年齢やBMIといった値が比較的相関係数が高い傾向にあることがわかりました。

目的変数と関係の深い特徴量を選別して、予測モデルを作る段階に入りました。
予測モデルを作る手順について確認すると以下のようにきちんと回答してくれています。

学習用データと検証用のデータをどうやって使って、予測モデルの精度を出すのか、解説してくれます。

概念を理解しづらい、学習データと検証データの分割については、何度も聞いて、理解を進めていました。
何度も聞いても怒らないchatGTP、本当良いやつですね。

手順を進めてエラーが出るたびにchatGPTに確認することで一人でエラーを乗り越えられました。

予測モデルの作成・精度の検証までできたら、今までの話し合いをまとめて整理してもらいました。これで大まかな流れを復習できました。

作成した予測モデルの精度向上のために、どのような方法があるかを確認すると、さらに特徴量を選別し、特徴量エンジニアリング(!!!)を提案されました。私が解説したハンズオンセミナーでは特徴量エンジニアリングまで全然触れられていなかったのですが、chatGPTとの対話を進める中でここまでできるのかと驚きました。

特徴量エンジニアリングのアドバイスを受け、何度か試行錯誤して、予測結果を提出したところ、上位6.5%に入ることができたとのことです。

予測モデルを作成するのは今まで専門家しか作れなかったと思います。

しかし、一度概要を掴んで、あとはchatGPTに聞いていけば、ベストプラクティスを簡単に実践することができるようになり、プロは素人に簡単に負ける時代に入ったよ、という驚愕のお話でした。

もちろん、株式会社piponでも技術でお困りのことがある方はオンライン相談が可能です。
こちらから会社概要資料をDLできます!
お問い合わせ内容に「オンライン相談希望」とご記載ください。
https://share.hsforms.com/19XNce4U5TZuPebGH_BB9Igegfgt

株式会社piponでは定期的に技術勉強会を開催しています。
ChatGPT・AI・データサイエンスについてご興味がある方は是非、ご参加ください。
https://chatgptllm.connpass.com/

株式会社piponではChatGPT・AI・データサイエンスについて業界ごとの事例を紹介しています。ご興味ある方はこちらのオウンドメディアをご覧ください。
https://bigdata-tools.com/

追記:彼にインタビューしました。実際にどのようにchatGPTを使ったのかが伝わると思います。
https://www.youtube.com/watch?v=zJzy6-Q_MFc

株式会社piponのテックブログ

Discussion

higelinhigelin

Beginner限定コンペと書いてあるように見えるので、プロには勝っていないのでは?