chatGPTは約分ができない
茶番
そう、その時は急に訪れた。
暇つぶしにテイキョウヘイセイダイガク♪の数学の問題を解き、解答が公開されていないのでchatGPTに答えを出してもらおうと思い、大問1の(1)をchatGPTに解いてもらった時のことだ。
PocoPota氏「まぁ最初の計算問題くらい一瞬で解いてくれるだろう。」
chatGPT「有理化をするには。。。(略)。。。=3+2√2」
PocoPota氏「最後の最後で約分ミスってるやん!」
なんということでしょう!途中まできちんと正確に計算してくれているのに、最後の最後で約分ができていない!!
まぁ、、多分、、こういうのはもう一度計算をさせると、、うまくいく、、ハズ。。。
そんなことはありませんでした。。
まぁ茶番はここまでとして、なぜchatGPTが有理化の手順まではきちんとできているのに約分ができないかを検証していきたいと思います。
chatGPTはあくまでも言語モデルなので計算能力を期待するのはナンセンスかもしれませんが、世間でここまで期待されていたらしょうがないですね。
調査開始!
調査方法としては様々なバリエーションの約分問題を出題し、解いてもらい傾向をつかんでいきます。
A/A
1,まずは
おっと、答えが
ちなみに既約分数とは以下のような分数です。
分母と分子に1以外の公約数がなくて、それ以上に約分できない分数
お次は
少し数字を大きくしてみました。今回はは
はじめに割り切れる最小の数で割るような処理が走っているのでしょうか?もう少し試してみます。
(1)(2)は既約分数ですとか言いながら、割ってきています。ツンデレなんでしょうか。(3)は正解ですね。
nA/A
2,おそらくこれを読んでいる9割の人が好きであろう
素因数分解かのように、2で割って、2で割って、2で割ってを繰り返しています。
3,2の発展的実験
さっきの計算で
まぁ、間違えではないです。
言い方を変えてみました。これだと整数まで持ってきてくれます。
ということで、前に出題したものに「整数にしろ」と指示を追加してみました。きちんと整数にしてくれます。
これだけだと比較対象がありませんね。同じ指示のまま他の分数も出題しました。
全てにおいてきちんとできていますね。(4)では急に最大公約数とかいうワードを出してきて、今までと比べて賢いですね。
nA/mA
4,若干前の発展的実験の章で既に出題していますが、
きちんと最大公約数を考えて約分をし、全て正解です。前にあった2でどんどん割っていく方法はどこへ行ったのでしょうか。
ーーー素因数分解方式はどこへ行ったのか。 もう一度同じ問題を出してみました。
んんんん?普通に解いていやがる。気まぐれか?
\pi などを含む分数
5,ルートやルートや
ちょっとよくわかりませんね。「両方に2をかける」と言ってますが2はかけていないし、なぜ外へ出した2を無視して
これは√の入力形式的にきちんと理解できていない可能性があるので同じ問題をTeXを使って出題してみます。
chatGPTもTeXを使っていたので見やすいようにTeXを出力したものを貼り付けます。
自分:
を約分してください。 \dfrac{2\sqrt{3}}{4}
====以下chatGPT====
分子と分母の両方に2をかけることで、分数を簡単にできます。
\dfrac{2\sqrt{3}}{4} = \dfrac{2 \times 2 \times \sqrt{3}}{4 \times 2} = \dfrac{4\sqrt{3}}{8}
分子と分母を2で割ることで、更に簡単にできます。
\dfrac{4\sqrt{3}}{8} = \dfrac{\sqrt{3}}{2}
よって、は、 \dfrac{2\sqrt{3}}{4} となります。 \dfrac{\sqrt{3}}{2}
やはり何故か最初に2をかけています。そして「2で割る」といいつつ実際は4で割ることで正解の解答を出しています。
意味がわかりません。もう少し他の問題も出してみます。
自分:
を約分してください。 \dfrac{2\pi}{4}
====以下chatGPT====
は、分子と分母の両方に2をかけることで、簡単に約分できます。 \dfrac{2\pi}{4}
\dfrac{2\pi}{4} = \dfrac{2 \times \pi}{4 \times 2} = \dfrac{\pi}{2}
よって、は、 \dfrac{2\pi}{4} となります。 \dfrac{\pi}{2}
これは駄目ですね。答え自体は正解ですが途中式が全然成立していません。
「よって」とか使っちゃってますけど、全然「よって」が成り立っていません。
そしてまたもや謎の2をかけています。他の問題も出してみます。
自分:
を約分してください。 \dfrac{3\pi}{9}
====以下chatGPT====
は、分子と分母の両方を3で割ることで、簡単に約分できます。 \dfrac{3\pi}{9}
\dfrac{3\pi}{9} = \dfrac{3}{3} \times \dfrac{\pi}{9} = 1 \times \dfrac{\pi}{3} = \dfrac{\pi}{3}
よって、は、 \dfrac{3\pi}{9} となります。 \dfrac{\pi}{3}
解説と式が表していることが違うような気がしますが、答えはあっています。
ルートや
6,5の発展形
次は
(何故か急に一部だけTeXで数式を表示してくれました。ありがたい。)
これは正常に約分できていますね。
自分:
を約分してください。 \dfrac{6+2\sqrt{3}}{4}
====以下chatGPT====
まず、を 4 で割ります。 6+2\sqrt{3}
\dfrac{6+2\sqrt{3}}{4}=\dfrac{6}{4}+\dfrac{2\sqrt{3}}{4}=\dfrac{3}{2}+\dfrac{\sqrt{3}}{2}
次に、分数の約分を行いますが、分母は既に最小化されているので、分子を約分することができます。 \dfrac{3}{2} + \dfrac{\sqrt{3}}{2}
\dfrac{3}{2}+\dfrac{\sqrt{3}}{2}=\dfrac{3+\sqrt{3}}{2}
したがって、を約分すると、 \dfrac{6+2\sqrt{3}}{4} となります。 \dfrac{3+ \sqrt{3}}{2}
「分子を約分」とかいうよく分からないこと(通分?)を言っていますが答えは合っています。
まぁ、いいんじゃないでしょうか。一番最初の茶番部分と同じ問題を出したのですが、きちんと正解してくれています。この違いは何なのでしょうか。
7,繁分数
繁分数とは分母分子にまた分数が含まれている形です。例えば、
よくよく考えてみると、これは約分では無い気がするのでまた今度の機会に。
8,大きい数の分数
これまでは多くても3桁までの数しか用いずに分数を作ってきました。もっと大きな数を用いて約分をさせてみます。5桁の数を用いた分数の約分の問題は大学入試などで出てくることもあります。人間がする場合はユークリッド互除法などを使って解きますがchatGPTはどうするのでしょうか。
方針は良いでしょう。あたかも正解かのように振る舞っていますが、素因数分解がどちらも間違っています。
きちんと素因数分解をすると以下のようになり、83が共通になります。
12533 = 83 \times 151
15853 = 83 \times 191
よって約分結果は
まとめ
chatGPTに約分をするよう言うと、時には正解を出力したり、時には不正解やよく分からないことを気まぐれで出力することがわかりました。
それもそのはず。chatGPTは実際に計算をしている訳ではなく、過去に人間が積み上げてきた文章を学習し、それっぽい文章を生成し、出力しているだけなのですから。
現時点ではまだ計算などは厳しいようです。もしかしたら今後計算などもできるようになったりするかも(?)期待です。
Discussion