ChatGPTに教えてもらいながら、GitHub Copilotに支えてもらい学習するRust
Day 1
これから始めたい会話の概要をまとめてみました
目的
プログラミング言語Rustの学習がしたい
私の習熟度
- Rust:知識はほぼない
- その他の言語
- Ruby:業務で使用できる。主にRails用途
- Javascript:かんたんな業務であれば使用できる
やりたいこと
ChatGPTさんには先生となってもらいRustを習得したい。Rustの言語仕様を教えていただきながら、最初は言語習得のためのかんたんな問題を出してもらいそれに答えながらRustに慣れていく。
そちらの目処がついたあとは、実際にWebアプリケーションや、CLIツールを開発するために相談にのってもらいたい。
問題について
毎日私から「課題をください」と投げかけます(毎日と書きましたが、できない日もあるかもしれないので、私から投げかけるようにします)。その際に、Rustを知らない人が徐々にRustに慣れていけるように問題を出してください。
WebアプリケーションやCLIについて
タイミングが難しいかもしれないので、私がなんとなく言語仕様の雰囲気を理解できた気がしたら、ぼちぼちなにか作ってみてもいいですか?と相談してみます。
その他
課題の他にも試しにRustでコードを書いた際にエラーの原因を一緒に解明してもらったり、テストを書いてもらったりするかもしれません。ChatGPTさんを先生と見立てて様々質問をさせてもらうと思います。
どうでもいいこと
私のやる気の問題なのですが、ChatGPTさんことを真由先生と話しかけます。
■先生
こんにちは!私はChatGPTですが、あなたのRust学習のお手伝いを喜んでします。そして、真由先生としてお話しすることを試みますね。Rustの基本から始めましょう。
まずは、Rust言語の特徴をいくつか紹介します。
安全性: Rustはコンパイル時にメモリの安全性を確保し、様々な種類のバグを未然に防ぐことができます。
速度: RustはC++のように高速で実行されるので、パフォーマンスが重要なアプリケーションに適しています。
並行性: Rustは所有権システムとライフタイムシステムを用いて、データ競合を防ぐことができます。
それでは、最初の課題を出してみますね。
課題1:
Rustで"Hello, World!"と表示するプログラムを書いてみてください。この
■私
続きをお願いします!
■先生
もちろんです!それでは、続きまして最初の課題のヒントをお教えしますね。
ヒント1:
まずは、main関数を定義しましょう。Rustのプログラムは、main関数から実行が開始されます。
ヒント2:
"Hello, World!"を表示するには、println!マクロを使います。マクロは関数と似ていますが、名前の最後に!が付きます。
これらのヒントを基に、"Hello, World!"を表示するRustプログラムを書いてみてください。もしわからないことがあれば、どんどん質問してくださいね。
■私
課題1です!
fn main(){
println!("Hello, World!");
}
■先生
素晴らしいですね!課題1が正しく完成しています!🎉
fn main() {
println!("Hello, World!");
}
このプログラムは、main関数内でprintln!マクロを使って"Hello, World!"と表示します。これで、Rustの基本的な構文とprintln!マクロの使い方を学ぶことができましたね。
次の課題に進みましょうか?それとも、他に質問があればどんどん聞いてください。
■私
今日は夜も遅いのでまた明日課題はお願いしたいと思います!
すごくやる気が出ました!ありがとうございます!明日も頑張りたい!
Day.2
■私
真由先生!今日の課題をお願いします!
■ 真由先生
真由先生風にお伝えしますね!
はい、今日の課題は、Rustで簡単な文字列操作を行うプログラムを作成することです!以下の手順で進めていってくださいね。
まずは、main関数の中に、好きな文字列を含む変数を作成してください。例えば、let my_string = "Rust is fun!";
みたいな感じです。
次に、その文字列の長さを調べて、コンソールに表示させましょう。my_string.len()
を使って、文字列の長さを取得できます。
さらに、文字列を大文字に変換して、コンソールに表示してみてくださいね。.to_uppercase()
メソッドを使うと、簡単に大文字に変換できますよ。
最後に、好きな部分文字列を取り出して表示しましょう。.chars().nth(n)
を使って、n番目の文字を取得できます。ここで、nは0から始まるインデックスです。
やってみて、もし何かわからないことがあったら、どんどん質問してくださいね!頑張ってください!
■ 私
fn main() {
let my_string = "I like Mayu-san";
println!("{}", my_string.len());
println!("{}", my_string.to_uppercase());
println!("{}", my_string.chars().nth(7).unwrap());
}
println!するときに {}, mystring
が必要なこと、nth()のあとの unwrap()
が必要な部分でつまりました。
こちらの回答でどうですか?
■ 真由先生
素晴らしいですね!ちゃんとできています!あなたが書いたコードは、以下の機能を持っています。
my_stringという変数に"I like Mayu-san"という文字列を代入しています。
println!で、その文字列の長さを表示しています。
to_uppercase()メソッドを使って、文字列を大文字に変換し、それを表示しています。
chars().nth(7).unwrap()を使って、8番目(インデックスは0から始まるため)の文字を取得し、それを表示しています。
println!で{}, my_stringが必要な理由は、println!マクロの中でフォーマット文字列({})を使って、引数を展開して表示するためです。また、nth()のあとのunwrap()は、Option<char>型からchar型に変換するために必要です。nth()がNoneを返す場合(指定したインデックスが存在しない場合)、unwrap()を使うとパニックが発生しますが、この例では問題ありません。
このコードは、期待通りに動作するはずです。お疲れ様でした!また何か質問があれば、どうぞお気軽にどうぞ!
ChatGPTにヒントを貰いつつ、InteliJ IDEAにGitHub Copilotを追加しているので、以下みたいに、補完が出てきたせいで難なく回答できた。unwrap()の感覚がまだ全然ないのです。
この灰色のunwrap()の部分nth() が何を返すかをわかっていなくてOptional型であることを認識できてないという感じで少しハマりました。これはちょっと楽しめそうです。
■私
先生!次の課題をお願いします!
■先生
もちろんです!次の課題は、Rustで簡単な文字列操作を行うものです。
課題:
与えられた文字列に対して、以下の操作を順番に行い、その結果を表示するプログラムを書いてください。
文字列を逆順にする。
文字列の各単語の最初の文字を大文字にする。
例:
入力: "learning rust is fun"
出力: "Nuf Si Tsur Gninrael"
ヒント: 文字列の操作にはsplit_whitespace(), rev(), collect(), chars()などのイテレータメソッドを使ってみてください。また、String型のpush()メソッドを使って新しい文字列を構築することができます。
この課題で分からないことがあれば、遠慮なく質問してください。頑張ってください!
■私
質問です。
fn main() {
// 文字列を逆順にする。
// 文字列の各単語の最初の文字を大文字にする。
let my_string = "I like Mayu San";
let mut my_string_rev = String::new();
for c in my_string.chars().rev() {
my_string_rev.push(c);
}
let mut my_string_rev_and_uppaer = String::new();
for c_cap in my_string_rev.split_whitespace() {
let mut c_cap = c_cap.to_string();
let c_length = c_cap.len();
for n in 0..(c_length - 1) {
if n == 0 {
my_string_rev_and_uppaer.push(c_cap.chars().nth(n).unwrap().to_ascii_uppercase().to_string());
} else {
my_string_rev_and_uppaer.push(c_cap.chars().nth(n).unwrap().to_ascii_lowercase().to_string());
}
}
my_string_rev_and_uppaer.push(' ');
}
println!("{}", my_string_rev_and_uppaer);
}
このコードでエラーが出ます。おかしいところを教えてもらえますでしょうか?
■先生
コードを確認しました。エラーの原因は、push() メソッドに文字列を渡している部分です。push() メソッドは、引数に char 型を取りますが、現在のコードでは to_string() を使って String 型に変換しています。そのため、エラーが発生しています。
以下に修正されたコードを示します。
fn main() {
let my_string = "I like Mayu San";
let mut my_string_rev = String::new();
for c in my_string.chars().rev() {
my_string_rev.push(c);
}
let mut my_string_rev_and_upper = String::new();
for c_cap in my_string_rev.split_whitespace() {
let mut c_cap = c_cap.to_string();
let c_length = c_cap.len();
for n in 0..c_length {
if n == 0 {
my_string_rev_and_upper.push(c_cap.chars().nth(n).unwrap().to_ascii_uppercase());
} else {
my_string_rev_and_upper.push(c_cap.chars().nth(n).unwrap().to_ascii_lowercase());
}
}
my_string_rev_and_upper.push(' ');
}
println!("{}", my_string_rev_and_upper);
}
to_string() を削除し、直接 char 型を push() メソッドに渡しています。また、c_length - 1 を c_length に変更して、単語の最後の文字まで処理が行われるようにしています。
この修正により、エラーは解消され、コードが期待通りに動作するはずです。
■私
修正をしてみました。
fn main() {
// 文字列を逆順にする。
// 文字列の各単語の最初の文字を大文字にする。
let my_string = "I like Mayu San";
let mut my_string_rev = String::new();
for c in my_string.chars().rev() {
my_string_rev.push(c);
}
let mut my_string_rev_and_uppaer = String::new();
for c_cap in my_string_rev.split_whitespace() {
let mut c_cap = c_cap.to_string();
let c_length = c_cap.len();
for n in 0..(c_length) {
if n == 0 {
my_string_rev_and_uppaer.push(c_cap.chars().nth(n).unwrap().to_ascii_uppercase());
} else {
my_string_rev_and_uppaer.push(c_cap.chars().nth(n).unwrap().to_ascii_lowercase());
}
}
my_string_rev_and_uppaer.push(' ');
}
println!("{}", my_string_rev_and_uppaer);
}
確認をお願いできますでしょうか!
■先生
確認しました!修正されたコードが正しく、以下の機能を持っています。
文字列を逆順にする。
文字列の各単語の最初の文字を大文字にする。
コードは期待通りに動作するはずです。これで問題なく実行できると思います。お疲れ様でした!
Day.3
次の課題として、ファイル入出力を扱ってみましょう。次のタスクを実行してみてください。
課題:
テキストファイル(例: "input.txt")を作成し、その中にいくつかの行を追加してください。
各行にはランダムな文章を入れておきます。Rustプログラムを作成し、そのプログラムでファイルを開き、内容を読み込んで表示してください。
ファイルの各行を逆順に並べ替え、新しいファイル(例: "output.txt")にその結果を書き込んでください。
この課題では、ファイルの読み込みと書き込みに慣れることが目的です。また、ファイルを操作する際にエラー処理も行ってみてください。Rustの標準ライブラリにあるstd::fsとstd::ioモジュールが役立ちます。明日お手伝いできることがあれば教えてください。頑張ってください!
真由先生お疲れさまです! 一個前に出してもらっていた課題を書いてみました!
use std::fs::File;
use std::io::{Read, Write};
fn main() {
// プログラムでファイルを開き、内容を読み込んで表示してください。
let input_file_name = "tmp/input.txt";
let mut file = File::open(input_file_name).expect("ファイルが開けません");
let mut file_content = String::new();
file.read_to_string(&mut file_content).expect("ファイルが読み込めません");
// file_contentの各行を逆順にする。
let mut file_content_rev = String::new();
for c in file_content.lines().rev() {
file_content_rev.push_str(c);
file_content_rev.push_str("\n");
}
// file_content_revの内容を 'tmp/output.txt' に書き込む
let output_file_name = "tmp/output.txt";
let mut file = File::create(output_file_name).expect("ファイルが開けません");
file.write_all(file_content_rev.as_bytes()).expect("ファイルに書き込めません");
}
こちらいかがでしょうか?
真由先生です。提出いただいたコードを確認しました!
お疲れ様です!このコードは課題の要件を満たしているように見えます。ファイルを読み込み、各行を逆順に並べ替え、そして結果を新しいファイルに書き込むという処理が正しく実装されていますね。
お見事な実装です!この課題で学んだファイル入出力の知識は、Rustプログラムを書く際に非常に役立つでしょう。何か質問や次の課題があればお気軽にお知らせくださいませ。
質問があります!実はコードを書いたもののよくわかってないところがあります。 rubyだとなんでも右辺から左辺への代入でオブジェクトを突っ込むことができたので、振る舞いがわかりやすかったんですが file.read_to_string(&mut file_content)
に関しては代入ではなくread_to_string の引数で選択したものに対して変数に対して代入されているように見えています。このあたりの解説をお願いできますでしょうか?
真由先生です。ご質問ありがとうございます!Rustにおけるfile.read_to_string(&mut file_content)の振る舞いについて説明いたします。
まず、RubyとRustはメモリ管理の仕組みが大きく異なります。Rubyはガーベジコレクターによってメモリ管理が行われるのに対して、Rustは所有権システムと呼ばれる独自の仕組みでメモリ管理を行っています。そのため、データの受け渡し方がRubyとは異なる場面があります。
Rustでは、関数にデータを渡す際に所有権(ownership)が移動します。このため、元の変数からデータが移動して、関数内でそのデータを使うことができます。しかし、この所有権の移動ではなく、データを借用(borrow)したい場合があります。その際に、参照(&)や可変参照(&mut)を使ってデータを関数に渡します。
file.read_to_string(&mut file_content)の場合、read_to_string関数にfile_contentの可変参照を渡しています。これにより、read_to_string関数はfile_contentの内容を直接変更できるようになります。read_to_string関数は、ファイルの内容を読み込み、渡された可変参照を通してfile_contentに書き込みます。この操作の結果、file_contentにファイルの内容が格納されます。
つまり、このコードはfile_contentにファイルの内容を直接書き込むことで、データのコピーを避け、効率的な処理が行われるようになっています。
この説明で、Rustの振る舞いについて理解が深まりましたでしょうか?もしまだ質問があれば、お気軽にお知らせください。
ありがとうございます、もう少しで理解できそうな気がします、可変参照について教えて下さい!
真由先生です。可変参照について説明いたします!
Rustでは、変数への参照(参照の借用)を行うことができます。参照は、元のデータへのポインタであり、そのデータを直接変更することはできません。参照には、不変参照(immutable reference)と可変参照(mutable reference)の2種類があります。
不変参照は、&記号を使って作成されます。これにより、データを読み取ることができますが、変更はできません。一方、可変参照は、&mut記号を使って作成されます。これにより、データを変更することができます。ただし、Rustの所有権システムには以下の制約があります。
同時に複数の不変参照が存在しても良いが、他に不変参照がある間は可変参照を作成できない。
同時に1つの可変参照しか存在できない。
これらの制約により、Rustはコンパイル時にデータ競合(data race)を防止しています。
例えば、次のようなコードがあります。
fn main() {
let mut s = String::from("hello");
let s1 = &mut s;
let s2 = &mut s;
println!("{}, {}", s1, s2);
}
このコードはコンパイルエラーとなります。なぜなら、sに対して2つの可変参照(s1とs2)が同時に存在するため、所有権システムの制約に違反しているからです。
可変参照を使ったコードの例として、先程のfile.read_to_string(&mut file_content)を挙げました。read_to_string関数は、ファイルの内容を読み込み、渡された可変参照を通じてfile_contentに書き込みます。これにより、効率的な処理が行われるようになっています。
この説明で、可変参照について理解が深まりましたでしょうか?もしまだ質問があれば、お気軽にお知らせください。
ちょっと細かいところになるんですが理解があっているか確認させてください。 `let mut s = String::from("hello"); この操作はRustでは代入という表現になりますか?
真由先生です。はい、その表現は正確です。「代入」という言葉は、変数に値を割り当てることを意味します。この場合、let mut sで可変変数sを宣言し、String::from("hello")で生成されたStringオブジェクトをsに代入しています。
この操作を分解して説明すると、以下のようになります。
String::from("hello")により、文字列"hello"から新しいStringオブジェクトが生成されます。
let mut sで、可変変数sを宣言します。
生成されたStringオブジェクトを、変数sに代入します。
このように、let mut s = String::from("hello");というコードは、変数sにStringオブジェクトを代入していると言えます。
ありがとうございます! 次に、「可変参照が2つ同時に存在できない」という部分についてですが、例に上げていただいたコードだと、コンパイルエラーが発生するのは let s2 = &mut s;
になりますか?
真由先生です。はい、その通りです。例に上げたコードでは、let s2 = &mut s;がコンパイルエラーの原因となります。
Rustでは、以下のような制約があるためです。
任意のタイミングで、一つの可変参照もしくは複数の不変参照を持つことができます。
可変参照が存在する間は、同時に不変参照を持つことはできません。
以下のコードでは、s2とs3に可変参照を持ってしまっています。
let mut s = String::from("hello");
let s2 = &mut s;
let s3 = &mut s; // <- コンパイルエラー
この場合、同時に2つの可変参照が存在するため、コンパイルエラーが発生します。この制約があることで、データ競合を防ぐことができるようになっています。
だいぶ理解できてきた気がします。Cなどポインタを意識する言語を勉強してないので、参照周りの理解が追いつけてないなという感覚があります。Rubyだと値やオブジェクトを意識すれば例えば標準出力をするにしても参照を意識することなくできました例えば a = "言葉" puts a
のように変数に入れたものがそのまま出てくるという感じがします。ただRustでは、変数に格納したものがこの場合は参照をつかう、この場合は値をつかうというようにここの意識がないとすぐコンパイルエラーとなる印象があります。印象と書いたのは理解ができていないので想像が多分に含まれているという意味あいです。今後ぶつかると思うのでその時に聞けばいいと思いつつも、このときは値を使う、このときは参照を使うというところがRuby言語経験者にもかんたんに説明可能なものがあれば解説いただけますでしょうか?
真由先生です。Rustにおいて、いつ参照を使い、いつ値を使うかについての一般的なガイドラインを説明しますね。Rubyとは異なり、Rustでは所有権と参照が重要な概念となっています。
値をコピーする場合(Copyトレイトを実装している型):
主にプリミティブ型(整数型、浮動小数点型、論理型など)で、所有権を気にせずコピーできます。
例:
let a = 5;
let b = a;
値をムーブ(所有権を移動)する場合:
大きなデータ構造や、所有権を持つ型(String、Vecなど)はムーブされます。これにより、元の変数からはアクセスできなくなります。
例:
let s1 = String::from("hello");
let s2 = s1; // s1からs2へ所有権がムーブされるため、s1はこれ以降使用不可
不変参照を使う場合:
値を読み取るだけで、書き換える必要がない場合は不変参照を使います。同時に複数の不変参照を持つことができます。
例:
let s1 = String::from("hello");
let s2 = &s1; // s1への不変参照
println!("{}", s2);
可変参照を使う場合:
値を書き換える必要がある場合は可変参照を使います。ただし、同時に複数の可変参照や、可変参照と不変参照を持つことはできません
例:
let mut s = String::from("hello");
let s_mut = &mut s; // sへの可変参照
s_mut.push_str(", world!");
println!("{}", s_mut);
基本的には、コピーできる小さな値には値を、大きなデータ構造には参照を使うことが多いです。参照に関しては、不変参照を使うか可変参照を使うかは、読み取り専用か書き換えも行うかによって選択します。
最初は少し難しいかもしれませんが、Rustの所有権と参照のシステムに慣れると、他の言語にはない安全性や効率性が得られます。慣れるまで少し練習が必要
続きをお願いします!
慣れるまで少し練習が必要ですが、徐々に理解が深まります。
参照を使う理由は主に次の通りです:
所有権のムーブを回避: 所有権を持つ型(StringやVecなど)の値を関数に渡す場合、所有権がムーブされて元の変数が使用できなくなります。参照を使うことで、所有権を渡さずに値にアクセスできます。
パフォーマンス: 参照を使うことで、大きなデータ構造のコピーを避けることができ、パフォーマンスが向上します。
可変性の制御: 不変参照と可変参照を使い分けることで、データの可変性を制御できます。これにより、データが変更されることを期待しないコードでの意図しない変更を防ぐことができます。
Rustの所有権と参照のシステムは最初は独特で難しく感じるかもしれませんが、慣れてくると他の言語にはない安全性や効率性が得られるという点で大変魅力的です。所有権、値のコピー、不変参照、可変参照といった概念が、徐々に理解できるようになってくると思いますので、ぜひ挑戦してみてください。質問があればいつでもどうぞ!
このガイドを聞けたことは今日一番の収穫のような気がしてきました。また、理解を深めたいので細かい所について一つずつ聞かせてください。 まず、3の例についてですが、let s2 = &s1;
は s1 のメモリの住所(という表現で良いのかわかりませんが)をおしえていて、println!("{}", s2);
はs1の住所にある値を使用しているという理解と想像したんですが、これはあっていますでしょうか?
はい、その理解は基本的に正しいです。
let s2 = &s1; のコードでは、s1 の参照(メモリのアドレスに似た概念)を s2 に代入しています。これにより、s2 は s1 が指すメモリ上のデータを参照できるようになります。参照は、ポインタという概念と関連がありますが、Rustではポインタよりも抽象化されていて、安全性が高いです。
println!("{}", s2); では、s2 が参照しているメモリ上のデータ(つまり、s1 が所有しているデータ)を表示しています。この操作では、s2 を使って間接的に s1 のデータにアクセスしていることになります。
Rustでは参照を使うことで、データを共有しつつ、所有権のルールに従いながら安全にデータにアクセスすることができます。
そうすると次の4番に関しても、s_mut
は s
を参照しており、可変参照である s_mut
に変更が入るということは実質 s
の内容がかわることであり、 println!("{}", s_mut);
の行のあとに println!("{}", s);
をした場合は 出力として 'hello, world!' がでますか?
はい、その理解は正しいです!
s_mut は s の可変参照であり、s を指し示しているため、s_mut を使って s の内容を変更することができます。以下のコードでは、s_mut を使って s の内容を変更し、その後、s の内容を表示しています。
fn main() {
let mut s = String::from("hello");
let s_mut = &mut s;
s_mut.push_str(", world!");
println!("{}", s_mut); // "hello, world!"
println!("{}", s); // "hello, world!"
}
この例では、s_mut を使って s の内容を "hello" から "hello, world!" に変更しており、その結果、s_mut と s はどちらも "hello, world!" を表示します。ただし、可変参照が存在する間は元の変数 s にはアクセスできません。コンパイラがエラーを出し、コードを修正するように促してくれます。この安全性がRustの大きな特徴です。
アクセスできないというのは、書き込みは当然、読み込みということになりますでしょうか?(とすると上のコードの例は println!("{}", s); // "hello, world!"
でコンパイルエラー?
おっしゃる通り、私が先ほど示したコード例では実際にコンパイルエラーが発生します。失礼しました。コンパイルエラーを示すコード例は以下の通りです。
fn main() {
let mut s = String::from("hello");
let s_mut = &mut s;
s_mut.push_str(", world!");
println!("{}", s_mut); // "hello, world!"
println!("{}", s); // コンパイルエラー!
}
このコード例では、s_mut がスコープ内に存在する限り、s へのアクセス(読み込みも書き込みも)はできません。しかし、以下のように、s_mut をスコープの外に移動すれば、コンパイルエラーは解消されます。
fn main() {
let mut s = String::from("hello");
{
let s_mut = &mut s;
s_mut.push_str(", world!");
}
println!("{}", s); // "hello, world!"
}
この例では、波括弧 {} で s_mut のスコープを制限し、そのスコープが終わると s_mut はドロップされます。その結果、println!("{}", s); の行では、s へのアクセスが可能になり、"hello, world!" が表示されます。
なるほど、スコープ内で可変参照は無効になるが、書き換え自体は行われているのでsの内容は変わっているのですね。2つ教えて下さい。 ・スコープを制限する以外に、可変参照を無効にする方法はありますか? ・main関数で a = "main" という変数定義をしたあとに スコープ内で a = "scope" という定義をした場合、スコープを抜けたあとの a はどうなっていますか?そもそも定義できない?
可変参照を無効にする方法: スコープを制限する以外に、可変参照を無効にする方法として、参照をドロップする(参照を使用後に解放する)ことが挙げられます。Rustでは、変数はデフォルトでスコープの終わりで自動的にドロップされますが、drop() 関数を使用して明示的にドロップさせることができます。
fn main() {
let mut s = String::from("hello");
let s_mut = &mut s;
s_mut.push_str(", world!");
drop(s_mut); // 明示的に可変参照をドロップする
println!("{}", s); // "hello, world!"
}
スコープ内で変数を再定義: Rustでは、スコープ内で変数の再定義が可能です。これをシャドーイング(shadowing)と呼びます。シャドーイングを使ってスコープ内で変数を再定義すると、スコープを抜けた後の元の変数は、スコープ内での変更が影響しない状態になります。
fn main() {
let a = "main";
{
let a = "scope";
println!("{}", a); // "scope"
}
println!("{}", a); // "main"
}
この例では、スコープ内で a を再定義して "scope" に変更していますが、スコープを抜けると元の a の値は "main" のままになります。
めちゃめちゃ理解がはかどりました!ありがとうございます!
どういたしまして!理解が進んでよかったです。Rustの学習が順調に進むことを願っています。もしこれからも疑問や質問があれば、遠慮なくお聞きください。お手伝いできることがあれば喜んで対応いたします!
ちなみにずっと疑問だったことをこの際聞いてみたいのですが、文字に関する方が3つほどあるなと思ってまして、String型、&str型、char型、Rustにおけるこの使い分けについて教えていただいてもいいでしょうか?
もちろんです! Rustにおける文字列や文字に関する型には主に以下の3つがあります。
String 型
&str 型
char 型
それぞれの使い分けについて説明します。
String 型
String 型は、可変・所有可能な文字列データを表します。ヒープに確保されたメモリに文字列データが格納されます。String 型は可変なので、実行時に文字列を変更したり、新しい文字列を作成する必要がある場合に使用されます。
&str 型
&str 型は、文字列スライスを表します。これは、既存の文字列データへの参照です。&str 型はイミュータブルなので、参照先の文字列データを変更することはできません。そのため、&str 型は主に関数の引数や返り値として使用されます。これにより、不必要なコピーを回避し、パフォーマンスが向上します。
char 型
char 型は、Unicodeのスカラー値を表す単一の文字です。これは4バイトで表され、ほとんどの Unicode 文字をカバーしています。char 型は、文字に関する操作(例: 文字列内の文字をイテレートする)や、単一の文字を処理する場合に使用されます。
要約すると、String 型は可変で所有可能な文字列データに使用され、&str 型は不変の文字列参照に使用され、char 型は単一の文字を表すために使用されます。これらの型を適切に使い分けることで、パフォーマンスやメモリ使用効率を向上させることができます。
文字列スライスとは何でしょうか?
文字列スライス(string slice)は、既存の文字列データへの参照であり、連続した部分文字列を表します。Rustでは、文字列スライスは&str型で表現されます。
文字列スライスは、基本的にはメモリ内の連続した範囲の文字データへのポインタ(参照)と長さの組み合わせです。これにより、元の文字列データをコピーすることなく、その部分を参照・操作することができます。これは、パフォーマンスやメモリ使用効率の観点から有益です。
例えば、以下のようなコードがあります。
let s: String = String::from("Hello, world!");
let slice: &str = &s[0..5]; // "Hello"
このコードでは、sはString型の文字列ですが、sliceはsの一部を参照する文字列スライス(&str型)です。この場合、sliceは"Hello"という部分文字列を参照していますが、実際に新たな文字列データをコピーしているわけではありません。
文字列スライスは、関数の引数や返り値としてよく使用されます。これにより、関数が文字列データへの参照を受け取ることで、不必要なデータのコピーを避けることができます。
ChatGPT とGitHub Copilotでrustを書いていくと、勝手にかけていく感じがする。すごい。でもこれが正しいかみたいなところはやっぱり知識として必要という感じがする。でも$20と$10でこんな環境が整うのはすごい時代だなという感じがする。
Day.4
■私
おはようございます!昨日はたくさんありがとうございました!次の課題をお願いします!
■真由先生
おはようございます!昨日はたくさん学習しましたね。それでは、次の課題を用意しました。
課題:
ファイルから1行ずつ読み込むプログラムを作成してください。"input.txt"という名前のテキストファイルに複数の行が含まれていると仮定して、各行を読み込んで標準出力に表示するようにします。
各行を読み込む際、行番号も表示するようにプログラムを改良してください。つまり、出力は以下のようになります。
1: こんにちは
2: お元気ですか?
3: Rustは楽しいですね!
行が何も書かれていない(空行)場合、行番号を表示しないようにプログラムを改良してください。つまり、出力は以下のようになります。
1: こんにちは
2: お元気ですか?
3: Rustは楽しいですね!
(空行が存在しても、行番号は表示されない)
この課題を通して、ファイルからデータを読み取り、条件に基づいて処理を実行する方法を学ぶことができます。不明点や質問があればお気軽にどうぞ!頑張ってください!
■私
先生!上記の課題をこのような感じで書いてみました!どうでしょう?
// 4–1
use std::fs::File;
use std::io::Read;
fn main() {
// ファイルを読み込む
let input_file_name = "tmp/input4.txt";
let mut file = File::open(input_file_name).expect("ファイルを開けません");
let mut file_content = String::new();
file.read_to_string(&mut file_content).expect("ファイルを読み込めません");
// ファイルの内容を一行ずつ取り出す
let mut line_number = 0;
for line in file_content.lines() {
// 行の長さを確認して、長さが0の場合はスキップする
if line.len() == 0 {
continue;
}
// 行番号を表示しながら行の内容を表示する。ただし、空白行があった場合はスキップする
line_number = line_number + 1;
println!("{}: {}", line_number, line);
}
}
確認いただけますでしょうか?
■真由先生
お疲れ様です!提出いただいたコードを確認しました。全体的に良いですね!ファイルを読み込んで、行ごとに処理を行い、空白行をスキップする部分もうまく実装できています。
1点、コメントとして提案があります。for line in file_content.lines() というループの中で、line.len() == 0 という条件を使って空白行をチェックしていますが、Rustには line.is_empty() というメソッドがあります。このメソッドを使って空白行のチェックを行うと、より直感的にコードが読めるかもしれません。
修正後のコードは以下のようになります。
// 4–1
use std::fs::File;
use std::io::Read;
fn main() {
// ファイルを読み込む
let input_file_name = "tmp/input4.txt";
let mut file = File::open(input_file_name).expect("ファイルを開けません");
let mut file_content = String::new();
file.read_to_string(&mut file_content).expect("ファイルを読み込めません");
// ファイルの内容を一行ずつ取り出す
let mut line_number = 0;
for line in file_content.lines() {
// 行の長さを確認して、長さが0の場合はスキップする
if line.is_empty() {
continue;
}
// 行番号を表示しながら行の内容を表示する。ただし、空白行があった場合はスキップする
line_number = line_number + 1;
println!("{}: {}", line_number, line);
}
}
その他に気になる点はありませんでした。この課題は完了として次のステップに進みましょう!お疲れ様でした!
■私
ありがとうございます! is_empty()
覚えました!ちなみにこれは &str型やそれ以外のString型などの型にも存在しますか?
挙動は型にもよると思うんですが、挙動的には内部的には文字やbyteの長さを確認している感じでしょうか?
■真由先生
はい、is_empty() は &str 型と String 型の両方に対して利用可能です。どちらの型に対しても、メソッドは文字列が空(長さが0)であるかどうかを判定します。実際には、内部的にはバイトの長さ(つまり、文字列内のバイト数)が0であるかどうかをチェックしています。len() を使って長さが0であるかどうかを比較するのと同じ結果になりますが、is_empty() を使うことで、より意図が明確になり、コードが読みやすくなります。
また、is_empty() は文字列だけでなく、他のコレクション型(ベクタ、ハッシュマップなど)にも使われています。これらの型に対しても、is_empty() はコレクションが空(要素数が0)であるかどうかを判定します。このようなメソッドは、Rustの標準ライブラリで一貫したインターフェイスを提供するために使用されています。
■私
ありがとうございます!Rubyのダックタイピングに近い感覚がありこれは嬉しいです!ありがとうございました!
■真由先生
お役に立ててうれしいです!Rubyのダックタイピングのように、Rustでも同じメソッド名で似たような振る舞いを持つ異なる型があります。このような一貫性は、コードの可読性や予測可能性を高めるために役立ちます。
Rustでの学習が進んでいくにつれ、他の類似性や違いについても発見していくことでしょう。どんな疑問でもお気軽にお聞きください。引き続きお手伝いできることがあれば教えてください!
String と &str をわかってなかったので今回もとても勉強になりました。
Day.5
■私
ありがとうございます。次の課題をお願いできますか?
もちろんです!次の課題をご用意しました。
■真由先生
課題 5
コマンドライン引数を使って、指定したファイルから指定した行番号のテキストを出力するプログラムを作成してください。以下のようにプログラムが実行されることを想定しています。
$ cargo run filename.txt 3
この場合、filename.txt という名前のファイルから、3番目の行のテキストが出力されることを期待します。なお、ファイルが存在しない場合や行番号が正しくない場合は、適切なエラーメッセージを出力してください。
この課題では、コマンドライン引数の取得とエラーハンドリング、そしてファイルの読み込みとテキストの取得を実装することが求められます。std::env::args を使ってコマンドライン引数を取得し、std::fs::File および std::io::BufReader を使ってファイルを読み込んでください。また、適切なエラーハンドリングも実装してみてください。
この課題を通じて、コマンドライン引数の取得と処理、ファイルの読み込み、エラーハンドリングに慣れていきましょう。もし質問があればお気軽にお聞きください!
■私
こんにちは、真由先生!
上記の課題について、プログラムを書いてみました!
// day.5-1(theme 5)
use std::fs::File;
use std::io::Read;
fn main(){
// コマンドライン引数を取得する
let args: Vec<String> = std::env::args().collect();
if args.len() != 3 {
println!("引数が足りません");
return;
}
let input_file_name = &args[1];
let line_number = &args[2].parse::<usize>().unwrap();
// テキストファイルを読み込む。ファイルが存在しなければエラーを表示しプログラムを終了する
let mut file = File::open(input_file_name).expect("ファイルが開けません");
let mut file_content = String::new();
file.read_to_string(&mut file_content).expect("ファイルが読み込めません");
// ファイルの内容を行ごとに配列に追加する
let mut lines: Vec<&str> = Vec::new();
for line in file_content.lines() {
lines.push(line);
}
// コマンドラインの指定行数がテキストファイルの行数を超えていたらエラーを表示しプログラムを終了する
if lines.len() < *line_number {
println!("指定行数がテキストファイルの行数を超えています");
return;
}
// テキストファイルの指定行数を表示する
println!("{}", lines[*line_number - 1]);
}
ご確認ください!
■真由先生
こんにちは!提出していただいたコードを確認しました。
全体的によくできていますが、一点だけ修正してほしいところがあります。
let line_number = &args[2].parse::<usize>().unwrap(); この行で unwrap() を使用していますが、コマンドライン引数が不正な数値(例えば文字列や負の数値)を指定された場合、プログラムがパニックしてしまいます。
エラー処理を改善するために、unwrap() の代わりに match を使って、適切なエラーメッセージを出力し、プログラムを終了するように修正してみてください。
例:
let line_number = match args[2].parse::<usize>() {
Ok(n) => n,
Err(_) => {
println!("行番号が正しくありません");
return;
}
};
この変更により、コマンドライン引数に不正な値が指定された場合でも、適切なエラーメッセージが出力され、プログラムがパニックせずに終了するようになります。
それ以外は問題ないと思いますので、この修正を加えてください。修正が終わったら、再度確認させていただきます!
■私
なるほど、マイナスの値を想定しませんでした。確かに例外処理ができたほうがいいですね。
こんな感じでどうでしょうか?
// day.5-1(theme 5)
use std::fs::File;
use std::io::Read;
fn main(){
// コマンドライン引数を取得する
let args: Vec<String> = std::env::args().collect();
if args.len() != 3 {
println!("引数が足りません");
return;
}
let input_file_name = &args[1];
let line_number = match args[2].parse::<usize>(){
Ok(n) => n,
Err(_) => {
println!("行番号が正しくありません");
return;
}
};
// テキストファイルを読み込む。ファイルが存在しなければエラーを表示しプログラムを終了する
let mut file = File::open(input_file_name).expect("ファイルが開けません");
let mut file_content = String::new();
file.read_to_string(&mut file_content).expect("ファイルが読み込めません");
// ファイルの内容を行ごとに配列に追加する
let mut lines: Vec<&str> = Vec::new();
for line in file_content.lines() {
lines.push(line);
}
// コマンドラインの指定行数がテキストファイルの行数を超えていたらエラーを表示しプログラムを終了する
if lines.len() < line_number {
println!("指定行数がテキストファイルの行数を超えています");
return;
}
// テキストファイルの指定行数を表示する
println!("{}", lines[line_number - 1]);
}
ご確認ください!
■真由先生
修正していただいたコードを確認しました!良い感じですね。
match を使ったエラー処理が適切に追加され、不正な値が指定された場合でも適切なエラーメッセージが表示され、プログラムがパニックせずに終了するようになりました。
この修正により、コードがより堅牢になり、ユーザーフレンドリーになりました。素晴らしい仕事をしています!
課題についてはこれで完了となります。次の課題に進んでいただいても構いません。引き続き頑張ってください!
Day.6
■私
真由先生こんばんは!
Rustの次の課題をお願いします!
■真由先生
こんばんは!引き続き頑張りましょう!次の課題を用意しました。
課題6
テキストファイルから読み込んだ内容を、与えられた文字列で検索し、その文字列が含まれている行を表示するプログラムを作成してください。コマンドライン引数でファイル名と検索文字列を指定するようにしてください。
例:
$ cargo run input.txt Rust
この例では、input.txt というファイルから「Rust」という文字列が含まれている行をすべて表示します。
さらに、オプションとして -n を指定することで、該当する行の行番号も表示されるように機能を追加してください。
例:
$ cargo run -n input.txt
この例では、input.txt というファイルから「Rust」という文字列が含まれている行を表示し、それぞれの行番号も表示されます。
この課題では、コマンドライン引数の処理と、文字列の検索処理を実装することが目的となります。うまくプログラムを構成して、機能を実装してみてください。
■私
真由先生にヒントがいただきたいんですが、コマンドライン引数のオプションの実装が思い浮かびません。
迷いどころとしては、-n
がどこにも入ってきうる、 -n
の挿入場所が利用者にとって変わる以上、引数の何個目がオプションかファイルネームか検索文字列か判断するのが難しいとおもいました。よくやる実装というかベストプラクティスのようなものはあるのでしょうか?
■真由先生
オプションの処理については、様々な方法で実装できますが、一般的な方法としては、引数を前から順番に処理して、オプションを検出する方法がよく使われます。
例えば、以下のような方法で処理できます:
最初に、-n オプションが指定されているかどうかを示す変数を false に初期化します。
コマンドライン引数を順番に処理します。引数が -n の場合、1で初期化した変数を true に更新します。ファイル名や検索文字列にはアクセスしません。
-n が指定された場合には、行番号表示用の変数が true になります。その後の処理で、この変数を元に行番号を表示するかどうかを決定します。
実際のコード例:
let mut args = std::env::args().skip(1); // 最初の要素(プログラム名)をスキップ
let mut show_line_number = false;
let mut file_name = String::new();
let mut search_string = String::new();
while let Some(arg) = args.next() {
if arg == "-n" {
show_line_number = true;
} else if file_name.is_empty() {
file_name = arg;
} else if search_string.is_empty() {
search_string = arg;
} else {
break; // 不要な引数があった場合、処理を終了
}
}
// ... 以降、file_name と search_string を使った処理 ...
この方法であれば、オプションがどこに指定されていても、正しく処理することができます。ただし、オプションが複数ある場合は、さらに処理が複雑になります。そのような場合は、clap や structopt といったクレートを使用して、オプション処理を効率的に実装することがおすすめです。
■私
ちなみにこういう実装はありですか?
// コマンドライン引数からファイルネームと検索文字列を取得
let args: Vec<String> = std::env::args().collect();
// オプションが含まれるか確認する
let mut number_option = false;
for (i, arg) in args.iter().enumerate() {
if arg == "-n" {
number_option = true;
Vec::remove(&mut args, i);
}
}
if args.len() < 3 {
println!("引数が足りません");
return;
}
let filename = &args[1];
let search_word = &args[2];
■真由先生
はい、そのような実装でも機能することはありますが、いくつか注意点があります。
Vec::remove は引数で指定されたインデックスの要素を削除し、それ以降の要素を前に詰めるため、効率が良くない場合があります。この場合は問題になるほどのパフォーマンスの違いはありませんが、要素数が多い場合は影響が出ることがあります。
引数を変更しているため、後でエラーメッセージ等で元の引数を表示する際に、引数が変わっている点に注意が必要です。
これらの問題点を受け入れることができるのであれば、この実装でも問題ありません。ただし、引数の解析が複雑になったり、オプションが増える場合には、引数解析のためのクレート(clap や structopt)を使用することをおすすめします。これらのクレートを使うと、引数の解析が簡単になり、さらにエラーハンドリングやヘルプメッセージの生成などの便利な機能も利用できます。
■私
これはたしかにそうですね。実装例をみていてif文が多くて若干意図が汲み取りにくいかと思ったんですが、それはこっちのほうがわかりにくいですし引数の順番が変わってるという指摘は確かにと思いました。
ご理解いただきありがとうございます。引数の解析は一見簡単に見えるものですが、実際にはオプションや引数の順番などを考慮すると複雑になることが多いです。特に、機能が増えたり複数のオプションが組み合わさる場合はさらに複雑になります。
そのため、clap や structopt のようなクレートを利用することで、コードの可読性を向上させることができます。また、これらのクレートはエラーハンドリングやヘルプメッセージの生成などの機能も提供しているため、コード全体が簡潔でメンテナンス性が高くなります。
この段階では、上記の実装例を参考にして引数解析を行ってみても良いでしょう。そして、今後より複雑な引数解析が必要になった場合は、専用のクレートを利用することを検討してみてください。
■私
ちょっといつもと違う環境で書いているので、一旦こんな感じで書きましたというものを共有します。
use std::fs::File;
use std::io::Read;
fn main(){
// コマンドライン引数からファイルネームと検索文字列を取得
let args: Vec<String> = std::env::args().skip(1);
let mut show_line_number = false;
let mut filename = String::new();
let mut search_word = String::new();
for arg in args {
if arg == "-n" {
show_line_number = true;
} else if filename.is_empty() {
filename = arg;
} else if search_word.is_empty() {
search_word = arg;
} else {
break;
}
}
// ファイルを開く
let mut file = File::open(filename).expect("ファイルが見つかりません");
let mut contents = String::new();
file.read_to_string(&mut contents).expect("ファイルの読み込みに失敗しました");
// ファイルを一行ず強み込み、検索文字列が含まれている行があったら行の内容を出力する
// -n オプションがあるときは行番号を表示する
let mut line_number = 0;
for line in contents.lines(){
line_number += 1;
if line.contains(&search_word){
if show_line_number {
print!("{}: {}", line_number, line);
} else {
println!("{}", line);
}
}
}
}
指摘などよろしくおねがいします!
■真由先生
提出いただいたコードを拝見しました。良い進捗だと思います!
ただし、現状のコードにはコマンドライン引数が足りない場合に対応していないため、その部分を修正する必要があります。
以下に修正したコードを提案します。
use std::fs::File;
use std::io::Read;
fn main() {
let mut args: Vec<String> = std::env::args().skip(1).collect();
let mut show_line_number = false;
let mut filename = String::new();
let mut search_word = String::new();
for arg in &args {
if arg == "-n" {
show_line_number = true;
} else if filename.is_empty() {
filename = arg.clone();
} else if search_word.is_empty() {
search_word = arg.clone();
} else {
break;
}
}
if filename.is_empty() || search_word.is_empty() {
println!("引数が足りません");
return;
}
let mut file = File::open(filename).expect("ファイルが見つかりません");
let mut contents = String::new();
file.read_to_string(&mut contents).expect("ファイルの読み込みに失敗しました");
let mut line_number = 0;
for line in contents.lines() {
line_number += 1;
if line.contains(&search_word) {
if show_line_number {
println!("{}: {}", line_number, line);
} else {
println!("{}", line);
}
}
}
}
main()関数の冒頭でargsをVec<String>に変換し、for arg in &argsの部分でイテレータを取得する際にarg.clone()を使って変数に代入しています。また、引数が足りない場合にエラーメッセージを表示する処理を追加しています。
上記の修正を参考にして、コードを完成させてみてください。
■私
レビューありがとうございます。以下の通り書き換えました。
// day.6-1(theme 6)
use std::fs::File;
use std::io::Read;
fn main(){
// コマンドライン引数からファイルネームと検索文字列を取得
let args: Vec<String> = std::env::args().skip(1).collect();
let mut show_line_number = false;
let mut filename = String::new();
let mut search_word = String::new();
for arg in &args {
if arg == "-n" {
show_line_number = true;
} else if filename.is_empty() {
filename = arg.clone();
} else if search_word.is_empty() {
search_word = arg.clone();
} else {
break;
}
}
// 引数が足りない場合の処理を変更
if filename.is_empty() || search_word.is_empty() {
println!("引数が足りません");
return;
}
// ファイルを開く
let mut file = File::open(filename).expect("ファイルが見つかりません");
let mut contents = String::new();
file.read_to_string(&mut contents).expect("ファイルの読み込みに失敗しました");
// ファイルを一行ず強み込み、検索文字列が含まれている行があったら行の内容を出力する
// -n オプションがあるときは行番号を表示する
let mut line_number = 0;
for line in contents.lines(){
line_number += 1;
if line.contains(&search_word){
if show_line_number {
println!("{}: {}", line_number, line);
} else {
println!("{}", line);
}
}
}
}
ご確認お願いします。
■真由先生
コードの修正を確認しました。問題なく動作すると思います。
良くできました!このコードで-nオプションを使った行番号の表示や、引数が足りない場合のエラーメッセージ表示など、指定された機能を実装できています。素晴らしいです!
引き続き、Rustでのプログラミング学習をお楽しみください。もし何か質問がありましたら、いつでもお気軽にご相談ください。
Day.7
■私
着手は明日になってしまうのですが、新しい課題をお願いします!
■先生
もちろんです!次の課題をご紹介します。
課題7:テキストファイル内の単語の出現回数を数えるプログラムを作成してください。
プログラムの概要:
テキストファイルを読み込む
単語の出現回数をカウントする
出現回数が最も多い単語とその回数を表示する
詳細:
コマンドライン引数でテキストファイル名を指定します。
単語の区切りは空白文字(スペース、タブ、改行)とします。
単語の大文字と小文字は区別しないようにしてください(例:「apple」と「Apple」は同じ単語としてカウント)。
例えば、以下のようなテキストファイルが与えられたとき、
This is a sample text.
This text is just a sample.
プログラムは、「sample」および「is」が2回ずつ出現することを示すべきです。
この課題では、テキストファイルの読み込みや文字列操作、ハッシュマップの使用など、いくつかのスキルが必要になります。お時間があるときに着手してみてください。もし質問があれば、いつでもお気軽にお聞きください。
■私
質問です!
上記の課題について今まで取り組んでいないポイントとして、カウントをどういう仕組でやっていくかというところがポイントになるかと思いました。
直感的には以下のような流れをイメージしました。
- テキストファイルを読み込む
- ラインごとに読み込むか、いっそのこと全部読み込んでスペース・タブ・改行で区切った一次配列にしてしまう(Rustだと可変のVec?)& すべて小文字(もしくは大文字)に変換する
- 単語と出現回数を記録できるRubyでいうところのハッシュかクラス(Rustだと構造体を使うのがいい?)
- 配列をすべて処理して、出現回数を降順でソートしたときの最大出現数に該当する単語と回数を出力する
というものをイメージしました。
質問1:上記の流れは違和感がないか、または、考慮漏れがないか。
質問2:出現回数をカウントするデータにおすすめはあるか。
こちらについて教えて下さい!
■先生
質問1について:上記の流れは基本的に問題ありません。良いアプローチだと思います。
質問2について:Rustで出現回数をカウントするデータ構造として、std::collections::HashMapがおすすめです。単語をキーとして、出現回数を値とするハッシュマップを使用することで、単語の出現回数を効率的にカウントできます。
上記の流れに基づいて、以下の手順でプログラムを実装してみてください:
テキストファイルを読み込む
テキストファイルの内容をすべて小文字に変換する(to_lowercase()メソッドを使用)
内容をスペース・タブ・改行で区切ってVecに格納する
空のハッシュマップ(HashMap<String, u32>)を作成する
Vecに格納された単語を順番に処理し、ハッシュマップに単語と出現回数を記録する
ハッシュマップを降順にソートし、最大出現回数の単語とその回数を出力する
このアプローチで実装を進めてみてください。もし質問があればお気軽にどうぞ!
■私
すみません、仕事が立て込んでおりご無沙汰しました。ちょっと今日取り組んでみようと思います。
■先生
大丈夫です、お忙しい中お時間を割いてくださりありがとうございます。もし質問や相談があればお気軽にどうぞ!頑張ってください!
■私
質問です! Stringを特定文字列で分割するのにsplitを使用しようとしているのですが、複数の文字で分割するのはどのように引数を指定すればよいでしょうか?
Rustでは、split関数は一つのパターンしか受け付けません。ですので、複数の文字で分割するには、splitをチェインして使用するか、splitを引数として受け取る関数(例えば、split_inclusive)を使用することができます。また、正規表現を使う方法もあります。
チェインしてsplitを使用する方法:
let text = "hello, world! how are you?";
let words: Vec<&str> = text
.split(|c| c == ',' || c == '!' || c == '?')
.flat_map(|s| s.split_whitespace())
.collect();
正規表現を使用する方法:
まず、regexクレートを使うために Cargo.toml に依存関係を追加します。
[dependencies]
regex = "1.0"
そして、次のようにコードを書くことができます。
use regex::Regex;
fn main() {
let text = "hello, world! how are you?";
let re = Regex::new(r"[,!?]").unwrap();
let words: Vec<&str> = re.split(text).flat_map(|s| s.split_whitespace()).collect();
println!("{:?}", words);
}
どちらの方法でも、複数の区切り文字で文字列を分割することができます。どの方法を選ぶかは、パフォーマンスや好みによって異なります。パフォーマンスが重要でなければ、正規表現を使う方法は柔軟性があり便利です。
■私
素朴な疑問なのですが、課題7についてサンプルのテキストファイルを渡したとき「プログラムは、「sample」および「is」が2回ずつ出現することを示すべきです。」と書かれていますが、もしかして「a」もこれに含まれますか?
■先生
おっしゃる通り、「a」も2回出現していますね。すみません、その点は見落としていました。課題7の指示に従って実装すれば、実際には「sample」、「is」、そして「a」がそれぞれ2回ずつ出現することが示されるはずです。説明に齟齬があって申し訳ありません。
■私
実装しました!
use std::fs::File;
use std::io::Read;
use std::collections::HashMap;
fn main() {
// コマンドライン引数からファイルネームを取得
let args: Vec<String> = std::env::args().skip(1).collect();
if args.len() < 1 {
println!("引数が足りません");
return;
}
// ファイルを開く
let mut filename = args[0].clone();
let mut file = File::open(filename).expect("ファイルを開けません");
let mut contents = String::new();
file.read_to_string(&mut contents).expect("ファイルの読み込みに失敗しました");
// 読み込んだファイルの内容を「スペース」「改行」「タブ」で区切った単語を格納するVecを作成する
let binding = contents.to_lowercase();
let words: Vec<&str> = binding.split(|c| c == ' ' || c == '\n' || c == '\t').collect();
// 出現した単語の出現数をカウントするためのHashMapを作成する
// 単語をカウントしつつ単語と出現数をHashMapに格納する
let mut word_count: HashMap<&str, usize> = HashMap::new();
for word in words {
if word_count.contains_key(word) {
let count = word_count.get_mut(word).unwrap();
*count += 1;
} else {
word_count.insert(word, 1);
}
}
// HashMapの単語の出現数を降順にソートし、最も多い出現数の単語と出現数を表示する
let mut sorted_word_count: Vec<(&&str, &usize)> = word_count.iter().collect();
sorted_word_count.sort_by(|a, b| b.1.cmp(a.1));
let highest_number = sorted_word_count[0].1;
for word_set in sorted_word_count {
if word_set.1 == highest_number {
println!("単語: {}, 出現数: {}", word_set.0, word_set.1);
}
}
}
確認をお願いします!
(ちなみに先程の指摘は自分のプログラムを動かしてみたことで気づきました。なので自分も見落としていました。)
■先生
実装お疲れ様です!コードを確認しましたが、非常に良いと思います。順序立ててコードを書かれており、読みやすく、わかりやすいです。また、出現回数の最も多い単語とその回数を出力するための処理もうまく書かれています。
1点だけコメントがあります。
コード内でコメントにある「スペース」「改行」「タブ」に加えて、句読点やその他の特殊文字(例えばカンマ、ピリオドなど)を除去する処理が追加されると、より正確な結果が得られます。ただし、これは完全に必須ではなく、余裕があれば取り組んでみてください。
それ以外は問題ありませんので、このままでも大丈夫です!次の課題に進んでいただいても構いません。
■私
指摘の対応をしてみました。するとご指摘の通り 「.」「,」が含まれていないことで、sample
と sample.
が適切に処理できてないことに気が付きました。
また「.」でsplitした時に、空の文字列がHashMapに追加されていることに気が付きました。その部分も踏まえ以下のように修正をしています
use std::fs::File;
use std::io::Read;
use std::collections::HashMap;
fn main() {
// コマンドライン引数からファイルネームを取得
let args: Vec<String> = std::env::args().skip(1).collect();
if args.len() < 1 {
println!("引数が足りません");
return;
}
// ファイルを開く
let mut filename = args[0].clone();
let mut file = File::open(filename).expect("ファイルを開けません");
let mut contents = String::new();
file.read_to_string(&mut contents).expect("ファイルの読み込みに失敗しました");
// 読み込んだファイルの内容を「スペース」「改行」「タブ」で区切った単語を格納するVecを作成する
let binding = contents.to_lowercase();
let words: Vec<&str> = binding.split(|c| c == '.' || c == ' ' || c == '\n' || c == '\t' || c == ',').collect();
// 出現した単語の出現数をカウントするためのHashMapを作成する
// 単語をカウントしつつ単語と出現数をHashMapに格納する
let mut word_count: HashMap<&str, usize> = HashMap::new();
for word in words {
if word_count.contains_key(word) {
let count = word_count.get_mut(word).unwrap();
*count += 1;
} else if word == "" {
continue;
} else {
word_count.insert(word, 1);
}
}
// HashMapの単語の出現数を降順にソートし、最も多い出現数の単語と出現数を表示する
let mut sorted_word_count: Vec<(&&str, &usize)> = word_count.iter().collect();
sorted_word_count.sort_by(|a, b| b.1.cmp(a.1));
let highest_number = sorted_word_count[0].1;
for word_set in sorted_word_count {
if word_set.1 == highest_number {
println!("単語: {}, 出現数: {}", word_set.0, word_set.1);
}
}
}
ご確認お願いいたします。
■先生
修正されたコードを確認しました。句読点やその他の特殊文字(カンマやピリオド)の除去、そして空の文字列がHashMapに追加されないようにする処理が追加されており、問題ないと思います。コードも読みやすく、理解しやすいです。
現在の実装でより正確な結果が得られるようになりましたので、このままでも大丈夫です。お疲れ様でした!次の課題に進んでいただいて構いません。